在大项目中使用 Cscope

原文：

Using Cscope on large projects (example: the Linux kernel)

http://cscope.sourceforge.net/large_projects.html

Translated by Bob

2012-4-28

Email：gexbob@gmail.com

Blog：http://shaocheng.li

如果你要涉及一个大的代码库，Cscope 会是一个非常有用的工具. 它可以通过快速、有目的的搜索为你节省很多时间，而不是像 grep 那样随机的对源文件手动搜索(对于大的代码库，grep 需要一段时间才能启动).

在这个教程中，你将学会如何针对一个大项目来设置 Cscope. 我们用到的例子是 Linux 内核源代码, 基本的步骤和其他大项目是一样的, 包括 C++ 和 JAVA 项目.

1.获取源代码. 首先要获取源代码. 可以从 http://www.kernel.org 下载内核源代码. 本教程中假设你下载的是 Linux 2.4.18 并且安装在 /home/jru/linux-2.4.18.

注意: 确保你有足够的磁盘空间: 内核压缩包只有 30 MB, 解压后会的源代码是 150 MB , 生成的 Cscope 数据库会占用额外的 20-100+ MB (这取决于你想要数据库包含多少内核代码). 有必要的话，可以把源代码和 Cscope 数据库放在两个不同的磁盘分区 .

2.弄清楚你想要把 Cscope 数据库文件放在哪里. 我假设你会在 /home/jru/cscope 存放数据库和关联文件.

3.生成一个带有浏览文件列表的 cscope.files . 对于某些项目, 你可能想要在 Cscope 数据库中包含项目目录中的所有 C 源文件. 这种情况下可以跳过这一步, 只需在项目的顶层目录上执行 ‘cscope -R’ 来构建你的 Cscope 数据库. 但是如果有些代码你不想包含, 或者你的项目包含 C++ 或 JAVA 源代码 (Cscope 默认只能解析 .c, .h, .y, 或 .l 文件), 就要生成一个 cscope.files 文件, 其中包含了想要 Cscope 扫描的所有文件名 (每个文件名占一行).

你有可能用到绝对路径 (至少在编辑器里使用 Cscope 数据库时需要), 这样就可以在你创建的目录之外使用数据库. 我展示的命令会先进入根目录, 这样就可以用 find 打印出绝对路径.

对于很多项目, find 命令可以这样用:

cd /  
find /my/project/dir -name '*.java' >/my/cscope/dir/cscope.files

对于 Linux 内核, 就有点棘手, 因为我们想要排除文档和脚本目录下的代码, 还有除 Intel x86 外的所有芯片和体系结构的汇编代码(我想你的体系结构是 X86). 另外, 本例中我会排除所有的内核驱动代码 (这些代码超过要解析的代码总量的两倍, 会导致 Cscope 数据库膨胀, 并且包含了很多重复的定义, 通常更难搜素. 如果你对驱动代码感兴趣, 可以省略下面相关的行, 或者修改为只输出你感兴趣的驱动文件):

LNX=/home/jru/linux-2.4.18  
cd /       
find  $LNX                                                                \  
-path "$LNX/arch/*" ! -path "$LNX/arch/i386*" -prune -o               \  
-path "$LNX/include/asm-*" ! -path "$LNX/include/asm-i386*" -prune -o \  
-path "$LNX/tmp*" -prune -o                                           \  
-path "$LNX/Documentation*" -prune -o                                 \  
-path "$LNX/scripts*" -prune -o                                       \  
-path "$LNX/drivers*" -prune -o                                       \  
-name "*.[chxsS]" -print >/home/jru/cscope/cscope.files

这里用到了 find 命令, 在大项目中，这样做比手动编辑一个文件列表容易多了, 也可以从其他地方复制一个.

4.生成 Cscope 数据库. 到了生成 Cscope 数据库的时候了:

cd /home/jru/cscope     # the directory with 'cscope.files'  
cscope -b -q -k

-b 选项告诉 Cscope 只要构建数据库，无需启动 Cscope GUI. -q 会导致一个额外的’inverted index’ 文件被创建, 它会使大数据库的搜索更快. 最后, -k 设置 Cscope 为 ‘kernel’ 模式——这样它就不会去 /usr/include 下搜索源文件中包含的头文件 (这是在操作系统或 C 源码库中使用 Cscope 时的主要作用).

在我的 900 MHz Pentium III 系统上 (带一个标准的 IDE 硬盘), 解析这样的 Linux 源码只用了 12 秒, 输出的 3 个文件 (cscope.out, cscope.in.out, 和 cscope.po.out) 总共占用了 25 MB.

5.使用数据库. 如果你喜欢用 vim 或 emacs/xemacs, 我建议你先学习怎样在这些编辑器中使用 Cscope, 这样才能让你在编辑器中轻松的运行搜索. 我们有一份 tutorial for Vim, emacs 用户当然是足够聪明的，可以根据 cscope/contrib/xcscope 目录下的宝贵意见来解决所有问题.

否则, 你可以用独立的基于 curses 的 Cscope GUI 来运行搜索, 然后启动你喜欢的编辑器(无论 $EDITOR 设为什么,或默认是vi) 来打开搜索结果中的行.

如果你用独立的 Cscope 浏览器, 确保这样调用它:

cscope -d

这样 Cscope 就不会重新生成数据库. 否则你就不得不 Cscope 检测修改过的文件, 在大项目中会花很多时间, 即使没有文件被修改过. 如果偶然没有带任何参数就运行了 ‘cscope’, 也会导致重新创建没有快速索引和内核模式的数据库, 那就要重新运行之前的 cscope 命令了.

6.源码改变时重新生成数据库. 如果项目中有了新文件, 就再运行 ‘find’ 命令来更新 cscope.files (如果正在使用它).

像初始生成数据那样，用同样的方法调用 cscope (并且在相同的目录下) (即, cscope -b -q -k).

Tutorial by Jason Duell