我们在招聘会上经常看到这样的要求:“熟练使用XX语言,有X万行源码经验”。确实,编码行数在一定程度上反映了编程水平。那么,我们如何从数以百计、千计的源程序中快速得知究竟有多少行呢?利用Visual C # 2005和c#语言特性,我们可以轻松实现对多种类型的源代码的行数的统计工作。
一、需求分析
程序需要用户输入要过滤的源程序的拓展名,选择要统计的目录。获得信息后,程序需要遍历指定目录(及其子目录)和目录下的文件,这一过程可以用System.IO.DirectoryInfo类来实现。对于符合过滤标准的文件,我们用StreamReader类来打开它们,每次读取一行并计数,直到EOF为止,于是便得到了文件的行数。
二、数据结构与算法
对于每个过滤到的文件,我们用一个结构来储存其信息。
struct codeInfo
{
public long line; //储存这个源程序的行数
public string ext; //这个文件的拓展名
public string filename; //文件名
public string fullname; //全路径加文件名
//篇幅所限,省略了仿“构造函数”。该函数对结构体进行初始化。详见源代码。
};
对于用户会输入多少种拓展名,以及会有多少符合标准的文件,都是未知的。特别是对于每个文件都要动态构造一个codeInfo结构体,考虑到这些,我们用ArrayList来动态管理这些结构体。
在算法上面,采用递归来实现无穷级目录遍历这一功能。
三、窗体设计
启动VisualStdio2005,新建一个基于c#的“Windows应用程序项目”。在自动创建的form1上添加如下控件:
控件类型及数量 作用
button两个 点击button1选择文件夹,点击button2开始统计
textBox一个 供输入拓展名
label1五个 用于静态提示的表示
listBox一个 显示最终的分类统计结果
另外,如果想详细的显示每个统计的源文件的详细情况,可以再添加dataGridView控件,利用它对每个文件的名称、行数、路径,进行详细显示。篇幅所限,本文略去所有控件的属性设置,详见源程序。设计好的窗体如图1。
四、部分程序的实现
1、递归实现遍历目录及获取文件长度
//参数说明:ext是包含多个拓展名的字符串数组,dir为查找目录,list为集合的类的引用,用于动态存储codeInfo结构
void count(string[] ext, string dir, ref ArrayList list)
{
DirectoryInfo di = new DirectoryInfo(dir); //新建对象,用目录作为构造参数
DirectoryInfo[] d = di.GetDirectories(); //托管数组d存了方法返回的所有子目录信息
foreach (DirectoryInfo dCur in d) //对子目录进行遍历
{
foreach (string extCur in ext) //按照每个拓展名分别查找
{
FileInfo[] fi = dCur.GetFiles(extCur); //获得当前目录下满足拓展名的文件(用拓展名做构造参数)
foreach (FileInfo fCur in fi) //遍历每个文件
{
//实现统计文件的行数
long n=0;
StreamReader sr = new StreamReader(fCur.FullName);
while (!sr.EndOfStream)
{
n++;
sr.ReadLine();
}
codeInfo a = new codeInfo(n, extCur, fCur.Name, fCur.FullName); //存储这个文件的信息
list.Add(a); //将该文件信息加入到集合列表中
}
}
count(ext,dCur.FullName,ref list); //递归遍历子目录的子目录
}
}
2、button2的部分代码
注:codeList为Arraylist集合
private void button2_Click(object sender, EventArgs e)
{
string[] ext = getExt(textBox1.Text);
listBox1.Items.Clear();
codeList.Clear();
//省略判断拓展名是否合法及目录是否为空,详见源码
count(ext, label3.Text, ref codeList); //调用统计函数
if (codeList.Count == 0)
listBox1.Items.Add(" 没有找到指定扩展名的源文件!");
else
{
listBox1.Items.Add(" 共找到" + ext.Length + "种源文件");
listBox1.Items.Add(" ");
codeInfo typecur = (codeInfo)codeList[0];
long numcur = 0, linecur = 0, lineall = 0;
//下面按照文件名分类统计不同扩展名源程序的总行数
foreach (string extcur in ext)
{
numcur = 0;
linecur = 0;
for (int i = 0; i < codeList.Count; i++)
{
codeInfo cur = (codeInfo)codeList[i];
if (extcur == cur.ext)
{
numcur++; linecur += cur.line;
}
}
lineall += linecur;
listBox1.Items.Add(string.Format(" {0,-8}" + numcur + " 个文件 " + linecur + "行", extcur)); //统计完一种拓展名后向Listbox添加一行信息
}
listBox1.Items.Add(" 总计" + codeList.Count + "个文件 " + lineall + "行");
}
}
在实现过程中,还牵扯到:对输入的拓展名进行分割、填充dataGridView的行/列以显示所有统计文件的详细信息等问题。篇幅限制,不做介绍,详见代码。
五、提高篇
我们可以新建一个Form专门停放dataGridView(更好的显示效果)。这样就牵扯到了窗体间如何传递codeList集合的问题。提示大家可以用this仿“指针”进行传递。
本程序只有一个待统计目录,有兴趣的朋友可以考虑:如何设置多个待统计目录(多一层foreach)。
另外,采用StreamReader获取文件行数的方法再极端大的源码样本运行时会略显慢,大家可以考虑采取其它优化的办法,比如:利用统计学原理找到一个常数(平均每行字符数),然后用文件长度处以这个数以得到行数,当然,这样会降低统计精度。
至此,我们已经体验了Visual C# 2005的强大功能并成功实现了这一软件。本程序在Visual C# 2005 WindowsXP SP2下调试通过。
查看本文来源