扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共19页)
以Ruby为代表的脚本语言常被用来进行文本处理。为了能对她有个感性认识,我们先给出第一道例题教您使用“grep”命令,其功能就是从文本中找出符合正则表达式的行。
grep命令用法如下:
grep pattern file...
省略文件名时则从标准输入搜索合适的行。
若用Ruby(简单地)改写的话,就像下面这样:
|
虽然只有4行,但却是很不错的程序。Ruby是解释型语言,所以不需要编译马上就能执行您写的程序。Ruby从一开始就添加了各种各样的便利的功能,如读取参数指定的文件以及使用正则表达式进行检索等,使编程变得“简便快捷”。
假如用C语言重写这段程序的话,即使去掉正则表达式部分也会相当长。若非编程高手则将花费不少的时间。这种“简易性”正是Ruby的长处之一。
下面就来运行一下吧!
|
效果不错(太好了,太好了)。
为了对Ruby有所了解,我们仔细看看这段程序。
像grep那样读取文件并逐行处理然后输出结果的程序基本上由下列部分构成:
while 读入一行
处理读入的行
输入处理结果(若有的话)
end
Ruby从一开始就包含这些功能。例如,“读入一行”可以使用gets函数,输出结果可以使用print函数。
前面的程序也遵循这种形式,让我们仔细研究一下。
1 $pat = ARGV.shift
2 while gets
3 print if /#{$pat}/
4 end
第1行从命令行参数中取出比较模型(pattern),然后赋值给变量$pat。Ruby的命令行参数都保存在数组ARGV中,所以取出数组的第一个元素。ARGV.shift表示去掉数组第一个要素。
第2行的“while gets”几乎是一种固定用法,表示一行一行地读取数组ARGV中命令行参数指定的文件。若ARGV中包含不止一个文件名时,则从最初的文件开始依次读取每一个文件。
第3行表示,若出现符合pattern的行就print。/#{$pat}/表示将读入的行与$pat所代表的正则表达式进行比较。‘#{$pat}’表示把‘#{’到‘}’之间的表达式置入正则表达式(/.../)中。这种置入表达式的方法在字符串或正则表达式中都有效。
第4行的“end”与第2行的“while”呼应,表示由while开始的循环到此为止。
您是不是明白了呢?程序虽短,却有些难懂吧!实际上,Ruby允许您使用各种简写形式以确保程序更容易书写。因此,程序虽然变短了却也变得更加难懂了,不过这也是没有办法的事。下面,我们就把省略的部分补上,再把程序重写一遍。
1 $pat = ARGV.shift
2 while $_ = gets()
3 if $_ =~ /#{$pat}/ then print $_ end
4 end
好像并没有好懂多少嘛!但是刚才被省略掉的变量“$_”浮出水面后,程序的运行原理好像变得容易理解了。那么,我们再次详细地说明一下。
第1行还是一样。
第2行的gets很明显是函数。gets读取一行后赋值给变量$_。若到达文件尾部时返回false,则while循环结束。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者