北京时间9月17日凌晨消息,据国外媒体报道,谷歌公司已经收购了卡内基梅隆大学开发的一项工具,这个名为ReCAPTCHA的工具既可以用于减少网站的垃圾邮件和欺诈活动,也可以用于传统书籍的数字化。
借助ReCAPTCHA工作,网站可以要求用户在登录网站或完成线上采购时必须解出字谜。目前电脑不可能破解这些由缠绕的字母和数字所组成的字谜,这样就可以确保是真正的人而不是自动化程序在键盘旁边进行操作。
与其他字谜不同的是,ReCAPTCHA字谜的文字来自真正的书籍,这使得ReCAPTCHA系统有助于将难解字迹生成数字版本。双方达成交易的消息是在美东时间周三下午公布的,但交易的具体细节没有透露。
谷歌已经在进行一项将传统书籍数字化然后将数字版上线的大型项目,目前谷歌主要采取扫描书籍然后利用光学字符识别(OCR)技术的方法使书籍内容能够被搜索。但是,如果书籍文字的年代较为久远、字迹褪色或出现扭曲,OCR技术可能无法奏效。在这样的情况下,经常被采用的书籍数字化方法就是手工输入。