科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道基础软件《边看边读》09年书评:《自己动手写搜索引擎》

《边看边读》09年书评:《自己动手写搜索引擎》

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

《边看边读》09年书评:《自己动手写搜索引擎》是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。

作者:Zdnet软件频道 来源:Zdnet软件频道 2009年12月23日

关键字: 《边看边读》09书评 《自己动手写搜索引擎》

  • 评论
  • 分享微博
  • 分享邮件

《边看边读》09年书评:《自己动手写搜索引擎》

《自己动手写搜索引擎》

 

 

 

简介:

本书是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。本书全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。.

爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。

自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。..

其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。

在实现搜索方面,本书用简单的例子介绍了完整的搜索实现过程,覆盖了从索引库的设计和索引库与数据库的同步到搜索用户界面设计与实现。搜索用户界面包括实现布尔逻辑查询、按区间范围查询、搜索结果按日期排序等。本书还进一步介绍了搜索排序的优化方法。

最后以基于Lucene的搜索服务器Solr为例,展示了Lucene的最新应用方法。...

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章