扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
庖丁解牛 最新版本2.0.0 主要变更: 1)调整了package命名 改为net.paoding.analysis开头;调整了一些类的命名,主要是XAnalyzer改为 2)并调整了部分代码的相对位置:代码集中在三个包中: 3)同时,将字典改为英文命名,避免操作系统中文命名带来不必要影响 4)增加了配置文件;使knife可以在配置文件配置增减,同时字典的安装路径可以随意指定。 5)BUGFIX : highlight位置错误 下载地址:http://code.google.com/p/paoding/downloads/list ------------------------------------------------------------------- @设计优美-使用庖丁隐喻,容易理解代码设计 @效率极高-极高效率的字典查找算法;尽量避免无谓试探查找 @算法简练-简单易理解的算法,但效率却是非常高效的 @轻松支持最大/最小切词 @字典灵活- @源代码是开放的,遵守http://www.apache.org/licenses/LICENSE-2.0协议 @作者能力:Java基础知识、设计能力扎实、持续关注改进 ------------------------------------------------------------------- 1、准备 2)将字典文件安装(也就是拷贝)到某个目录下,比如/data/paoding/dic下 3)把配置文件paoding-analysis.properties放到自己的classpath下 4)打开paoding-analysis.properties,把paoding.dic.home属性设置为字 2、建立索引 Paoding应保存为一个系统单例为好,以重复利用,它是线程安全的. 2)使用Lucene标准API对文件建立索引。 3、检索查找 更具体的使用方式参见 ------------------------------------------------------------------ "中文分词" Javaeye 论坛: svn地址: 旧版本地址: |
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者