扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
庖丁解牛 最新版本2.0.0 主要变更: 1)调整了package命名 改为net.paoding.analysis开头;调整了一些类的命名,主要是XAnalyzer改为 2)并调整了部分代码的相对位置:代码集中在三个包中: 3)同时,将字典改为英文命名,避免操作系统中文命名带来不必要影响 4)增加了配置文件;使knife可以在配置文件配置增减,同时字典的安装路径可以随意指定。 5)BUGFIX : highlight位置错误 下载地址:http://code.google.com/p/paoding/downloads/list ------------------------------------------------------------------- @设计优美-使用庖丁隐喻,容易理解代码设计 @效率极高-极高效率的字典查找算法;尽量避免无谓试探查找 @算法简练-简单易理解的算法,但效率却是非常高效的 @轻松支持最大/最小切词 @字典灵活- @源代码是开放的,遵守http://www.apache.org/licenses/LICENSE-2.0协议 @作者能力:Java基础知识、设计能力扎实、持续关注改进 ------------------------------------------------------------------- 1、准备 2)将字典文件安装(也就是拷贝)到某个目录下,比如/data/paoding/dic下 3)把配置文件paoding-analysis.properties放到自己的classpath下 4)打开paoding-analysis.properties,把paoding.dic.home属性设置为字 2、建立索引 Paoding应保存为一个系统单例为好,以重复利用,它是线程安全的. 2)使用Lucene标准API对文件建立索引。 3、检索查找 更具体的使用方式参见 ------------------------------------------------------------------ "中文分词" Javaeye 论坛: svn地址: 旧版本地址: |
婵犵鈧啿鈧綊鎮樻径鎰畺闁靛ň鏅滄慨婊堟偨椤栨稓鎽冮柟鐑╂櫊瀹曟岸宕堕埡鍌滄殸闂佽鍨伴崢鏍姳閿涘嫭鍠嗘い銈呭姬婵☆偅婢樺Λ妤呮偂濞嗘挸瀚夐柍褜鍓熷顒侊紣娓氣偓閻涙捇鏌涘┑鍛樂缂佹鐭傞獮搴ㄥ焵椤掑嫬瀚夋い鏍ㄧ懁缁诲棝鏌熼褍鐏茬紒杈ㄧ箞閺屽洭鏁愰崟顓犳澖闁荤姳闄嶉崹钘壩i崟顖涘殜闁硅泛顫曢埀顒€锕︾槐鏃堝箣閻愬弬妤呮煛閸偄鐏﹂柛瀣墬缁傛帞鎹勯搹瑙勵啈闂佸搫瀚烽崹閬嶅磻瀹ュ鍎嶉柛鏇ㄥ墯娴犳ê霉閿濆棗鈻曢柍褜鍓氶弻銊ф閻愬鈻曢悗锝傛櫇椤忛亶鏌曢崱顓熷