发布于 2014-08-28 02:31:02 | 427 次阅读 | 评论: 0 | 来源: 网友投递
jcseg 基于mmseg算法的中文分词器
jcseg是使用Java开发的一个开源的中文分词器,使用流行的mmseg算法实现。是一款独立的分词组建,不是针对lucene而开发,但是提供了最新版本的lucene和solr分词接口。
Jcseg[dʒɛ'ke'sɛ]是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene-4.9.0,solr-4.9.0,elasticsearch-1.3.2的分词接口.
jcseg-1.9.5:
1. 修复部分英中混合词的同义词无法追加的bug.
2. 增加jcseg-elasticsearch模块 - elasticsearch切分插件. (elasticsearch-jcseg)
3. 修复切分词条的些许情况offset错误bug.
4. 更改对solr-4.9的支持.
另外直接在git项目中增加了对编译后的jar文件的托管,懒得编译的就直接到git下载吧。
因为google code不在提供新download的添加,jcseg下载地址如下:
(1). jcseg sourceforge: https://sourceforge.net/projects/jcseg/files/?source=navbar
(2). git@osc attach: http://git.oschina.net/lionsoul/jcseg/attach_files