发布于 2014-08-31 23:00:07 | 260 次阅读 | 评论: 0 | 来源: 网友投递
jieba 结巴分词
结巴分词是一个Python下的中文分词组件
2014-08-31: version 0.33
1. 支持自定义stop words; by @fukuball
2. 支持自定义idf词典; by @fukuball
3. 修复自定义词典的词性不能正常显示的bug; by @ShuraChow
4. 支持python3.x 版本的自动安装:pip3 install jieba3k