发布于 2014-08-31 23:00:07 | 260 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的精品教程,程序狗速度看过来!

jieba 结巴分词

结巴分词是一个Python下的中文分词组件


2014-08-31: version 0.33
1. 支持自定义stop words; by @fukuball
2. 支持自定义idf词典; by @fukuball

3. 修复自定义词典的词性不能正常显示的bug; by @ShuraChow
4. 支持python3.x 版本的自动安装:pip3 install jieba3k

 



历史版本 :
jiebaR 0.3 发布,R语言中文分词
jiebaR 0.1 发布,R语言中文分词
结巴分词 0.34 发布,Python 中文分词组件
结巴分词 0.33 发布,Python 中文分词组件
最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务