发布于 2016-07-30 23:47:46 | 104 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的精品教程,程序狗速度看过来!

Ansj 中文分词

这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化


更新内容:

  1. 需改歧义词典的格式,修复%作为量词存在

  2. 对新词的新词发现提供了词性分析功能,不再词性全部标注为nw

  3. 重新训练新词发现模型,针对机构名做了大量调优,

测试地址:http://www.nlpcn.org/demo.jsp



历史版本 :
ansj 中文分词 5.0.1 发布
最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务