发布于 2017-11-08 23:58:54 | 84 次阅读 | 评论: 0 | 来源: 网友投递
spaCy 自然语言文本处理库
spaCy 是一个 Python 和 CPython 的 NLP 自然语言文本处理库。
spaCy 2.0.0 发布了,spaCy 是一个 Python 和 CPython 的 NLP 自然语言文本处理库。
通过使用最新的深度学习技术,发布了 spaCy 的最新版本,使得在可扩展的云计算工作流程中运行spaCy变得更容易。 spaCy 2.0.0 已经修复了60多个bug,包括几个长期存在的问题,为7种语言增加了13个神经网络模型,并为8种新语言添加了 alpha 标记化支持。 还重新编写了几乎所有的使用指南,API文档和代码示例。
主要特性和改进:
NEW: Convolutional neural network models for English, German, Spanish, Portuguese, French, Italian, Dutch and multi-language NER. Substantial improvements in accuracy over the v1.x models.
NEW: Vectors
class for managing word vectors, plus trainable document vectors and contextual similarity via convolutional neural networks.
bug 修复:
Fix issue #125, #228, #299, #377, #460, #606, #930: Add full Pickle support.
Fix issue #152, #264, #322, #343, #437, #514, #636, #785, #927, #985, #992, #1011: Fix and improve serialization and deserialization of Doc
objects.
完整内容请查看发布主页。
下载地址: