发布于 2016-08-31 00:25:25 | 224 次阅读 | 评论: 0 | 来源: 网友投递
Apache UIMA 非结构化信息管理应用
UIMA (Unstructured Information Management applications) 是一个软件系统,用来分析大量的非结构化信息从而发掘中对最终用户有用的知识点,一个最典型的 UIM 应用就是从文本文件中提取有用信息,例如人员、地址和组织等相关信息。
Apache UIMA Java SDK 2.9.0 发布,该版本包含主要功能增强和 bug 修复,详情请看 README 和 RELEASE_NOTES 文件。
增强功能包括:
CasIOUtls - a collection of general-purpose CAS load/save utilities, with support for including the type system and index definition information along with the Feature Structures.
CasIOUtls - a collection of general-purpose CAS load/save utilities, with support for including the type system and index definition information along with the Feature Structures.
下面是 UIMA 的结构图: