发布于 2017-01-31 23:25:59 | 167 次阅读 | 评论: 0 | 来源: 网友投递
Apache UIMA 非结构化信息管理应用
UIMA (Unstructured Information Management applications) 是一个软件系统,用来分析大量的非结构化信息从而发掘中对最终用户有用的知识点,一个最典型的 UIM 应用就是从文本文件中提取有用信息,例如人员、地址和组织等相关信息。
Apache UIMA Java SDK 3.0.0-alpha 发布了。
更新内容:
support for arbitrary Java objects in the CAS
New semi-built-in UIMA types: FSArrayList, FSHashSet, IntegerArrayList
New "select" framework integrated with Java 8 Streams
Elimination of concurrent modification exception
while iterating over UIMA indexes
Automatic Garbage Collection of unreferenced Feature Structures
下面是 UIMA 的结构图: