发布于 2017-11-10 23:50:21 | 162 次阅读 | 评论: 0 | 来源: 网友投递
Apache UIMA 非结构化信息管理应用
UIMA (Unstructured Information Management applications) 是一个软件系统,用来分析大量的非结构化信息从而发掘中对最终用户有用的知识点,一个最典型的 UIM 应用就是从文本文件中提取有用信息,例如人员、地址和组织等相关信息。
Apache UIMA 团队已发布 Apache UIMA Java SDK 3.0.0-beta 版。 这是一个全新的测试版本,旨在提供更稳定的面向用户的 API ,希望用户能够测试此版本并提供反馈。
Apache UIMA 是一个用于分析文本、视频和音频数据等非结构化内容的组件体系架构和框架。
该版本是对 UIMA 进行了重大改写,带来了许多新特性,包括:
support for arbitrary Java objects in the CAS
New semi-built-in UIMA types: FSArrayList, FSHashSet, IntegerArrayList
New "select" framework integrated with Java 8 Streams
Elimination of concurrent modification exception while iterating over UIMA indexes
Automatic Garbage Collection of unreferenced Feature Structures
All around better integration into Java 8 idioms and generic typing
详情可查阅发行说明
下载地址:
http://uima.apache.org/downloads.cgi