发布于 2015-06-10 03:18:37 | 208 次阅读 | 评论: 0 | 来源: 网友投递
Apache UIMA 非结构化信息管理应用
UIMA (Unstructured Information Management applications) 是一个软件系统,用来分析大量的非结构化信息从而发掘中对最终用户有用的知识点,一个最典型的 UIM 应用就是从文本文件中提取有用信息,例如人员、地址和组织等相关信息。
Apache UIMA Ruta 2.3.0 发布,此版本需要脚本项目的更新,及其在 UIMA Ruta Workbench 的描述器,可以删除所有的描述器再更新脚本项目。相关更新内容如下:
UIMA Ruta Language and Analysis Engine:
- - Requires Java 7
- - Maven Plugin for UIMA Ruta
- - Extensions and simplifications of the language (external resources,null values, more syntactic sugar)
- - Improvements to Analysis Engines (RutaEngine, HtmlConverter)
- - More exemplary script projects
- - Many, many bug fixes
UIMA Ruta Workbench:
- - Requires Java 7
- - Works now also in other project structures (Maven projects)
- - Bug fixes
更多内容请查看更新日志。
软件主页请查看这里。
UIMA (Unstructured Information Management applications) 是一个软件系统,用来分析大量的非结构化信息从而发掘中对最终用户有用的知识点,一个最典型的 UIM 应用就是从文本文件中提取有用信息,例如人员、地址和组织等相关信息。
下面是 UIMA 的结构图: