发布于 2017-07-12 23:52:06 | 145 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的精品教程,程序狗速度看过来!

Apache Tika 内容抽取工具集合

Apache Tika 利用现有的解析类库,从不同格式的文档中(例如HTML, PDF, Doc),侦测和提取出元数据和结构化内容。


Apache Tika 1.16 发布了,

部分更新内容如下:

  • Exclude jj2000 from edu.ucar grip to avoid potential 

    license conflicts with ASL 2.0

  • Add Age recognition using Ensemble model for Linear regression 

    and Apache OpenNLP Maximum Entropy. Tika can now detect age from 

    text (TIKA-1988).

  • Add Tika Deep Learning support for the VGG16 model for 

    Very Deep Convolutional Networks for Large-Scale Image Recognition.

  • Now Tika supports both Inception v3/v4 and VGG16 based image 

    recognition (TIKA-2298).

  • Extract macros from PPT (TIKA-2089).

完整内容

下载地址:



历史版本 :
Apache Tika 1.17 发布 ,内容抽取工具集合
Apache Tika 1.16 发布 ,内容抽取工具集合
Apache Tika 1.15 发布 ,内容抽取工具集合
Apache Tika 1.14 发布 ,内容抽取工具集合
Apache Tika 1.13 发布 ,内容抽取工具集合
Apache Tika 1.12 发布,内容抽取工具
Apache Tika 1.11 发布,内容抽取工具集合
Apache Tika 1.9 发布,内容抽取工具集合
Apache Tika 1.8 发布,内容抽取工具集合
Apache Tika 1.7 发布,文本内容抽取集
Apache Tika 1.6 发布,内容抽取工具集合
最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务