Apache Drill

Apache Drill是为大数据集的互动分析而生,是Google的Dremel的开源版本。它的目标是可以高效地对大数据集进行分析,可以运行在1000台以上的服务器,在几秒内处理PB级的数据和万亿条的数据记录,目前Drill还在Apache进行孵化。

为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache软件基金会近日发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel.

据Hadoop厂商MapR TechnologIEs公司产品经理Tomer Shiran介绍,“Drill”已经作为Apache孵化器项目来运作,将面向全球软件工程师持续推广。

该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。

“Drill”项目其实也是从谷歌的Dremel项目中获得灵感:该项目帮助谷歌实现海量数据集的分析处理,包括分析抓取Web文档、跟踪安装在Android Market上的应用程序数据、分析垃圾邮件、分析谷歌分布式构建系统上的测试结果等等。

通过开发“Drill”Apache开源项目,组织机构将有望建立Drill所属的API接口和灵活强大的体系架构,从而帮助支持广泛的数据源、数据格式和查询语言。

Apache Drill 成为 Apache 基金会顶级项目
Apache 基金会今天宣布 Apache Drill 成为基金会的顶级项目。项目新的首页是:http://drill.apache.org/为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Go

发布于 2014-12-03 00:51:01 | 241 次阅读

Apache Drill 1.9.0 发布,大型数据集分析系统
Apache Drill 1.9.0 发布了。主要更新如下:新特性:Asynchronous Parquet readerParquet filter pushdownDynamic UDF supportHTTPD format plugin改进:[DRILL-1950] - Implement filter pushdown for Parquet[DRILL-3178] - csv reader should allow newlines inside quotes[DRILL-4309] - Make this option store.hive.o

发布于 2016-12-01 00:21:26 | 156 次阅读

Apache Drill 1.0 发布,大型数据集分析系统
Apache Drill 1.0 发布,此版本在可靠可扩展的 SQL-on-Hadoop上提升了安全性能,此外,它还解决了Hadoop上自助服务 SQL 查询的空缺,尤其复杂动态 NoSQL 数据类的查询。它的一大性能优势是能够访问Hadoop数据,和 Qlik 一起使用的话,体

发布于 2015-05-20 00:53:51 | 311 次阅读

Apache Drill 0.4.0 发布,大型数据集分析系统
Apache Drill是为大数据集的互动分析而生,是Google的Dremel的开源版本。它的目标是可以高效地对大数据集进行分析,可以运行在1000台以上的服务器,在几秒内处理PB级的数据和万亿条的数据记录,目前Drill还在Apache进行孵化。近

发布于 2014-08-14 03:50:05 | 255 次阅读


Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务