发布于 2015-05-20 00:53:51 | 311 次阅读 | 评论: 0 | 来源: 网友投递
Apache Drill
Apache Drill是为大数据集的互动分析而生,是Google的Dremel的开源版本。它的目标是可以高效地对大数据集进行分析,可以运行在1000台以上的服务器,在几秒内处理PB级的数据和万亿条的数据记录,目前Drill还在Apache进行孵化。
Apache Drill 1.0 发布,此版本在可靠可扩展的 SQL-on-Hadoop上提升了安全性能,此外,它还解决了Hadoop上自助服务 SQL 查询的空缺,尤其复杂动态 NoSQL 数据类的查询。它的一大性能优势是能够访问Hadoop数据,和 Qlik 一起使用的话,体验更佳。
此版本现已提供下载:
直接下载文件:http://getdrill.org/drill/download/apache-drill-1.0.0.tar.gz
Find an Apache mirror:
HTTP:http://mirror.nus.edu.sg/apache/drill/drill-1.0.0/apache-drill-1.0.0.tar.gz
Backup Sites:
http://www.eu.apache.org/dist/drill/drill-1.0.0/apache-drill-1.0.0.tar.gz
http://www.us.apache.org/dist/drill/drill-1.0.0/apache-drill-1.0.0.tar.gz
更多信息请查看订阅邮件。
Apache Drill是为大数据集的互动分析而生,是Google的Dremel的开源版本。它的目标是可以高效地对大数据集进行分析,可以运行在1000台以上的服务器,在几秒内处理PB级的数据和万亿条的数据记录,目前Drill还在Apache进行孵化。
为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache 软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel.
该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。
数据结构:
兼容已有的 SQL 环境和 Apache Hive: