发布于 2015-05-23 00:18:49 | 138 次阅读 | 评论: 0 | 来源: 网友投递
这里有新鲜出炉的Apache Hive教程,程序狗速度看过来!
Apache Hive 数据仓库工具
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低
Apache Hive 1.0.1/1.1.1 发布,两个版本都修复了一个有关 LDAP 身份验证提供者实施漏洞的问题,并且两个版本都改善了 Hive 的连接服务。
两个版本具体更新信息如下:
Apache Hive 1.0.1 发行页面。
Apache Hive 1.1.1 发行页面。
下载页面如下:
https://hive.apache.org/downloads.html
Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。
Hive是Facebook 2008年8月刚开源的一个数据仓库框架,其系统目标与 Pig 有相似之处,但它有一些Pig目前还不支持的机制,比如:更丰富的类型系统、更类似SQL的查询语言、Table/Partition元数据的持久化等。