发布于 2015-06-29 06:57:27 | 204 次阅读 | 评论: 0 | 来源: 网友投递
这里有新鲜出炉的Apache Hive教程,程序狗速度看过来!
Apache Hive 数据仓库工具
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低
Apache Hive 1.2.1 发布,此版本主要改进内容如下:
[HIVE-8769] - Physical optimizer : Incorrect CE results in a shuffle join instead of a Map join (PK/FK pattern not detected)
[HIVE-10812] - Scaling PK/FK's selectivity for stats annotation
[HIVE-10900] - Fix the indeterministic stats for some hive queries
[HIVE-10636] - CASE comparison operator rotation optimization
[HIVE-10716] - Fold case/when udf for expression involving nulls in filter operator.
详细改进说明和下载请看:https://hive.apache.org/downloads.html
更多内容请看:
https://issues.apache.org/jira/secure/ReleaseNote.jspa?version=12332384&styleName=Text&projectId=12310843
Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。
Hive是Facebook 2008年8月刚开源的一个数据仓库框架,其系统目标与 Pig 有相似之处,但它有一些Pig目前还不支持的机制,比如:更丰富的类型系统、更类似SQL的查询语言、Table/Partition元数据的持久化等。