发布于 2015-06-29 06:57:27 | 204 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的Apache Hive教程,程序狗速度看过来!

Apache Hive 数据仓库工具

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低


Apache Hive 1.2.1 发布,此版本主要改进内容如下:

改进

  • [HIVE-8769] - Physical optimizer : Incorrect CE results in a shuffle join instead of a Map join (PK/FK pattern not detected)

  • [HIVE-10812] - Scaling PK/FK's selectivity for stats annotation

  • [HIVE-10900] - Fix the indeterministic stats for some hive queries

新特性

  • [HIVE-10636] - CASE comparison operator rotation optimization

  • [HIVE-10716] - Fold case/when udf for expression involving nulls in filter operator.

详细改进说明和下载请看:https://hive.apache.org/downloads.html 

更多内容请看:
https://issues.apache.org/jira/secure/ReleaseNote.jspa?version=12332384&styleName=Text&projectId=12310843 

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

Hive是Facebook 2008年8月刚开源的一个数据仓库框架,其系统目标与 Pig 有相似之处,但它有一些Pig目前还不支持的机制,比如:更丰富的类型系统、更类似SQL的查询语言、Table/Partition元数据的持久化等。



历史版本 :
Apache Hive 2.3.1 发布,数据仓库平台
Apache Hive 2.3.0 发布,数据仓库平台
Apache Hive 2.1.1 发布,数据仓库平台
Apache Hive 2.1.0 发布,数据仓库平台
Apache Hive 2.0.1 发布,数据仓库平台
Apache Hive 2.0.0 发布,数据仓库平台
Apache Archives2.4.16 发布
Apache Hive 1.2.1 发布,数据库仓库平台
Apache Hive 1.0.1/1.1.1 发布,数据仓库平台
Apache Hive 1.2.0 发布,数据仓库平台
最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务