发布于 2015-06-14 08:59:33 | 219 次阅读 | 评论: 0 | 来源: 网友投递
Apache Kylin OLAP 分析引擎
Kylin 是一个开源的分布式的 OLAP 分析引擎,来自 eBay 公司开发,基于 Hadoop 提供 SQL 接口和 OLAP 接口,支持 TB 到 PB 级别的数据量。
2015年6月9日,Apache Kylin(麒麟)在美国举行的 Hadoop Summit 2015 峰会上由来自 eBay Cloud Services (Platform, Infrastructure, Data) 副总裁 Debashis Saha 和 Kylin 产品负责人 Luke Han 做了专题演讲,详细介绍了 Apache Kylin 的由来,特性,架构,技术及路线图等。Apache Kylin 社区亦与同日发布了 v0.7.1 版本,该版本是麒麟加入Apache 孵化器项目后的第一个 Apache 发行版,在发布这个第一个版本的过程中,Apache Kylin 社区从无到有,逐步按照Apache的要求将相关的内容进行修改,并逐步改进了包块单元测试,文档,安装,部署等各个方面。经过了5轮的发布和投票,最终在IPMC的投票中获得了一致的赞成票而得以顺利发布。
加入孵化器项目后,Apache Kylin整个社区和开发人员逐步融入了整个Apache生态圈,也与其他Apache项目社区建立了良好的关系和互动,也有越来越多的公司和个人贡献到Apache Kylin中,社区的讨论非常激烈,也有越来越多来自eBay之外的公司采用并部署Apache Kylin作为他们分析平台的一部分,包块国内外大型互联网公司,金融企业,传统软件公司等。开源软件为业界带来的改变在Apache Kylin社区和项目中正逐步迭现。
值此第一次发布之际,Apache Kylin PMC项目委员会在此感谢所有的Committer,Contributor,Mentor及其他所有为Apache Kylin做出贡献和帮助的人,感谢Apache基金会及IPMC不厌其烦的帮助和教导Apache Kylin社区成长,特别感谢我们的导师:Ted Dunning, Henry Saputra 和 Owen O'Malley.
同时,非常感谢eBay公司将该项目开源并贡献给社区,特别感谢eBay中国卓越中心(CCOE),为核心开发团队提供了大力的支持和帮助。
Apache Kylin v0.7.1-incubating:
主要改进:
1. 更新代码组织,包及类命名,添加Apache License文件头等以遵守Apache相关规范
2. 移除Apache License不兼容的相关依赖包及二进制文件
3. 简化了部署过程,并提供了二进制包,使得下载和部署不再需要依赖git,maven等,方便使用者部署到相关环境中
4. 重构了元数据,将Data Model与Cube区分开以满足后续的Streaming等功能需求
5. 重构了Job Engine模块,将Job管理抽象化,并修复和调优了相关Job管理中的bug
6. 重构了Web GUI,简化了相关操作
7. 提供了JDBC驱动
主要功能增强:
1. [KYLIN-168] 支持多个ZooKeeper
2. [KYLIN-217] 改进并增强了HBase Coprocessor的使用
3. [KYLIN-563] 提供了启动和停止脚本
4. [KYLIN-569] 支持增量更新和合并
5. [KYLIN-634] 提供导入示例数据和Cube的脚本
6. [KYLIN-796] 在REST API中增加清除和回收任务
主要的bug修复:
1. [KYLIN-436] 无法从“default”以外的Hive数据库同步表,新的版本允许Kylin Cube使用来自不同数据库的表
2. [KYLIN-412] Hive表没有读取权限时的异常处理
3. [KYLIN-508] 调整了字典中的相关阈值以支持高基(Cardinality)维度
4. [KYLIN-640] 浮点数求和(Sum)异常
5. [KYLIN-761] Cube刷新成功后Web查询页面没有更新Cache
下载地址
请从Apache Kylin的官方网站获取相关源文件,二进制包,驱动等的详细下载地址:
http://kylin.incubator.apache.org/cn/download/
更多
更多信息,请关注微信公众号/微博/Twitter: @ApacheKylin, 或者访问Apache Kylin的官方网站:http://kylin.incubator.apache.org/cn/