发布于 2015-07-18 00:25:37 | 130 次阅读 | 评论: 0 | 来源: 网友投递
Apache Lens 统一数据分析接口
Lens 提供了一个统一数据分析接口。通过提供一个跨多个数据存储的单一视图来实现数据分析任务切分,同时优化了执行的环境。无缝的集成 Hadoop 实现类似传统数据仓库的功能。
Apache Lens 2.2.0-beta-incubating 发布,此版本包括 OLAP 特性,比如支持多个表达式和联合查询。还有大量的 CLI 改进,Zeppelin 集成,大量 bug 修复和简单改进。
下载:http://lens.incubator.apache.org/releases/download.html
Maven jar:https://repository.apache.org/content/repositories/releases/org/apache/lens/
发行说明:
https://issues.apache.org/jira/secure/ReleaseNote.jspa?version=12329586&projectId=12315923
Lens 提供了一个统一数据分析接口。通过提供一个跨多个数据存储的单一视图来实现数据分析任务切分,同时优化了执行的环境。无缝的集成 Hadoop 实现类似传统数据仓库的功能。
该项目主要特性:
简单元数据层为数据存储提供抽象视图层
单一的共享模式服务器,基于 Hive 元存储。模式通过数据管道 HCatalog 和分析应用进行共享:
OLAP Cube QL 类似 SQL 的高级语言用来查询和描述存放在不同数据立方体 (Cubes) 中的数据集
JDBC 驱动和 Java 客户端库来处理查询
Lens 应用服务器 - 这是一个 REST 服务器允许用户查询数据,更改数据模型,调度查询和查询的配额限制
基于驱动的架构 允许在报表系统中进行嵌入,例如 Hive、列数据存储、Redshift 等
基于成本算法的引擎选择 - 该算法可优化资源的使用,通过对查询的复杂度自动选择最佳执行引擎
Apache Lens 的架构如下: