发布于 2018-01-07 00:19:40 | 60 次阅读 | 评论: 0 | 来源: 网友投递
Apache Samza 流处理框架
Samza 是由 LinkedIn 开源的一项技术,它是一个分布式流处理框架,专用于实时数据的处理,非常像Twitter的流处理系统Storm。不同的是Samza基于Hadoop,而且使用了LinkedIn自家的Kafka分布式消息系统。
Apache Samza 是一个分布式流处理框架,专用于实时数据的处理,目前已经在几个大公司(包括 LinkedIn、Netflix、Uber、Slack、Redfin、TripAdvisor)实际生产中使用。
0.14.0 版本包含以下备受期待的新特性:
Samza SQL
Azure EventHubs producer, consumer and checkpoint provider
AWS Kinesis consumer
此外还包括诸如高级 API 的持久性,基于 Zookeeper 的部署稳定性和多阶段批处理等改进,以及诸如 KafkaSystemProducer 并发发送和刷新等 bug 修复。更多详细信息,请查看发行说明。
下载地址: