Hadoopy 是一个用 Cython 编写的 Hadoop 扩展。它简单,快速,并且易于被修改。它已经在超过700个节点的集群中测试过了。
- 提供简单的 Hadoop API 接口
- 一般兼容性让用户可以来回切换
- 可用于无 Python 和管理访问的 Hadoop 集群
- 更快的转换和处理
- 轻量级而且文档完善
- 透明
- Handle programs with complicated .so’s, ctypes, and extensions
- CODE written for hack-abilIty
- 简单的 HDFS 访问,如读写和 ls
- 支持更庞大的 Hadoop 生态系统