发布于 2016-03-12 23:52:04 | 103 次阅读 | 评论: 0 | 来源: 网友投递
Apache Mahout 机器学习库
Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。
Apache Mahout 0.11.2 发布,该版本支持 Spark 1.5.2 ,在稀疏向量和矩阵计算上提升了大约 30% 左右的性能。修复的 bug 包括:
MAHOUT-1640: Better collections would significantly improve vector-operation speed
MAHOUT-1800: Pare down Classtag overuse
MAHOUT-1801: FastUtil to improve speed of Sparse Matrix Operations
MAHOUT-1802: Capture attached checkpoints (if cached)