发布于 2015-03-24 21:48:24 | 294 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的精品教程,程序狗速度看过来!

OpenBLAS 高性能多核BLAS库

BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。该程序集最初发布于1979年,并 用于建立更大的数值程序包(如LAPACK)。在高性能计算领域,BLAS被广泛使用。例如,LINPACK的运算成绩则很大程度上取决于BLAS中子程 序DGEMM的表现。为提高性能,各軟硬件厂商则针对其產品对BLAS接口实现进行高度优化。


OpenBLAS 0.2.14 版本主要更新如下:

  • 支持AMD Streamroller

  • 增加ARM Cortex-A9和Cortex-A15目标

  • 增加 openblas_get_num_threads 和 openblas_get_num_procs 函数接口

  • 增加 ATLAS扩展风格的 ?geadd函数接

  • 改进ger和gemv对于小规模矩阵性能

  • 改进OpenBLASConfig.cmake配置

  • 修正c/zsyr在incx为负数时的错误

  • 修正清理CPU affinity设置时的race condition bug

更多内容请看这里:https://github.com/xianyi/OpenBLAS/releases/tag/v0.2.14

OpenBLAS 是一个优化的 BLAS 库,基于 GotoBLAS2 1.13 BSD 版本。

BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。该程序集最初发布于1979年,并 用于建立更大的数值程序包(如LAPACK)。在高性能计算领域,BLAS被广泛使用。例如,LINPACK的运算成绩则很大程度上取决于BLAS中子程 序DGEMM的表现。为提高性能,各軟硬件厂商则针对其產品对BLAS接口实现进行高度优化。

具体内容请参考项目主页Changelog



历史版本 :
OpenBLAS 0.2.19 发布,高性能多核 BLAS 库
OpenBLAS 0.2.18 发布,高性能多核 BLAS 库
OpenBLAS 0.2.14 发布,高性能多核 BLAS 库
OpenBLAS 0.2.13 发布,优化的 BLAS 库
OpenBLAS 0.2.10 版本发布 高性能多核BLAS库
最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务