发布于 2015-03-24 21:48:24 | 294 次阅读 | 评论: 0 | 来源: 网友投递
OpenBLAS 高性能多核BLAS库
BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。该程序集最初发布于1979年,并 用于建立更大的数值程序包(如LAPACK)。在高性能计算领域,BLAS被广泛使用。例如,LINPACK的运算成绩则很大程度上取决于BLAS中子程 序DGEMM的表现。为提高性能,各軟硬件厂商则针对其產品对BLAS接口实现进行高度优化。
OpenBLAS 0.2.14 版本主要更新如下:
支持AMD Streamroller
增加ARM Cortex-A9和Cortex-A15目标
增加 openblas_get_num_threads 和 openblas_get_num_procs 函数接口
增加 ATLAS扩展风格的 ?geadd函数接
改进ger和gemv对于小规模矩阵性能
改进OpenBLASConfig.cmake配置
修正c/zsyr在incx为负数时的错误
修正清理CPU affinity设置时的race condition bug
更多内容请看这里:https://github.com/xianyi/OpenBLAS/releases/tag/v0.2.14。
OpenBLAS 是一个优化的 BLAS 库,基于 GotoBLAS2 1.13 BSD 版本。
BLAS(Basic Linear Algebra Subprograms 基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。该程序集最初发布于1979年,并 用于建立更大的数值程序包(如LAPACK)。在高性能计算领域,BLAS被广泛使用。例如,LINPACK的运算成绩则很大程度上取决于BLAS中子程 序DGEMM的表现。为提高性能,各軟硬件厂商则针对其產品对BLAS接口实现进行高度优化。