
开云体育(中国)官方网站 针对矩阵乘法及有关变种-开云平台皇马赞助商(中国)官方入口
新闻动态
IT之家 11 月 12 日音问,摩尔线程告示开源高性能线性代数模板库 MUTLASS,以便建设者大约更高效针对摩尔线程全功能 GPU 的 MUSA Core 及 Tensor Core 等单位进行编程,加快基于国产 GPU 的算子建设以及算法编削。 动作摩尔线程专为 MUSA 架构优化的高性能接洽库,MUTLASS(MUSA Templates for Linear Algebra Subroutines)是基于开源模板库 CUTLASS 进行的 MUSA 适配和定制化建设、优化。 针对矩阵
详情
IT之家 11 月 12 日音问,摩尔线程告示开源高性能线性代数模板库 MUTLASS,以便建设者大约更高效针对摩尔线程全功能 GPU 的 MUSA Core 及 Tensor Core 等单位进行编程,加快基于国产 GPU 的算子建设以及算法编削。
动作摩尔线程专为 MUSA 架构优化的高性能接洽库,MUTLASS(MUSA Templates for Linear Algebra Subroutines)是基于开源模板库 CUTLASS 进行的 MUSA 适配和定制化建设、优化。
针对矩阵乘法及有关变种,MUTLASS 提供了一系列高性能的 C++ 模板组件,并接收了与 muDNN 库访佛的分层判辨及数据搬运战术,以确保性能的充分进展。
在本次开源的版块中,摩尔线程适配了 CuTe 后端库,为其增多了第三代 MUSA 架构的 MMA 接洽原语,营救 TF32 / FP16 / BF16 / INT8 等多种数据精度,并以此为基础,初步达成了矩阵乘法、默许实例库、性能测试器及有关器具包的营救。
IT之家附 MUTLASS 开源地址:https://github.com/MooreThreads/mutlass开云体育(中国)官方网站