AMD ROCm 5.2 发布,带有新的 rocWMMA 库
admin
2023-07-31 22:48:34
0

AMD 已发布 ROCm 5.2 作为其开源 GPU 计算堆栈的最新版本。

此 Linux 开源 GPU 计算堆栈的 ROCm 5.2 新增了许多新的 HIP API、在 HIP-Clang 编译器中支持设备端内存分配 (malloc)、新的 rocWMMA 库的引入、新的测试/基准各种组件的可执行文件,rocSOLVER 的一些新例程,放弃对 rocBLAS 的胖二进制文件的 Navi 12 / GFX1011 支持,以及对设备跟踪的 OpenMP 跟踪 (OMPT) 目标支持。

新的 HIP API 添加在设备管理、内存管理的 HIP 运行时、图形管理和虚拟内存管理领域。

image.php_image.php_

新的 AMD rocWMMA 库是一个 C++ 库,用于利用专用 GPU 矩阵内核加速混合精度矩阵乘法和累加 (MFMA) 运算。AMD 文档继续总结了 rocWMMA:

“rocWMMA 提供了一个 C++ API 来帮助将矩阵乘积问题分解为片段,并将它们用于在 GPU 波前并行分布的块级操作中。该 API 是 GPU 设备代码的头库,这意味着矩阵核心加速可能是直接编译到您的内核设备代码中。这可以受益于内核程序集生成中的编译器优化,并且不会产生链接到外部运行时库或必须启动单独内核的额外开销成本。

rocWMMA 作为头文件库发布,包括测试和示例项目,以验证和说明 C++ API 的示例用法。考虑到库的大量先例,GEMM 矩阵乘法被用作主要验证。然而,使用组合正在显着增长,并展示了 rocWMMA 的不同消费方式。”

ROCm 5.2 发行说明仅提及 CnetOS/RHEL 7 和 8、SUSE Linux Enterprise Server 15 SP3/SP4、Ubuntu 18.04 和 Ubuntu 20.04 作为支持的操作系统。不幸的是,ROCm 5.2 版本尚未正式支持 Ubuntu 22.04 LTS,RHEL 9.0 也不支持。尽管正如我在今天早上不久前写的那样,22.20 打包驱动程序正在准备 RHEL 9.0 和 Ubuntu 22.04 支持,因此希望下一个 ROCm 版本能够对这些新的企业 Linux 发行版提供适当的支持。

ROCm 5.2 正式支持的显卡是 GFX9、RDNA 和 CDNA 硬件。列出的 RDNA 卡只是 Radeon Pro W6800 和 Pro V620 系列。ROCm 已开始为各种 RDNA/RDNA2 消费级 GPU 工作,但您的里程可能会有所不同。

相关内容

热门资讯

Windows 11 和 10... Windows 11/10 文件夹属性中缺少共享选项卡 – 已修复 1.检查共享选项卡是否可用 右键...
事件 ID 7034:如何通过... 点击进入:ChatGPT工具插件导航大全 服务控制管理器 (SCM) 负责管理系统上运行的服务的活动...
Radmin VPN Wind... Radmin VPN 是一款免费且用户友好的软件,旨在牢固地连接计算机以创建一个有凝聚力的虚拟专用网...
Hive OS LOLMine... 目前不清退的交易所推荐: 1、全球第二大交易所OKX欧意 国区邀请链接: https://www.m...
如何修复 Steam 内容文件... Steam 内容文件锁定是当您的 Steam 文件无法自行更新时出现的错误。解决此问题的最有效方法之...
Hive OS 部署 PXE ... 目前不清退的交易所推荐: 1、全球第二大交易所OKX欧意 国区邀请链接: https://www.m...
如何在Instagram上扫描... 如何在Instagram上扫描名称标签/ QR? 总而言之,您可以通过大约四种不同的方法来扫描这些I...
在 Windows 11 中打... 什么是链路状态电源管理? 您可以在系统控制面板的电源选项中看到链接状态电源管理。它是 PCI Exp...
Hive OS 新建飞行表的方... 目前不清退的交易所推荐: 1、全球第二大交易所OKX欧意 国区邀请链接: https://www.m...
farols1.1.501.0... faro ls 1.1.501.0(64bit)可以卸载,是一款无需连接外部PC机或笔记本计算机即可...