微软展示了如何将 Azure 与 NVIDIA 芯片结合起来制造 AI 超级计算机
admin
2023-07-31 20:23:53
0

1678742454_microsoft-ai-supercomputer_story1678742454_microsoft-ai-supercomputer_story

微软正在推动其使用其 Azure 云计算程序创建超级计算机的努力,以帮助 OpenAI 开发其ChatGPT 聊天机器人。同时,它还发布了一款新的 AI 虚拟机,该虚拟机使用了 NVIDIA 的升级版 GPU。

Microsoft 的新ND H100 v5 VM使用 NVIDIA 的 H100 GPU,这是对之前 A100 GPU 的升级。需要添加 AI 功能的公司可以访问此虚拟机服务,该服务具有以下功能:

  • 8 个 NVIDIA H100 Tensor Core GPU 通过下一代 NVSwitch 和 NVLink 4.0 互连
  • 非阻塞胖树网络中每个 GPU 400 Gb/s NVIDIA Quantum-2 CX7 InfiniBand,每个 VM 3.2Tb/s
  • NVSwitch 和 NVLink 4.0,每个 VM 内的 8 个本地 GPU 之间的对分带宽为 3.6TB/s
  • 第 4 代英特尔至强可扩展处理器
  • PCIE Gen5 主机到 GPU 互连,每个 GPU 带宽为 64GB/s
  • 16 通道 4800MHz DDR5 DIMM

这是微软先前在 Azure OpenAI 服务中宣布的 ChatGPT 的补充,它允许第三方通过 Azure 访问聊天机器人技术。

在另一篇博文中,微软谈到了该公司如何首先开始与 OpenAI 合作,以帮助创建 ChatGPT 的大型语言模型(以及微软自己的 Bing Chat)所需的超级计算机。这意味着以全新的方式将数千个 GPU 连接在一起。该博客提供了微软 Azure 高性能计算和人工智能产品负责人 Nidhi Chappell 的解释:

她解释说,为了训练一个大型语言模型,计算工作量被分配到一个集群中的数千个 GPU 上。在此计算的某些阶段(称为 allreduce),GPU 会交换有关它们已完成工作的信息。InfiniBand 网络加速了这一阶段,该阶段必须在 GPU 开始下一个计算块之前完成。

该硬件与软件相结合,有助于优化 NVIDIA GPU 和使它们协同工作的网络的使用。微软表示,它正在继续添加 GPU 并扩展其网络,同时还试图通过冷却系统、备用发电机和不间断电源系统让它们全天候 24/7 工作。

相关内容

热门资讯

Windows 11 和 10... Windows 11/10 文件夹属性中缺少共享选项卡 – 已修复 1.检查共享选项卡是否可用 右键...
Radmin VPN Wind... Radmin VPN 是一款免费且用户友好的软件,旨在牢固地连接计算机以创建一个有凝聚力的虚拟专用网...
如何修复 Steam 内容文件... Steam 内容文件锁定是当您的 Steam 文件无法自行更新时出现的错误。解决此问题的最有效方法之...
事件 ID 7034:如何通过... 点击进入:ChatGPT工具插件导航大全 服务控制管理器 (SCM) 负责管理系统上运行的服务的活动...
Hive OS LOLMine... 目前不清退的交易所推荐: 1、全球第二大交易所OKX欧意 国区邀请链接: https://www.m...
在 Windows 11 中打... 什么是链路状态电源管理? 您可以在系统控制面板的电源选项中看到链接状态电源管理。它是 PCI Exp...
如何在 iPhone 14 P... Apple 的 iPhone 14 Pro 是第一款配备 48MP 传感器的 iPhone。所有以前...
在 iCloud 上关闭“查找... 如果您是 Apple 的长期用户,您肯定会遇到过 Find My 应用程序,它本机安装在 iPhon...
farols1.1.501.0... faro ls 1.1.501.0(64bit)可以卸载,是一款无需连接外部PC机或笔记本计算机即可...
如何在电报Telegram中隐... 点击进入:ChatGPT工具插件导航大全 在Android上的电报中隐藏您的电话号码 您可以通过切换...