微软在Ignite 2024大会上发布Azure Boost DPU
在最近的Ignite 2024大会上,微软宣布了其首款自主研发的数据处理单元(DPU)——Azure Boost DPU。这款DPU专为高效、低功耗的数据中心工作负载设计,集成了高速以太网和PCIe接口、网络和存储引擎、数据加速器以及安全功能,形成了一个完全可编程的片上系统(SoC)。
Azure Boost DPU的起源与技术特点
Azure Boost DPU源自微软于2023年12月收购的DPU制造商Fungible。Fungible由前苹果和Juniper Networks的工程师创立,其团队在收购后加入了微软的基础设施工程部门。
Azure Boost DPU是一款硬件与软件协同优化的产品,专为Azure设计,配备了轻量级的数据流操作系统。与传统系统相比,它具有更高的性能、更低的功耗和更高的效率,预计在云存储工作负载中,功耗仅为CPU的三分之一,性能却达到四倍。此外,基于DPU的系统还包括一个定制的应用层,利用集成的数据压缩、保护和加密引擎,增强了安全性和可靠性。
行业背景与竞争格局
GPU在AI模型训练中发挥了重要作用,但也存在高功耗、冷却需求大以及供应短缺等问题。Nvidia的GPU已经售罄,未来一年内供不应求。因此,定制加速器因其更好的性价比和效率而成为替代方案。AWS和谷歌已经推出了自己的定制芯片,如AWS的Trainium、Inferentia和谷歌的TPU。微软也推出了Maia和Cobalt芯片,专注于能效优化。
微软的AI基础设施布局
在Ignite 2024的新闻稿中,微软表示,随着Azure Boost DPU加入Azure的处理器三件套(CPU、AI加速器、DPU),并通过Azure集成HSM的硬件安全功能、Cobalt和Maia的持续创新,以及先进的网络、电源管理和硬件-软件协同设计能力,微软正在优化其AI时代的基础设施每一层。
行业专家观点
- Chris Evans(存储架构师)认为,微软、AWS、GCP等公司开发的新芯片应引起传统供应商的担忧,这将与传统标准产生分歧,并改变总拥有成本(TCO)模型。
- Shawn Chaucan(生成式AI顾问)表示,微软的新芯片在AI和数据安全方面具有革命性,其效率和性能提升令人印象深刻,期待它们对云计算格局的影响。
微软的云AI基础设施
通过引入DPU,微软构建了一个云AI基础设施,包括x86和Cobalt CPU、Maia加速器以及Azure Boost DPU,进一步优化了其高性能计算和AI解决方案。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。