微軟希望通過推出用于AI和其他工作負載的新型專用芯片來推動其客戶的AI和云計算雄心。
近日舉行的Ignite 2023大會上,微軟宣布的新芯片包括微軟在Azure上推出的首款定制型AI加速器Azure Maia,旨在支持大型語言模型和GitHub Copilot等工作負載,以及微軟首個定制的自主開發型CPU——Azure Cobalt,該芯片是基于Arm架構構建的,可為常見工作負載提供最佳性能和能源效率。
微軟Azure基礎設施營銷總經理Omar Khan在一篇博文中表示,AI轉型是今年Ignite大會的核心主題之一。他表示,今年人工智能發展迅速,正在推動著一波創新浪潮,迅速改變應用格局以及應用構建和交付的方式。然而,企業在努力發展這一創新的同時,還要應對成本上升和可持續發展挑戰等優先事項。
Khan表示:“如今客戶正在尋找能夠滿足他們所有需求的AI解決方案,在AI新時代,我們正在重新定義從芯片到系統的云基礎設施,為每個企業、每個應用和每個人的AI做好準備。”
Azure Maia定制AI加速器
Khan解釋說,Azure Maia加速器芯片是為大型語言模型、Bing和ChatGPT等AI工作負載定制的,是計劃中的第一代加速器系列,它擁有1050億個晶體管,是有史以來基于5納米工藝制造的最強大的芯片之一。該芯片是微軟與OpenAI合作設計的,OpenAI深入了解了其大型語言模型如何運行在Azure云基礎設施上,以確保其提供最佳性能。
OpenAI首席執行官Sam Altman表示,OpenAI的專家和微軟在Azure AI基礎設施層的各個方面進行了合作。他說:“我們共同努力,用我們的模型來完善和測試,Azure端到端的AI架構現在已經通過Maia優化至芯片,為訓練功能更強大的模型、為客戶降低這些模型的成本鋪平了道路。”
微軟技術研究員Brian Harry表示,Maia 100 AI加速器也是專門為適應Azure硬件堆棧的其余部分而構建的。他承諾,該芯片的設計與Azure更大的AI基礎設施的結合,將帶來性能和效率上的巨大提升。
Azure Cobalt CPU
Cobalt CPU是一款64位的128核芯片,據稱比當前一代Azure Arm芯片性能提高了40%,旨在為Teams和Azure SQL等微軟服務提供支持。Arm芯片以其節能設計而聞名,可以幫助客戶實現可持續發展的目標,同時確保云原生應用按預期運行,其重點是優化芯片的每瓦性能,以便在消耗的每單位能量中榨取最大功率。
Harry表示:“架構和實施的設計考慮了功效,我們正在以最有效的方式利用硅上的晶體管,將我們所有數據中心服務器的效率提升相乘,加起來就是一個相當大的數字。”
Azure硬件系統和基礎設施公司副總裁Rani Borkar表示,微軟選擇自主設計自己的芯片,以確保芯片完美適合其云基礎設施及其運行的AI工作負載。這些芯片將與定制的服務器主板集成,并放置在定制的服務器機架內,以便輕松安裝在微軟的數據中心內,然后將配合微軟專門設計的數據中心軟件使用。Borkar表示,其結果就是讓硬件系統提供最大的靈活性,可以針對功耗、性能、可持續性或成本進行優化。
Borkar表示:“在微軟,我們正在共同設計和優化硬件和軟件,以便實現一加一大于二的效果。我們可以看到整個堆棧,而硅只是其中的成分之一。”
Khan表示,新的芯片代表了微軟下一代云基礎設施的最后一塊版圖,將于明年初開始向客戶推出,最初將支持包括Microsoft Copilot和Azure OpenAI Service在內的服務,然后擴展到其他類型的工作負載。
Constellation Research分析師Holger Mueller表示,微軟針對AI開發自己的定制硬件是有意義的,因為微軟已經提供了一系列用于開發和運行這些工作負載的最全面的軟件。他說:“性能和功能的結合,再加上Azure的網絡功能,使這些定制芯片成為企業非常感興趣的產品,企業將非常高興看到Azure Maia和Azure Cobalt能夠提供什么。”
除了新硬件之外,微軟還做出了巨大努力來改善連接硬件的網絡基礎設施。微軟表示,憑借其中空芯光纖技術和現已全面推出的Azure Boost服務,將能夠大幅加速網絡和存儲,兩者的結合將使客戶能夠實現高達每秒12.5 GB的吞吐量、每秒650000 IPOS的遠程存儲性能、以及高達每秒200 GB的網絡帶寬,以支持數據最密集的工作負載。
除了微軟的定制芯片之外,客戶還將擁有新的硬件選擇。微軟在另一份聲明中表示,正在與Nvidia公司合作,提供對其最新基于H100 Tensor Core GPU的虛擬機的訪問了路徑,主要針對中型到大型的AI工作負載例如Azure Confidential虛擬機,還將于明年提供對Nvidia H200 Tensor Core GPU的訪問,以盡可能低的延遲支持對更大型AI模型的推理。
第三個AI工作負載選擇是由AMD構建的新型MI300加速器。MI300于今年早些時候發布,并將于明年初在Azure上提供。微軟表示,這款高性能芯片的加入為客戶提供了運行AI應用的更多選擇。
Borkar表示:“以客戶為中心意味著我們為客戶提供最好的東西,意味著我們要利用生態系統中可用的東西以及我們開發的東西,我們將繼續與所有合作伙伴合作,為客戶提供他們想要的東西。”
Azure基礎架構更新
微軟在Azure基礎設施方面還有更多內容可以分享,例如微軟宣布Oracle Database@Azure服務將在微軟美國東部Azure區域全面上線。該服務將于12月推出,該地區的Azure客戶可以直接訪問Oracle自己數據中心的Oracle云基礎設施上的數據庫服務。微軟承諾,將與Oracle Exadata Database Service on OCI的性能、規模和工作負載可用性相匹配,同時添加Azure的所有優勢包括安全性、靈活性和服務。
與此同時,VMware的客戶很快將能夠訪問VMware vSphere on Azure Arc。該服務現已全面推出,融合了Azure和VMware的基礎設施,為開發者提供支持讓他們可以使用Azure 的服務構建更復雜的應用。此外,由Azure Arc支持的Azure IoT Operations現在也已經推出預覽版,這樣客戶就可以構建復雜性較低的物聯網應用和服務,使遠程設備能夠在AI洞察的驅動下做出實時決策。
最后,微軟分享了Microsoft Copilot for Azure的一些簡要細節,該產品今天推出了預覽版。Microsoft Copilot for Azure基于生成式AI技術,使客戶能夠更輕松地在Azure中執行多種任務,將簡化用戶在任何環境中設計、操作應用和基礎設施以及對其進行故障排除的方式。客戶可以在該服務正式推出之前申請訪問。