3 月 14 日消息,英特爾近日發布公告,分享了關于 AI 戰略和加速器的更多信息,在更多產品和軟件中整合 AI 元素,更好服務企業和數據中心未來發展。
加速 AI 布局
在人工智能方面,英特爾開發了一套完整的企業 AI 堆棧(Enterprise AI stack),使用 OpenVINO、Intel Developer Cloud oneAPI & Synapse 等開源標準,推進硬件、系統、應用的快速發展。
硬件分為三個分支:數據中心(可擴展系統、加速器、CPU)、網絡(開放標準和可配置性、基礎設施)以及 Client & Edge(AI PC、NPU、GPU、CPU)。
Gaudi 2 性價比更高
英特爾表示,在定價方面,Gaudi 2 采用的工藝與英偉達 A100 相同,都是臺積電的 7nm 工藝,但關鍵區別在于,在 Stability Diffusion 和生成式 AI 負載方面,Gaudi 2 性能是 A100 的 3 倍,這意味著使用 Gaudi 2 可以比英偉達的 A100 節省更多成本。
在某些工作負載中,Gaudi 2 硬件的性能也優于最新的 H100 GPU,英特爾表示會繼續擴大這些優勢,將在未來繼續保持領先地位。
Gaudi 3 計劃 2024 年第 3 季度上市
在路線圖方面,英特爾仍將 Gaudi 3 定位為 Gaudi 2 和 Falcon Shores 的后續產品。英特爾表示,Gaudi 3 加速器目前已進入驗證實驗室,將于 2024 年第 3 季度全面上市。
英特爾表示,在軟件 / 應用方面為 Gaudi 3 構建了廣泛的 OEM 生態系統和英特爾開發者云網絡,在硬件方面,Gaudi 3 加速器將采用與 Gaudi 2 相同的高性能架構,不過計算能力是其 4 倍,網絡帶寬是其 2 倍,HBM 內存帶寬是其 1.5 倍。
Falcon Shores 計劃 2025 年上市
Falcon Shores 是首個專為人工智能工作負載設計的 GPU 架構。它將 Gaudi 人工智能 IP 和英特爾 GPU 技術的精華結合到一個融合產品中。Falcon Shores 的開發工作進展順利,目標是在 2025 年推出。
3-5 行代碼就能實現模型遷移
AI 開發人員的一個主要擔憂是,遷移到新硬件會帶來一些問題,例如修改代碼以支持新的加速器。根據英特爾的說法,大多數開發人員都在堆棧的高層(Hugging Face、Mosiac ML、PyTorch 等)上工作,利用英特爾的軟件解決方案,他們只需在 Python 腳本中添加幾行代碼,就能遷移現有模型或新模型。
英特爾的 "模型遷移" 只需 3-5 行代碼即可將現有模型或新模型遷移到新硬件上。對于高級軟件,英特爾提供從英偉達到整個 Gaudi 甚至下一代獵鷹海岸加速器陣容的遷移支持。
該公司還在努力增加底層模型,如 OpenAPI、Triton 和 TPC-C,以便從英偉達?(NVIDIA?)硬件遷移到 Falcon Shores GPU 時獲得支持。
將推出中國提供版 Gaudi 硬件
英特爾表示在完全遵守美國當局的規定前提下,針對中國市場定制 Gaudi 硬件,以便可以出口到中國市場。