基于 Arm 的服務器的歷史有些曲折,他們曾多次嘗試挑戰 X86 處理器霸權,但該公司現在似乎看好其在高性能計算 (HPC) 領域的機會,它相信其許可模式、功耗及其架構的效率使其具有優勢。
Arm 的 HPC 業務高級主管 Brent Gorda 在戴爾主辦的 HPC 社區活動上發表演講說,該公司“在 HPC 社區中確實在努力推動”,并強調了其與 Nvidia、Silicon Pearl 和 Fujitsu 等公司的合作伙伴關系開發基于 Arm 的芯片來驅動 HPC 和 AI 應用程序。
事實上,Gorda 指出,Arm 已經在 HPC 行業占據了一席之地,在日本 RIKEN 實驗室的“Fugaku”超級計算機 以 152,064 個 48 核排名世界第一的富士通A64FX 處理器就是基于Arm架構打造的。
然而,富士通走的是從 Arm 獲得架構許可的道路,這意味著它能夠設計和制造自己的定制 Arm 兼容處理器,幾乎可以滿足自己的要求。這意味著增加了 512 位可擴展矢量引擎單元來支持富士通所考慮的那種計算,以及它自己的 Tofu D 高速互連。
但是很少有 HPC 站點可以從頭開始設計自己的芯片。幸運的是,Arm 的商業模式還允許合作伙伴采用現成的核心設計并為其添加自定義模塊,Gorda 解釋說。
“有一種叫做核心許可的東西,你可以通過它許可 Arm Neoverse,這是我們的 IP。這為您提供了核心構建塊,即邏輯本身,您可以圍繞它定制和構建您想要構建的芯片,”他說。
圍繞這一切的是 Arm ServerReady 合規計劃,該計劃證明特定芯片符合 Arm 服務器生態系統的兼容性要求。
“一旦你通過了這個認證,你就可以使用軟件世界了。它保證了軟件的功能,然后您可以為受支持的操作系統版本(如紅帽)付費。”
Gorda 聲稱,這種為特定應用程序或一組應用程序定制芯片的能力是 Arm 的優勢所在,尤其是在 HPC 和 AI 似乎正在發展的領域。客戶可以使用 Arm 核心引擎和片上網絡,并為其目標工作負載添加自定義加速器。
“來自 Nvidia 的 Bill Dally 會說,通過在硅芯片上放置自定義門,您可以獲得三個數量級的性能提升。這正是 Arm 的發展方向,”他說。“每個人都有關于加速器的想法。如果你足夠了解你的工作量,你可以優化它并獲得瘋狂的良好性能。事實上,這就是 A64FX 如此出色的原因。他們花了十年時間,研究了他們擁有的十到十二個應用程序,并且成功了。處理器問世了,它完全將日本人想要的應用程序安裝在他們的系統上。”
Arm 早在 2018 年就推出了 Neoverse,目標是數據中心基礎設施,而不是移動設備市場。Neoverse設計于去年進行了擴展,現在包括三個處理器設計系列:強調性能的 V 系列;專注于云基礎設施等橫向擴展應用N系列;還有針對邊緣應用的E系列。
Gorda 透露,參與歐洲處理器倡議 (EPI) 項目的公司Silicon Pearl正在使用 Neoverse V1 設計。同時,N1 設計已用于英特爾前高管 Renée James 創立的初創公司 Ampere Computing的“Quicksilver”和“Mystique”Altra 服務器芯片。為某些 AWS EC2 實例提供支持的 Amazon Graviton2 芯片使用 N1 核心,而Graviton3 使用 V1 核心。Neoverse V 系列內核顯然還包含在 Nvidia 計劃中的旨在超級計算的“Grace”芯片 中,以及正在由韓國電子和電信研究所 (ETRI) 開發的服務器芯片中。
阻礙 Arm 在服務器市場的問題之一是軟件支持,許多關鍵軟件包都是為 X86 處理器平臺開發的。當被問及是否所有部件現在都可以在 Arm 上部署 HPC 時,Gorda 說,總的來說,答案是肯定的。
“你會發現一些地方還是有弱點,雖然我相信說所有 ISV 都在開發 Arm 端口是準確的,但并非所有 ISV 都公開支持 Arm in Silicon。因此,如果您依賴 ISV 許可證和軟件,您將不得不輪詢您的 ISV 以了解事物的狀態,”他解釋道。
然而,Gorda 引用了 Lustre 并行文件系統的示例,該系統廣泛用于 HPC 環境。多年來,Arm 一直為 Lustre 客戶端提供支持,但“基于 Arm 的存儲服務器非常少,”Gorda 說,因此用于 Arm 的 Lustre 服務器組件目前不受 Whamcloud 的支持,Whamcloud 是 DDN 內監督 Lustre 的部門發展。他補充說,這是 Arm 試圖解決的問題。
Gorda 還指出,大約五年前,Arm 收購了 HPC 軟件工具的領先供應商 Allinea Software,以加強 Arm 的 HPC 軟件生態系統支持。
Gorda 表示,另一個對 Arm 有利的因素是更高的能效。隨著超級計算機擴展到 Exascale 領域并且持續的能源成本成為 HPC 運營商更加關注的問題,這可能變得更加重要。Gorda 表示,盡管 Arm 的 Neoverse V 架構強調性能而不是功率效率,但基于它的芯片仍然比競爭對手的 X86 處理器消耗更少的能量。
“X86 的保證是您可以在其上運行 286 二進制文件,而作為具有 RISC 底層的 CISC 架構的所有歷史遺產都需要在解碼重新排序、修復指令等方面預先進行大量邏輯這是進入芯片并消耗能量的開銷,”他說。相比之下,在某種程度上,您可以將 Arm 視為一張白紙。
Gorda 還聲稱,最終用戶不再關心他們的軟件運行在什么芯片上,理由是 AWS 等公司采用了 Arm 驅動的云服務器。
“市場有新的大玩家來控制架構。他們關心的事情與歷史上一直關心的事情不同。他們關心成本,他們關心能源消耗,他們關心周轉時間,以及在事物之上運行的軟件堆棧,”他說。
“如果你看看亞馬遜在 Graviton2 上做了什么,他們說它便宜了 40%。從最終用戶的角度來看,他們并不關心芯片是什么,他們關心的是它便宜 40%,而且周轉時間與他們習慣的時間相當。”
HPC 分析公司 Hyperion Research的首席執行官 Earl Joseph表示,他預計未來幾年基于 Arm 處理器的 HPC 服務器將出現高速增長。
“我們預計五年增長率將超過 31%,而基礎市場的增長率約為 7% 至 8%,”Joseph說。他補充說,這相當于到 2025 年基于 Arm 的系統將占 HPC 市場的 10% 左右。
然而,Joseph也警告說,收入數字可能會產生誤導,因為大型超級計算機項目可能會扭曲數字,就像 2020 年接近 10 億美元的富岳系統所做的那樣。
因此,由于如此龐大的個人安裝,市場可能會發生巨大變化,Hyperion Research 表示,預計 2025 年將有兩臺基于 Arm 處理器的歐洲百億億級機器。
他補充說,許多即將推出的 HPC 系統預計將混合使用 Arm 和 X86 以及其他處理器類型的處理器。