受惠于過去幾年人工智能的爆發,全球GPU領導廠商英偉達不但成為全球市值最高的半導體企業。與此同時,公司又收購了Mellanox和Arm,打造了完整的數據中心芯片產品線,全新的英偉達儼然成為數據中心最炙手可熱的明星。
英偉達創始人黃仁勛在昨晚開幕的GTC大會上也表示,在其CPU、DPU和GPU這三條產品線,公司未來在數據中心將會創造更多可能。而在本次大會上,英偉達也帶來了CPU和DPU的更新。尤其是收購Arm之后發布的首款CPU,更吸引了廣泛的關注。
在筆者看來,這顆芯片的發布,又一次吹響了英偉達向英特爾盤踞的數據中心市場進攻的號角。
為什么數據中心需要新的xPU?
熟悉數據中心構造的讀者應該知道,傳統的數據中心必不可少的一個芯片那就是英特爾X86架構的CPU。然而伴隨著AI的流行,這種傳統的架構就不再滿足了新興應用的需求,這就給有用并行計算先天優勢的英偉達帶來了機會,這也是他們過去幾年在數據中心如魚得水的原因。
但按照黃仁勛的說法,隨著數據中心訓練模型的變大,加上對芯片處理能力需求的提升,這就給數據中心的CPU的數據“搬運”和網絡相關處理帶來了新的挑戰。換而言之,就是當前數據中心使用的X86 CPU很難兼顧數據在CPU和GPU之間流動和網絡處理的需求,為此這就給DPU和英偉達自研的Arm架構CPU帶來了機會。這也是英偉達收購Mellanox和Arm的原因。
所謂DPU,也就是Data Processing Unit(數據處理器)。在英偉達的產品線布局中,這是一款把ARM處理器核、VLIW矢量計算引擎和智能網卡的功能集成在了一起的產品,主要應用在分布式存儲、網絡計算和網絡安全領域。根據相關資料顯示,這款產品是他們基于公司之前收購的Mellanox內部孵化而成的。
據介紹,DPU可從CPU上卸載關鍵的網絡、存儲和安全任務,使企業能夠將其IT基礎設施轉變為最先進的數據中心。此類數據中心可實現加速、具有完全可編程性,并具有 “零信任”安全功能,防止數據泄露和網絡攻擊。這就減輕了CPU的負載,讓其只專注于亟需處理的各種企業應用程序。
來到CPU方面,正如前文所說,數據中心目前幾乎都是X86架構的至強處理器的市場。然而黃仁勛指出,正是因為這樣的配置,影響了整個數據中心的數據傳輸。“現在CPU的存儲和PCIE帶寬,嚴重影響了GPU能力的釋放”,黃仁勛強調,為此他推出了全新的基于Arm架構打造的CPU Grace,希望借助這個新處理器以及自有的NVlink來解決這個數據瓶頸問題。
英偉達xPU的強勢出擊
在上述思路的驅動下,英偉達推出了全新的DPU Bluefield-3 和新款CPU Grace。
首先看DPU方面,據介紹,BlueField-3將具有16個Arm A78內核,能提供十倍于BlueField 2的計算能力,在帶寬方便則可以達到400Gbit / s,同時也加上了對PCIe gen 5的支持,獲得了比PCIe gen 3快四倍的速度。在這個芯片中,Nvidia還加入了兩個加速器,為軟件定義存儲、網絡、安全、流和TLS / IPSEC加密等應用提供支持。此外和BlueField-2一樣BLUEFIELD-3能給5G電信和時間同步數據中心的精確定時。數據顯示BlueField-3的額定值為350 SPECINT和1.5 TOPS(TeraOps)。
黃仁勛進一步指出,一個Bluefield-3 DPU約等于300個x86 cpu內核,因此它能夠大大減輕CPU的負載。BlueField-3同時還可以充當Nvidia的Morpheus云原生網絡安全框架的監視或遙測代理。據介紹,公司將于2024年推出性能更強的Bluefield-3 ,進一步加強公司在這個市場的影響力。
以美國海軍少將、計算機編程先驅Grace Hopper的名字命名的CPU,則開啟了英偉達數據中心的新時代。據黃仁勛介紹,這個處理器能夠與常規GPU產品一起工作,讓公司能夠獲得更全面地垂直集成其硬件堆棧的能力。按照NVIDIA的說法,該芯片是專門為大規模神經網絡工作負載設計的,預計將于2023年在NVIDIA產品中使用。
按照anandtech介紹,Grace的發布旨在填補NVIDIA AI服務器產品線中CPU的空白。該公司的GPU非常適合某些類的深度學習工作負載,但GPU并不能執行數據中心里的所有操作,這就是CPU存在的意義,為此NVIDIA當前的服務器產品通常依賴于AMD的EPYC處理器和Intel至強這樣的處理器,
但正如前文所說,這些處理器對于一般的計算而言是非常快,但不能滿足NVIDIA所追求的那種高速I / O和深度學習優化。特別在NVIDIA目前使用PCI Express來進行CPU和GPU連接時,這種連接方式就成為瓶頸。如果引入NVLink,那么系統中的GPU彼此之間就可以直接快速對話,而不需返回主機CPU或系統RAM。
“基于Grace的系統與NVIDIA GPU緊密結合后,性能將比目前基于X86 CPU的,最先進的 NVIDIA DG高出十倍”,黃仁勛表示。“絕大多數的數據中心仍將繼續使用現有的CPU,而Grace將主要用于計算領域的細分市場”,黃仁勛進一步指出。
從anandtech的介紹我們可以看到,在之前,NVIDIA為了在數據中心使用NVLink,選擇了POWER9處理器作為合作伙伴,但Grace的發布,從某種程度上宣布了這種合作的終結。
寫在最后
其實在這次發布會上,NVIDIA還發布了他們新一代的AI自動駕駛汽車處理器NVDIA DRIVE Atlan,它能夠提供約為上代產品Orin四倍的速度。作為一款集成了DPU、下一代架構GPU、新型Arm 內核和最新深度學習和計算機視覺加速器的SoC,NVDIA DRIVE Atlan能夠獲得高達1000TOPS的速度,以及能提供極高的帶寬,為未來的自動駕駛設計賦能。
除了芯片以外,NVIDIA還帶來了各種軟硬件的更新,例如用于仿真、協作、和自助機器訓練的NVIDIA Omniverse,專為工作組打造的便攜式AI數據中心NVIDIA DGX Station,面向企業級的NVDIA EGX,用于訓練Transformer框架的NVIDIA Megatron,用于計算藥物研發加速庫Clara Discovery的一些模型,能夠為量子電路模擬器提供加速的cuQuantum,數據中心安全平臺NVIDIA Morpheus,先進的深度學習對話式AI Jarvis和推理服務器Triton等一系列產品。此外,英偉達還宣布了和Ampere computing和Amazon等一系列Arm服務器芯片廠商的合作,共同推動Arm生態的發展。
黃仁勛表示,憑借公司現有的芯片、軟件、AI和各種產品,英偉達能助力開發者成就畢生的事業。尤其是在芯片方面,黃仁勛強調,公司數據中心路線圖包括CPU、GPU和DPU這三類芯片,而Grace和BlueField是其中必不可少的關鍵組成部分。每個芯片架構歷經兩年的打磨周期(周期內可能出現轉變),一年專注于 x86 平臺,另一年專注于 Arm 平臺。
“我們每年都會發布激動人心的新品。三類芯片,逐年飛躍,一個架構。”黃仁勛補充說。