在英偉達GTC大會期間的全球媒體/分析師電話會議中,英偉達CEO黃仁勛首次提出“四大支柱”,并就“與Arm生態的合作、以及新趨勢下處理器的發展”等問題回應了與非網。
首提“四大支柱”
黃仁勛提出,四大技術正在影響未來,也正在成為英偉達重要的發展支柱。
一是云原生平臺NVIDIA Omniverse
他表示,人類與AI和機器人共存的虛擬實時3D世界不再只是科幻小說中的故事情節,通過Omniverse可以創建共享的虛擬3D世界。為了實現這一點,Omniverse現可擴展至多個GPU、具有高物理精度、能夠充分運用RTX實時路徑追蹤等技術,并且與NVIDIA AI完全集成。今年夏季開始,英偉達還將提供Omniverse企業授權許可,進一步擴大應用范圍。
二是圍繞云原生AI服務的計算需求
英偉達正在從底層進行自下而上的顛覆創新。全新的AI計算機DGX雙管齊下,包括便攜式AI數據中心DGX Station,以及為密集型AI研發打造的AI數據中心產品NVIDIA DGX SuperPod;搭載Aerial A100的NVIDIA EGX服務器,是業界首個具備云原生技術、安全性和AI邊緣數據中心能力的5G基站;此外,還有量子電路模擬框架CuQuantum,這是專為模擬量子電路而設計的加速庫,更適合大GPU顯存、多GPU和多DGX節點所需。
還有面向數據中心的兩款芯片:一款是全球首款專為TB級加速計算而設計的CPU Grace,另一款是專為現代超大規模云技術基礎架構而生的DPU BlueField。至此,英偉達的數據中心路線圖將由三種芯片組成:CPU、GPU、DPU,三類芯片,每年一次飛躍。
三是將AI擴展到邊緣應用
我們現在正處于第二輪AI發展浪潮的起點,這波發展將以企業和產業邊緣計算為主,AI將徹底改變全球大型行業,包括制造、物流、農業、醫療健康、金融服務和運輸業。他表示,英偉達的AI服務尚未完全覆蓋每一個計算領域,而下一個重點就是企業計算。面向企業級的NVIDIA EGX,將繼續擴大NVIDIA-Certified認證服務器生態系統,使得企業用戶的使用和部署更為便捷。
四是自動駕駛
黃仁勛表示,將于2022年投產的NVIDIA自動駕駛汽車計算系統級芯片NVIDIA DRIVE Orin,旨在成為汽車的中央電腦。最新發布的新一代車載系統級芯片NVIDIA DRIVE Atlan,將為汽車帶來真正的數據中心。對于Atlan,黃仁勛寄予厚望,聲稱“Atlan集英偉達在AI、汽車、機器人、安全和BlueField安全數據中心領域技術之大成”,而現在,它已“整裝待發,將帶來新一輪的巨大飛躍。”
與Arm生態彼此需要、互相借力
根據此次GTC上釋出的消息,英偉達與Arm生態的合作全面覆蓋了云、高性能計算、邊緣、企業級計算、PC,這是否是并購進展順利的一個訊號?兩個生態未來的交融又有哪些計劃?
“這將是非常的重要一步”,黃仁勛表示,“Arm在嵌入式和移動設備領域取得了巨大的成功,一是因為技術效能非常好,二是因為其專利許可模式,有很強的可塑性,用戶可以基于其IP打造自己想要的任何產品,來滿足市場上多種多樣的需求。這是Arm的成功之處,可以說Arm打造出了芯片上的城市(SoC)”。
他指出,這兩大驅動因素發揮得最好的領域就是嵌入式和移動設備,SoC的理念對Arm來說非常重要,保證了Arm作為中央處理的核心利益。但是,數據中心是截然不同的領域,不論是云數據中心、應用數據中心還是邊緣數據中心等,充滿了多個第三方軟件、第三方外圍設備。在SoC的世界中,設計者擁有軟件和堆棧,但是在數據中心,這一切是完全整合的,也更容易被分解開。
也正是如此,黃仁勛表示,在數據中心的世界中,需要新的系統、軟件、生態、合作伙伴以及新的投資組合,而這些都是英偉達所擅長的。Arm生態系統中的公司,正在蓄力進入云、超級計算等新領域,而英偉達致力于將Arm生態系統擴展到移動和嵌入式系統以外的市場。
談到對Arm的收購進展,黃仁勛表示目前非常順利,正在配合美國、歐洲和亞洲的監管機構,進一步解釋Arm未來的發展愿景,以及雙方合作將給市場帶來的更多創新。他補充,Arm將會繼續保持開放授權的模式,兩家公司合并,將會加速他在這方面的投資。
不論是黃仁勛對收購一直表現出來的樂觀態度,還是從兩個生態交融目前取得的實質性成果來看,大方向上的進展都很順利。
本次GTC上公布的合作包括:NVIDIA GPU與基于AWS Graviton2的Amazon EC2實例相結合,雙方將共同在云端部署由GPU加速的基于Arm的實例;發布了搭載Arm CPU的開發者套件,便于開發者和ISV合作伙伴使用;與Marvell合作,將OCTEON DPU與GPU相結合,加速云、企業、運營商和邊緣應用;在PC領域,與全球最大的基于Arm的SoC供應商之一聯發科合作,打造支持Chromium、Linux和NVIDIA SDK的參考平臺。
英偉達推出CPU對全球處理器格局意味著什么?
英偉達首次發布了一款CPU——Grace,主要面向大型數據密集型HPC和AI應用。GPU霸主推出一款高性能CPU,這對英偉達自身和全球處理器供應商意味著什么?它是否會成為一款改變處理器現有游戲格局的產品?
黃仁勛表示,確實是游戲的玩法在改變,但這款產品肩負的使命并不是改變游戲規則,而是要解決問題,當前所面臨的根本問題是數據處理需求增長太快,超出了現有的系統內存、帶寬等負荷。
“處理大量數據是當今計算機系統面臨的一大挑戰,對于transformer和推薦系統等AI模型來說尤為如此,新一代自然語言處理(NLP)模型的訓練會有超過一萬億的參數。但是在實際應用中,GPU受限于數據中心系統中現有的CPU內存和PCIe帶寬,更快的NVLINK又不被x86 CPU所支持”,黃仁勛指出。
因此,與其說英偉達推出了一款CPU處理器,不如說,是為自己的GPU系統量身打造了一款高度專用的處理器。
在GTC Keynote中,黃仁勛詳述了這款專用CPU為系統帶來的改變。他以1/2的DGX說明了系統目前的瓶頸所在:每個Ampere GPU都連接到80GB的超快速顯存,運行速度為2TB/秒,加在一起,即4個Ampere以每秒8TB的速度處理320GB的顯存。與之形成對比的是,CPU內存為1TB,但速度僅為每秒0.2TB,CPU內存比GPU大3倍,速度比GPU慢40倍。
基于此,英偉達提出了一個大膽的設想:如果能夠用該節點的全部1320GB內存來訓練AI模型,需要做什么?答案就是更快的CPU。通過建立四條直連CPU的通道,每個GPU都有了一個專用通道?;贏rm下一代服務器IP的Grace,與英偉達GPU緊密結合,性能比目前最先進的NVIDIA DGX系統(在x86 CPU上運行)還高出10倍。
“未來,絕大多數數據中心仍將使用現有的CPU,x86服務器架構的出色之處在于能夠通過配置不同的CPU、內存、PCIe和外圍設備來服務所有這些應用場景”,黃仁勛強調,“Grace專為加速大量數據的應用程序而構建,主要面向大型數據密集型HPC和AI應用的細分市場?!?/p>
Grace無疑彰顯了Arm架構所帶來的助益,英偉達的架構和平臺通過支持x86和Arm,將能夠滿足市場上的更多需求。
這也意味著,英偉達與x86的競合之路也進入了新階段,以往更多是基于x86架構做加速升級,但現在,放眼數據暴增的新應用,英偉達可以拍拍Intel的肩膀說,“Hey buddy, now I have my own CPU. ”
The Last One
全球半導體供應鏈高度互聯非常重要
針對當前全球半導體芯片的突出問題,黃仁勛也發表了個人的觀點。
“半導體技術對整個人類社會的重要性比以往任何時候都要明顯,一顆芯片有可能影響整個行業,特別是當前在汽車領域,”他表示,“顯然,現有的供應鏈需要升級、重塑,減少層層責任,這樣就可以更直接地找到貨源。”
對于美國的供應鏈回遷問題,黃仁勛表示,“世界供應鏈的高度互聯非常重要,誰都不能孤立下去。在現有的供應鏈格局中,世界各地廠商已經在各自環節中發揮著重要作用。很多電子設備都是由來自世界不同地方的零部件組合而成,而這需要很多人的工作才能實現。供應鏈已經如此復雜,也正是科技產業創造出了一個相互聯系的地球村?!?/p>
他認為,不管產業鏈如何變遷,但內在的聯系不會消失,影響未來計算的基本動力應該被認識到。5G、云計算、數據中心正在對現有的計算架構進行升級,所有這些驅動力使成千上萬的小芯片聚合成一個個計算單元,將重塑現有的行業應用,重塑所有受計算影響的行業。