2019年,英特爾人工智能收入達到38億美元,在軟硬件協同創新、產業合作以及生態構建等方面的進展,推動了英特爾以數據為中心的業務的增長。而英特爾對于人工智能的探索,也經歷了不少的波折。
去年年底,英特爾斥資約20億美元收購以色列人工智能公司Habana Labs。隨即,英特爾宣布新近收購的Habana的系列產品將取代原定的服務器端AI加速芯片Nervana Spring Crest NNP-T,而Spring Crest NNP-T系列將停止開發。
根據相關資料顯示,英特爾之所以做出這個決定,是Habana在被收購之前,其芯片就已經被應用于市場當中,而這也能幫助英特爾能夠迅速切入到AI芯片競爭當中。據悉,Habana的芯片分為兩個系列,即針對訓練的Gaudi系列和針對推理的Goya系列。
被收購后,Habana作為一個獨立的業務部門,向英特爾的數據平臺集團匯報。在被英特爾收購一年以后,Habana的表現如何。或許,從Habana最近與AWS的合作中便可讓我們窺見他的鋒芒。
云端訓練芯片市場的挑戰者
眾所周知,云端訓練芯片市場一直是英偉達的天下。伴隨著人工智能應用的場景越來越多,云端訓練芯片市場成為了一塊大蛋糕,這也使得很多廠商都在力圖這個領域的發展。英特爾便是其中之一,而Habana則是英特爾突破這塊市場的得力干將。
Habana的Gaudi系列是針對訓練芯片市場而打造的,不久前,其Gaudi系列產品成功進入到了AWS的服務器當中。據官方新聞顯示,Invent 2020(AWS re:Invent 2020)大會上,AWS首席執行官Andy Jassy宣布了采用最多8個Habana Gaudi加速器的EC2實例。
據稱,對于機器學習工作負載,這些全新EC2實例的性價比相較目前基于GPU的EC2實例提升高達40%。8卡的Gaudi 解決方案可以在TensorFlow上每秒處理12000張圖像訓練ResNet-50模型。每個Gaudi處理器集成了32GB的HBM2內存,并集成了用于服務器內部處理器互聯的RoCE功能。憑借AWS彈性架構適配器(EFA)的技術可以跨服務器擴展,從而允許AWS及其客戶無縫地擴展使用多個基于Gaudi的系統以實現高效和可擴展的分布式訓練。
從功耗上看,本次AWS采用的是16納米制程的Gaudi,其功耗在260W-300W之間,功耗比A100 GPU略有一點優勢。Habana在現有制程和功耗上的表現,說明整個架構相對A100 GPU沒有任何劣勢,應該還有一定的優勢。
對于云端訓練市場來說,英偉達的GPU架構一直是這個領域的主流。而本次AWS采用Gaudi產品則向業界傳遞了這樣一個信號——在訓練端我們確實可以通過不同的架構對AI進行加速,并帶來不一樣的客戶體驗。
Habana Labs中國區總經理于明揚認為,性價比和軟件生態是決定一個訓練芯片能否打入市場的關鍵。他表示:“性價比能夠吸引用戶去嘗試一個新平臺,軟件生態則是能夠幫助用戶將現有的模型更方便、快捷地遷移到新平臺的關鍵。”
而這,也是AWS選擇Gaudi的原因。(據介紹,明年的一季度,AWS會開放給客戶去申請Gaudi的資源,去體驗Gaudi的性能)
Habana獲得了什么
在英特爾看來,片間互聯和系統間互連會為整個訓練系統帶來非常大的影響。
因此,片內之間是否可以更多的加載數據、如何通過實現數據并行化成為了Habana在進行訓練芯片設計時所要考慮的兩個因素。
對于未來,于明揚則表示:“Habana接下來將利用新的制程工藝來提升現有產品的設計。此外,Habana還將致力于與英特爾共同打造一個OneAPI的軟件生態。”
據介紹,Habana在后續training產品發展中會采用7nm,并會關注互聯技術等方面。這樣做的目的,一是可以實現對未來更大模型和更大數據集的支持。二是Habana將提供更具精度的數據支持。
在上文我們曾提到過,Habana在被收購后是作為一個獨立的部門進行運營,但對于Habana來說,其云端AI在很大程度上是和英特爾現有團隊是高度緊密吻合的。因此,與英特爾的資源進行結合,也是Habana接下來發展的之一。
英特爾有足夠的客戶群,這為Habana帶來了發展契機。據于明揚介紹,Habana被收購之后獲得的人才和技術資源比原來擴大了三倍。這在很大程度上支持了Habana開發多個產品,以加深對客戶的支持。
其次,英特爾在AI市場有一個統一的平臺架構,憑借其在AI領域的影響力,可以幫助Habana更快地發展,從而進入到新的領域。據于明揚介紹,明年Habana計劃會加入到OneAPI的產品序列當中。
整個AI中,需要CPU、GPU以及像Habana這樣的ASIC扮演著不同的角色,英特爾的優勢在于無論任何環節,英特爾都有合適的產品和解決方案。從一個產品到一個完成的生態,或許是英特爾提供給Habana的最大助力。
英特爾進軍訓練芯片市場初顯成效
借助Habana,英特爾得以進軍訓練芯片市場。
根據英特爾官方新聞稿中顯示,英特爾數據平臺事業部首席戰略官Remi El-Ouazzane對于與AWS之間的合作曾表示:“我們的產品組合反應了人工智能并非是能用一種解決方案來滿足所有場景的計算挑戰。云服務提供商目前已廣泛采用了內置人工智能性能的英特爾?至強?處理器來應對人工智能推理工作負載。通過Habana,我們現在得以幫助他們降低人工智能模型的大規模訓練成本,在高增長的市場機遇中提供極富競爭力的替代選擇。”
與AWS的合作,并不是Habana唯一取得的成績。據于明揚介紹,Habana已經與國內頭部的互聯網公司以及二線的互聯網公司建立了廣泛的合作。這些公司基本上都已經開始試用Habana的產品,部分公司已經開始批量采購,并在他們的產線上部署Habana推理和預測的產品。其中,訓練產品相關的測試平臺已經在開始進行不同模型的測試,以及新的模型的試運行。
在英特爾亞洲人工智能銷售技術總監伊紅衛看來,人工智能和數據分析是未來10年起決定作用的工作負載,是關鍵的轉折性技術,也是英特爾未來增長的重要驅動因素,這將幫助英特爾加速邁向更廣闊的市場。
而這個市場或許就是英特爾正在做轉型的“以數據為中心”的市場。他們認為,在以數據為中心的時代,釋放數據的指數級潛力,關鍵在于AI x 5G x 智能邊緣等轉折性技術,它們加速突破和融合,正成為智能世界的新型基礎設施,釋放智能的X效應,驅動產業新一輪的智能創新。