《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 通用型AI芯片突破“內存墻”瓶頸指日可待

通用型AI芯片突破“內存墻”瓶頸指日可待

2020-09-21
來源:半導體行業觀察
關鍵詞: 人工智能 ASIC 云端

  當下,人工智能(AI)產業正處于從起步向成熟階段的過渡時期,相關應用也處于探索階段,因此,各種專用的AI芯片層出不窮。然而,如果要針對某一個應用場景做ASIC化的產品,可能做出來的瞬間就已經落后了。另外,因應用所處環節不同,ASIC化并非完全不可行,例如在端側的一個固定應用場景中,場景很明確就可通過ASIC的方式來做產品,但是,越靠近云端,應用變化越大,在這樣的變化下很難部署某一ASIC化的處理器。無論是云端還是云邊端,或者企業應用市場,都對算力要求非常高,因此,通用AI處理器就成為了更加合理的選擇。

  與專用AI芯片相比,通用型AI處理器的應用范圍更加廣闊,更代表著AI硬件的發展方向,在這一領域,當下最為流行的便是GPU和CPU了。

  隨著應用需求向更廣和更深層面拓展,GPU在AI領域的應用遇到了越來越明顯的瓶頸,首先,GPU和CPU屬于傳統處理器,并不是為AI計算專門設計的,在AI發展的初期階段,它們能夠勝任,但在接下來的第二、第三……發展階段,在更為復雜的模型和技術面前,其計算架構局限性開始逐步體現出來。

  正是在這種背景下,IPU出現了。該處理器是由英國初創企業Graphcore發明的,旨在支持機器智能的新計算需求。其第一代IPU中的1200多個處理器內核可以分別處理完全獨立的任務,并且能夠彼此通信以支持完整的多指令多數據并行操作。而這些正是下一代機器智能的基本要求。

  日前在中關村論壇上,Graphcore聯合創始人兼首席執行官Nigel Toon和Graphcore高級副總裁兼中國區總經理盧濤受邀出席,并分別在中關村論壇云上論壇和全球科技青年論壇上發表演講。

  據Graphcore聯合創始人兼首席執行官Nigel Toon介紹,IPU在訓練和部署中都可以支持具備高效稀疏計算的大型模型。IPU不僅可以推動創新開發,還可以有效部署這些新模型,更高效的計算可以降低系統總成本。用戶可以在訓練和推理中使用相同的IPU硬件,并且可以靈活更改每個CPU所調用的IPU數量。

  總體來看,Graphcore的業務主要分為三部分:一,專為AI從零設計的IPU處理器;二 Poplar SDK和開發工具;三,IPU平臺,例如IPU-Machine、可以通過浪潮和戴爾購買的IPU服務器,以及可大規模橫向擴展的IPU-Pod64。

  今年7月,Graphcore發布了第二代 IPU(Mk2 IPU),Mk2 IPU是一個基于臺積電7nm制程技術的AI處理器,在823平方毫米的芯片上集成了594億個晶體管。Mk2 IPU擁有250 TFLOPS的AI算力,以及900MB的處理器內存儲容量。這樣一個處理器里具有1472個獨立的處理器核心以及將近9000個獨立的并行處理器線程,相對于第一代IPU(Mk1 IPU),系統級性能提高了8倍以上。

  該公司還新推出了IPU-Machine: M2000(IPU-M2000),這是一款纖巧的數據中心刀片,能夠提供1 PFLOP的AI計算能力,并通過專用IPU內置了AI橫向擴展網絡架構IPU-Fabric。無論您是僅需要一臺IPU-M2000的初創公司,還是希望將數千臺IPU-M2000連接在一起的云公司,IPU-Machine:M2000(IPU-M2000)都可以滿足您的需求。

  技術亮點

  與競品相比,IPU在存儲、通用性、軟件支持和生態方面有諸多亮點。

  在存儲方面,GPU在進行AI計算時,使用的是HBM,它能夠實現每秒1.6 TB的帶寬和40 GB的容量。Graphcore則提出了一個創新的概念:IPU Exchange Memory。據Graphcore高級副總裁兼中國區總經理盧濤(Jason Lu)介紹:IPU Exchange Memory包含了片上存儲和流存儲,一個IPU-Machine:M2000的系統能提供每秒180 TB的帶寬以及450 GB的容量,與GPU相比,在帶寬和容量上都有非常大的提升。

  具體來看,Graphcore提出的IPU Exchange Memory由兩種存儲構成,一種是處理器內存儲(In-Processor Memory),就是片上存儲,另外一種是流存儲(Streaming Memory)。Mk2 IPU集成了900 MB的片上存儲,而主流CPU的每個芯片上存儲可能只有幾十M。

  與DDR或HBM相比,充足的片上存儲能夠提供50~100倍的帶寬提升和時延的降低,Mk2 IPU中,存儲和計算之間的距離大大縮短了。900 MB的片上存儲和流存儲使得大規模擴展成為可能。

  CPU系統里面有一個MMU(內存管理單元,Memory Management Unit),其中有一個很重要的單位是TLB,TLB和外存之間能夠進行Pageant操作。因為Mk2 IPU擁有900 MB的片上存儲,可以通過遠端的流存儲來擴展幾百GB的存儲空間。而不需要像GPU或CPU那樣,32 MB或者64 MB的片上存儲需要不停地跟DDR,HBM做數據交互。

  通過Mk2 IPU內片上存儲和流存儲技術相結合,IPU-M2000可獲得總共450 GB的容量,片上存儲帶寬也獲得了較大的提升。

  對于與競品的對比,盧濤提到了一個IPU的亮點,他表示:“NVIDIA聲稱他們構建的新數據格式TF32可以提高FP32算力。我們則認為,最標準的事情是最開放的,例如FP32是IEEE規定的數據格式,開發者能夠基于FP32用GPU、IPU、CPU來進行計算,但如果開發者使用NVIDIA的TF32數據格式,就把自己困住了。”

  在性價比比方面,IPU也有優勢。盧濤用EfficientNet-B4的訓練做了一個對比,如希望達到EfficientNet-B4在8個IPU-M2000的訓練吞吐量,需要投資16個DGX A100,也就是超過300萬美金的費用,外加相應的電費等其它花費。也就是說,如果使用DGX A100,為獲取8個IPU-M2000的EfficientNet-B4計算性能,需要投入10倍以上的花費。

  在軟件和開發環境支持方面,Graphcore從零設計了以計算圖(Graph)為核心的Poplar SDK,能夠方便用戶不論是使用單個IPU-M2000,還是單張PCIe卡,乃至1000個,甚至上萬個IPU,都能獲得完全一致的用戶體驗。Poplar SDK向上對接TensorFlow、PyTorch、ONNX、PaddlePaddle等行業標準機器學習框架。

  今年7月,Graphcore開放了PopLibs源代碼。盧濤表示:“Graphcore精神的一部分是將權力交給AI開發人員,方便他們自己進行修改、優化、創新。同時,Graphcore也在大力發展IPU開發者社區,其中很重要的一部分是已經在中國上線的IPU開發者云,可提供浪潮IPU服務器NF5568M5、戴爾IPU服務器DSS8440、以及IPU-Pod64等不同機型。IPU開發者云目前已經開放申請使用了。

  開發者能夠非常便捷地獲取IPU,主要有兩種方式:一是通過云,目前可以通過微軟Azure和金山云來獲取IPU;二是通過戴爾或浪潮的IPU服務器構建用戶自己的私有云或自己預置的計算資源。

  談到開放性和創新性,盧濤表示:”Graphcore的IPU平臺,無論IPU-M2000還是IPU-Pod64,在設計過程中都考慮到了芯片、系統、集群及軟硬件結合的問題。Graphcore致力于賦能AI創新者進行新突破,如果僅僅沿著GPU的路線走,只能通過有限的方式來進行一些嘗試。所以,為創新者、開發者、研究者提供支持是Graphcore研發的重要動力。如果是由于硬件桎梏導致您的優秀作品無法達到理想性能,Graphcore歡迎開發者在IPU上進行探索和嘗試。“

  客戶

  談到IPU的應用,盧濤表示,目前,IPU在超大規模數據中心與互聯網、高校及研究機構、醫療及生命科學、金融、汽車這五大領域中發展較快,也受到了很多關注。到目前為止,Graphcore共發貨IPU處理器超過一萬顆,服務全球100多家不同機構。

  ”我們的一位早期客戶,Carmot Capital在使用我們的產品訓練其金融市場預測模型時,性能提升了26倍。“盧濤說,”微軟在使用IPU幫助診斷肺炎和COVID-19的胸部X光影像時,速度提高了10倍,且準確性大大超過GPU。“

  微軟是Graphcore的早期的合作者,他們不僅將IPU技術用于其內部AI工作負載,還在2019年11月將IPU提供給其Azure云計算平臺的用戶使用,從而加速了AI創新者的工作。

  另外,微軟、寶馬、博世、戴爾和三星等許多了解創新與應用之間關系的公司,都對Graphcore進行了投資。

  中國業務

  對于中國市場,Nigel Toon直言:”新技術的最直接需求就在中國。中國在人工智能領域處于領先地位,中國認識到,人工智能創新與長遠經濟發展密不可分。目前,Graphcore的技術已經開始為一些非常成功的中國公司提供支持,并將助力推動中國那些發展最快、最具創新性的AI初創企業。不久以后,我們將能夠更多地談論一些Graphcore在中國的合作伙伴,并分享我們合作的細節。“

  Graphcore的中文名定為”擬未“,該公司正在壯大中國團隊,以便為客戶提供完全本地化的響應和支持。Nigel Toon表示:”我們的目標是將擬未打造成一家重要的中國公司。“

  中國高校合作方面,在IPU開發者云上線之后,Graphcore大概收到了三、四十所高校的頂尖AI實驗室和研究機構的使用申請。Graphcore已開始與一部分機構探討合作,有一些機構已在IPU開發者云上開展工作。

  應用場景方面,盧濤認為中國市場在自然語言處理相關的應用方面發展非常迅速,且潛力巨大,對訓練的算力要求也非常高,這對IPU而言非常重要。

  


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]
主站蜘蛛池模板: 性生活免费视频网站 | 亚洲高清在线观看看片 | 欧美精品午夜毛片免费看 | 亚洲自拍图片区 | 国内精品久久久久久野外 | 久久久精品久久久久三级 | 精品视频国产狼人视频 | 在线a网站| 久久精品国产免费观看99 | 牛人盗摄一区二区三区视频 | 久久99精品久久久久久综合 | 精品一区二区高清在线观看 | 亚洲人成综合在线播放 | 国产午夜毛片一区二区三区 | 国产成人a毛片在线 | 男女男精品视频网站在线观看 | 99国产精品视频免费观看 | 在线视频观看免费视频18 | 免费a级毛片无码 | 岛国毛片在线观看 | 精品国产美女福利到在线不卡 | 亚洲国产亚洲片在线观看播放 | 天堂精品高清1区2区3区 | 一区二区三区 亚洲区 | 久久国产亚洲 | 久久网站在线观看 | 国产精品久久久 | 国产视频二区 | 国产成人精品综合网站 | 米奇精品一区二区三区在线观看 | 中文字幕一级毛片 | 日韩欧美中文字幕在线视频 | 久久综合给会久久狠狠狠 | 亚洲高清视频免费 | 免费观看一级欧美大 | 精品国产香蕉伊思人在线 | 国产成人久久精品麻豆二区 | 亚洲加勒比 | 国产精品一区高清在线观看 | 日韩中文字幕在线视频 | 最新亚洲国产有精品 |