芯片封裝環節的“雙芯疊加”技術最近備受業界關注。
引爆點是蘋果公司在3月9日凌晨推出的用于PC的M1 Ultral芯片,該芯片號稱是有史以來最強悍的芯片,但該芯片實現性能提升的途徑不是制造工藝的提升,而是在封裝環節將兩個M1 Max通過內部互連而成。事實上,在M1 Ultral推出之前,一家叫做Graphcore的英國AI公司,也推出了新款AI處理器Bow IPU。這兩款新品采用同一種封裝技術——3D Wafer-on-Wafer提升性能,這項技術來自于中國臺灣的臺積電。
事實上,華為海思去年也曾經被爆出“雙芯疊加技術”專利,通過芯片疊加并經過系列優化,讓14納米芯片可以比肩7納米芯片的性能水平。“X86雙雄”英特爾和AMD也曾經推出過類似的產品,但當時存在功耗和發熱等方面的缺陷。而蘋果M1 Ultral的推出并商用,似乎意味著通過“芯片疊加”在封裝環節大幅提升芯片性能的技術已趨成熟。
“晶圓工藝和封裝工藝協同結合,是必然趨勢。”半導體研究機構芯謀研究的研究總監王笑龍這樣告訴《中國經營報》記者,“7納米已經很先進,而3D封裝也是提升這個產品綜合指標的一個重要手段。”
而接受記者采訪的多位業內分析人士均指出,隨著芯片制造工藝越來越逼近物理極限,摩爾定律逐漸失效,依靠更先進的工藝來提升芯片性能將變得越來越困難,而3D等先進封裝技術對延續摩爾定律愈發重要。
“這個(Bow IPU)證明了先進封裝可以為性能帶來可觀提升,先進封裝技術,是大家探索超越摩爾定律的路徑之一。”Graphcore大中華區總裁兼全球首席營收官盧濤表示。
先進封裝對芯片性能帶來可觀提升
作為全球第一款3D封裝的處理器,Bow IPU采用了臺積電SoIC-WoW技術,該技術以類似于3D NAND閃存多層堆疊那樣,將兩層die(裸片)以鏡像方式垂直堆疊起來,以更先進的封裝技術提升芯片性能。
需要指出的是,這是一種用于硅晶圓的3D堆疊形式,使得單個封裝芯片中的晶體管數突破了600億個大關。此外,Bow IPU的理論AI算力也從250 TeraFLOPS(每秒萬億次浮點運算)提升到了350 TeraFLOPS。據Graphcore介紹,總體而言,第三代IPU相對于上一代性能提高40%,能耗比實現了16%的提升。
事實上,Bow IPU的堆疊并不算特別復雜,主要負責計算、存儲的IPU die位于下層,上方的die則主要為供電、節能等方面的功能提供幫助。盧濤曾這樣介紹Bow IPU的die設計:“這是個大小die的設計,大die是計算die,小die主要做電源、能耗等方面相關的管理。”
盧濤表示,Bow IPU整體性能提升一方面來自新增的die,另一方面則得益于3D封裝技術。那么,Graphcore為何沒有選用更先進的工藝而選擇改變封裝方式?
對此,盧濤進一步指出,上一代IPU已經有了594億個晶體管,面積大概為823平方毫米,這可能是7納米的單個die能生產的最精密芯片了。如果想再提升,不換工藝,就只能是換封裝。
“在經過深入評估之后,Graphcore認為,選擇更先進的工藝并不能像以前那樣獲得大幅度的性能提升。而從成本收益角度看,也不劃算。于是,我們選擇了3D Wafer-on-Wafer作為芯片性能提升新方法。正是得益于這個決定,使得我們新芯片即使面積稍有上升,但成本與上一代比較相近,最終讓我們可以以不變的價格交付新芯片。”盧濤說。
對此,電子創新網CEO張國斌也持有類似觀點。“現在摩爾定律放緩,再往先進工藝演進的話,成本投入太大,不是一般公司能承受的,所以大家就認為延續摩爾定律的一個方法就是往2.5D和3D封裝的方向發展。”他指出,Bow IPU這個產品代表的不是一個小眾趨勢,反而是一種大趨勢,就是芯片以后要提升性能,可能會走2.5D/3D這種封裝形式。
張國斌表示,對于晶圓級封裝技術,不只是英特爾、格芯、臺積電、三星等大的晶圓廠在研究,包括日月光等一些芯片封裝企業也在研究,這對推動芯片的性能提升非常有好處。
商業場景落地和社區建設伴生而行
公開資料顯示,作為一家人工智能硬件初創公司,Graphcore于2016年正式成立,IPU是該公司主要的技術成果,也是向外界傳播的概念,官網宣稱IPU是一款專為AI計算而設計的全新處理器。
長期關注半導體/芯片行業發展的資深觀察人士黃燁鋒表示,在AI芯片領域,Graphcore是全球最知名、最有實力的那批AI公司中的一個,也是在中國市場投入比較大的初創企業。“這家公司做AI芯片相對較早,勉強說引領發展趨勢也行。不過,AI芯片的發展方向現在逐漸明朗化,未來大家都會越做越像。”他說。
黃燁鋒進一步指出,諸如較大的片上存儲空間、高度并行計算能力、跨芯片通信機制、芯片具備弱可編程性等都是AI芯片未來發展的趨勢,而Graphcore的IPU是較早且在近存計算上頗具代表性的一類兼具可編程性的AI芯片。
落地難,是AI行業的通病,雖然AI芯片一直在持續發展,但落地的速度比預期的慢。作為AI芯片行業的企業,未來Graphcore將如何進一步發展以及加速商業化,對于行業具有參考價值。
盧濤曾把現在的AI芯片公司分成七大類,第一類是在組建團隊的,第二類是在宣講理念的,第三類是有了芯片的,第四類是有了芯片給客戶送測的,第五類是有落地的,第六類是有很多場景落地的,第七類是真正能夠跟GPU(圖形處理器)分市場份額的。
“Graphcore目前處在第五至第六的階段。”盧濤表示,要達到第七類,Graphcore首先要做的是生態建設,二是持續耕耘開發者與研究者社區的建設,三是與用戶和客戶保持充分的溝通,建立緊密的聯系。
他還表示:“生態建設是一個持續的、需要花力氣、花時間、花精力、花巧勁的活兒,因為用戶在選擇一個平臺的時候,一是會很關注新的平臺能為自己帶來什么價值,二是會特別關注遷移到新的平臺所需要耗費的工作量。生態建設越完備、生態發展得越好,用戶的遷移成本就會越低,也就是用戶在遷移到IPU時遇到的潛在阻力也會更小。”
其實,Graphcore這一發展策略有著英偉達的影子。“當年GPU從專用的圖形處理器發展到后來可實現CUDA編程和應用于AI之時,就是英偉達將更多注意力轉向軟件、工具,完善開發生態的過程。像IPU這樣的AI處理器也必然經歷這樣的過程。”黃燁鋒說,Graphcore現在的發展關鍵更在于生態構建與實實在在的場景落地上。
對于公司的商業化進程,盧濤曾表示:“我很早就和CEO(Nigel Toon)聊過,公司的第一優先級是有人用我們的產品;第二是有人用了這個產品,服務他的業務;第三是業績;第四才是利潤。現有順序不能弄錯,先得有人用你的東西,才能談其他。”
如今,這樣的順序依舊沒有變。“商業場景落地和社區建設是相互支持、伴生而行的。針對商業客戶,我們需要開發者對平臺的支持,開發者花費時間和精力將自己的業務遷移到IPU上,或基于IPU開發自己的業務。落地的場景越多,越能推進其他商業用戶的跟進和加入,也能加快后續其他案例落地的速度。”盧濤告訴記者。
過去一年中,Graphcore與升哲科技、安捷中科、深勢科技等公司圍繞包括城市治理、氣象以及分子動力學等領域開展合作,還與金山云推出了基于Graphcore IPU平臺的服務器產品——金山云IPU服務器,用于AI任務在云端的訓練和推理,這也是中國首個大型公有云廠商對外公開推出自己的IPU云產品。
“我們會持續深耕本地的合作伙伴,在一些相關的AI應用領域,會做進一步的加深合作,比如用AI輔助科研、自動駕駛等,都是我們2022年在AI應用和垂直領域中比較重要的方向。”盧濤說,持續落地更多應用場景是商業化唯一的路徑,“這里沒有捷徑可以走。”