AMD的CEO一一Lisa Su在5月31日召開的“COMPUTEX TAIPEI Virtual”上做了基礎演講,同時介紹了AMD的最新產品、技術。本文,筆者就AMD發布的“3D Chiplet Technology”展開敘述。
AMD的CEO一一Lisa Su公布了采用了3D Chiplet Technology的“Ryzen 5000 Series 3D Chiplet Prototype”。(圖片出自:pc.watch)
“3D Chiplet Technology”是通過應用于客戶端PC的“Ryzen”或者應用于服務器方向的“EPYC”導入2D芯片混搭技術的3D 版本的“Chiplet Technology”。以往是在Package的橫方向搭載數個芯片,而3D Chiplet Technology采用的是一種被稱為CDD的技術,即在CPU芯片上縱向搭載SRAM的“芯片堆疊(Die Stacking)”技術。
英特爾也于2018年12月發布了被稱為“Foveros”的3D 堆疊技術,已于2020年作為“Intel Core processors with Intel Hybrid Technology”(研發代碼:Lakefield)而投產。
由上可知,封裝技術(即將芯片封裝在基板上)是繼處理器架構、制造技術之后的第三個競爭核心。
英特爾最大40核、AMD為64核,秘密在于Chiplet
第三代Xeon SP (Xeon Platinum 8830,40核)、第三代EPYC(EPYC 7763,64核,右側)、EC站點服務器的基準數據。Lisa Su稱,第三代EPYC的性能提高了50%。(圖片出自:pc.watch)
在此次的COMPUTEX TAIPEI Virtual上的基礎演講中,AMD的CEO一一Lisa Su對AMD三月份發布的第三代EPYC處理器(以下簡稱為第三代:EPYC,研發代碼:Milan)和英特爾四月份發布的第三代Xeon Scalable Processors(以下簡稱為:第三代Xeon SP,研發代碼:Ice Lake)進行了比較。
前者為64核的EPYC 7633,后者為40核的Xeon Platinum8380。Lisa Su表示,如果是用于EC(電子商務)的服務器的話,EPYC7763的性能要高出50%。
服務器的工作負荷(Workload)極其復雜,也并不是由一個應用發揮其他多個應用的性能,因此,此處暫時不做敘述。
AMD的處理器在性能上遠遠超過英特爾的最大理由是,CPU核數多于英特爾。當我們比較一個封裝基板的時候,AMD的最高核數為64,英特爾為40。
英特爾的第三代Xeon SP與第三代的EPYC的差異。
(圖片出自:pc.watch)
那么,為什么AMD的CPU核數多呢?其答案在于“封裝技術”。
就英特爾的第三代Xeon XP而言,在被稱為“傳統的單一芯片(Traditional Monolithic Die )”的Package中有一個芯片(Die)。而40個CPU核被封裝在一個芯片(Die)里,不僅很難生產單個的芯片,而且很難提高良率(可采用的芯片數量占總生產數量的比例)。
與此相對,AMD的EPYC采用的是被稱為“Chiplet Technology”的封裝技術。Chiplet上混搭有被稱為CCD(Core Chiplet Die)的CPU核的芯片和IOD(I/O Die)。
CCD上的一個芯片由8核的CPU構成,與用于客戶端PC的Ryzen等一樣,如果是臺式PC的話,由1個CCD1和IOD組成的八核產品可更改為由2個CCD和IOD組成的16核產品。如果是服務器的話,組成結構為8個CCD、1個IOD(為最大限度),即可組成的產品為:8核x8=64核。
結果就在Lisa Su講的產品性能比較表中,用于臺式PC的Ryzen的核數之所以超過英特爾的用于臺式PC的核處理器,也是一樣的道理,可以說,近幾年來AMD獲得飛躍式進步的最大的理由也在于Chiplet的應用。
將Chiplet以3D方向擴張的“3D Chiplet Technology”,在一個CCD上搭載64MB的SRAM
3D Chiplet Technology的構造。
(圖片出自:pc.watch)
如果說AMD的Chiplet是在Package內部橫向展開的話,那么,在COMPUTEX TAIPEI上發布的“3D Chiplet Technology”就是在Package的縱向堆疊芯片。
AMD此次發布的產品如下,在CCD的芯片上,堆疊由7納米工藝制造的SRAM,將64MB的SRAM芯片堆疊在Zen 3基的CPU核上,SRAM的左右兩邊用硅填充。
芯片和芯片之間采用TSV(Through Silicon Via)技術,穿透CPU芯片上的孔后,與CPU的中介層(Interposer)直接連接。因此,不需要在中間插入基板,可直接將芯片連接,且CPU和SRAM之間可以進行高速通信。
Lisa Su表示,SRAM 是作為L3 CACHE來工作的(此外,On-die的SRAM也可繼續作為L3 CACHE來使用)。當然,On-die的SRAM可以高速工作、且可以減少內存延遲(Memory Latency),但是像這次的Off-die的話,內存延遲會增加。但是,由于容量增加了,也可以提高性能。
Ryzen 9 5900X和Ryzen 5000 Series 3D Chiplet Prototype的區別,此圖為筆者制作。(圖片出自:pc.watch)
此次Lisa Su展示的樣品有以下,Ryze 9 5900 X以及采用了被稱為“Ryzen 5000 Series 3D Chiplet Prototype”的3D Chiplet Technology的產品。
Ryzen 9 5900X內置了兩個CCD(CPU的核數為12,1個CCD 有六個核,所以6核X2個CCD),搭載64MB的L3 CACHE。5900X中,8核的CCD有兩個,每個CCD的L3 CACHE為32MB。
即,整個封裝為192MB,搭載有現有產品(64MB)三倍的L3 CACHE。
(圖片出自:pc.watch)
Ryzen 9 5900X和Ryzen 5000 系列3D Chiplet Technology的性能比較、平均可以提高15%的性能。(圖片出自:pc.watch)
從Lisa Su公開的資料來看,比較了Ryzen 9 5900 X(12 核、L3 CACHE 、64MB)和Ryzen 5000 系列3D Chiplet Technology(12核,192MB)在游戲時的幀速率, 發現后者高出前者12%。放入其他游戲中比較后發現,性能高出約15%。
L3 CACHE的容量增加即意味著內存延遲(CPU讀取到存儲器數據的延遲)的減少,出現這樣的效果的原因在Lisa Su的演講中。
Lisa Su明確表示,3D壓層的SRAM 會在今年(2021年)年末發布。由于名稱不是“Ryzen 6000 系列”,而是“Ryzen 5000 系列3D Chiplet Technology”,因此,會作為Ryzen 5000系列的追加SKU投入。
此外,Lisa Su還表示,5納米的“Zen 4”世代的產品在明年(2022年)投入。由于TSMC的5納米工藝已經用于生產蘋果的M1,因此生產技術已經十分成熟。
英特爾計劃在未來的產品中使用3D 堆疊技術一一“Foveros”
英特爾去年(2020年)發布的“Intel processors with Intel Hybrid Technology(研發代碼:Lakefield)”的結構。基底(Substrate)上有I/O芯片、CPU/GPU芯片、DRAM,三層結構。(圖片出自:pc.watch)
但是,這種單層構造并不是AMD的專利,英特爾也在將同樣的技術應用于產品。在2018年的Intel Architecture Day上,公布的“Foveros”即為3D壓層技術。
后來,Foveros作為2020年投產的“Intel Core processors with Intel Hybrid Technology(研發代碼:Lakefield)”的芯片壓層技術,而被應用。就Lakefield的芯片壓層而言,將由10納米工藝生產的CPU/GPU芯片、22納米工藝生產的PCH按照3D方向封裝,雖然與AMD(以SRAM為壓層對象)的應用不同,但是基本思想是一致的。