您正在瀏覽的是香港網站,香港證監會BJA907號,投資有風險,交易需謹慎
GPU三巨頭開啓競爭新時代

隨着GPU在數據中心當中的應用越來越普及,原本用於CPU的MCM(多芯片封裝模塊)開始向GPU領域滲透,特別是在高性能計算領域,在業界受到了越來越多的關注。

近日,在AMD第二季度財報中,該公司確認了其具有第二代 CDNA 架構的下一代 Instinct MI200加速器的初始出貨量。據悉,MI200配置了Aldebaran GPU,這是一個雙芯片處理器,採用了MCM封裝。該GPU開始出貨,標誌着AMD成爲第一家向客戶交付採用MCM技術的GPU公司,領先於競爭對手英特爾和英偉達(NVIDIA)。

 

何爲MCM?

 

MCM是由同一器件中的多個Die(兩個或更多)組成的電子封裝系統。它安裝在基板上,襯底上的管芯由導線連接。

與傳統架構(如用於GPU的SLI和CrossFire)相比,MCM可提供更高的性能,並減小組件的尺寸。通過MCM封裝系統,器件或模塊可以克服重量和尺寸限制,並提供超過30%的效率。

MCM的優點可以概括如下:更高的可靠性;更靈活地集成不同的半導體技術;通過減少陣列之間互連的長度來提高性能;尺寸更小;產品可快速上市;降低了複雜性並簡化了設計。

通常,MCM模塊有3種類型,具體取決於基板技術:MCM層壓 ( MCM-L )、沉積 ( MCM-D ) 和陶瓷 ( MCM-C )。

以前,MCM主要用於CPU,最近逐步進入GPU領域。

 

MCM用於GPU的優勢和挑戰

 

MCM GPU與傳統帶有多個GPU的顯卡之間的最大區別在於,前者是一個單獨的封裝,後者是一個PCB板卡,前者的板載橋接器取代了兩個獨立顯卡之間的Crossfire或SLI橋接器。

傳統的SLI 和 CrossFire需要 PCIe 總線來交換數據、紋理、同步等。由於GPU之間的渲染時間會產生同步問題,因此在許多情況下,傳統的雙GPU顯卡,即單個PCB上的兩個芯片由它互連,每個芯片都有自己的VRAM。SLI或CrossFire的能耗很大,冷卻也是一個挑戰,這些在很長一段時間內都困擾着工程師。

MCM GPU就是爲了解決以上問題而出現的。不過,MCM GPU並不完美,它同樣面對着諸多技術挑戰和難題。

在進行MCM GPU設計之前,需要解決封裝和互連方面的軟件問題,因爲兩個或更多GPU,無論多麼緊密地連接在一起,要想在一起協同工作,並不是一件容易的事。MCM作爲能夠用於並行處理的組件,其GPU之間使用不同的內存訪問,設計的複雜性會成倍增加。這需要開發人員在軟件方面進行大量“修補”。在消費級的PC應用方面,很少有遊戲玩家實際運行多GPU設置,因爲其回報很少,因此沒有人願意做這麼多的軟件工作。不過,如果應用於數據中心和雲計算,情況就不同了,這樣的高性能計算應用對GPU提出了更高的要求。雖然多芯片GPU系統還是新生事物,許多圖形工作負載不能很好地擴展(有些甚至根本不能擴展),但每臺服務器有多個GPU,由於具有超級計算和數據中心的並行化性質,這就可以很好地擴展工作量。

而如果能解決MCM GPU的瓶頸問題,回報將是誘人的。這也正是MCM GPU首先出現在數據中心應用領域的主要原因,今後,隨着技術的不斷成熟,以及PC應用性能的提升,其在消費電子領域的應用也將會出現。

 

三強爭霸

 

在企業界,最早應用MCM技術的是IBM,那是在上世紀70年代和80年代之間,主要用於該公司的POWER架構CPU。而將MCM發揚光大的是英特爾,自然也是用於CPU。2013年,該公司的22nm製程處理器Haswell就用到了該技術。2014年,14nm製程的Broadwell 架構問世,這是一個SoC平臺,它使用了“堆疊”基板架構,也就是MCM,將多個陣列垂直堆疊在了一起。

最近幾年,英特爾開始研發獨立的GPU,也就是其Xe架構產品,爲了順應技術發展和應用需求,該公司開始將MCM應用於其最新的GPU產品,據悉是基於Xe HPC架構的Ponte Vecchio加速器,但具體問世時間還未確定。

AMD則快人一步。2020年,該公司把遊戲卡與專業卡的GPU架構分家了,遊戲卡的架構是RDNA,而專業卡的架構叫做CDNA,首款產品是Instinct MI100系列。今年6月,AMD首席執行官蘇姿豐博士提到了CDNA 2架構及其產品,表示會在年內推出,不久前發佈的Q2財報則確認CDNA 2 GPU已經向客戶發貨了。CDNA 2基於CDNA架構,是專爲數據中心設計的。

近日,AMD更新了CDNA 2的說明,其GPU核心代號是Aldebaran,它會成爲AMD第一款採用MCM多芯片封裝的產品,也就是Instinct MI200。Aldebaran是AMD的第一款MCM GPU,但它是爲數據中心準備的。在PC方面,2022年引入下一代RDNA 3架構後,基於MCM的消費級Radeon GPU也會出現。

據悉,採用MCM封裝的CDNA 2內部將整合兩個Die,每個芯片上有128組CU單元,如果每組CU還是128個流處理器的話,預計會擁有16384個流處理器,預計還會搭載128GB的HBM2e顯存,而目前的Instinct MI100只有7680個流處理器,搭載32GB的HBM2顯存。

製造多芯片計算 GPU 類似於製造多核 MCM CPU,例如Ryzen 5000或Threadripper處理器。首先,將芯片靠得更近可以提高計算效率。AMD 的 Infinity 架構確保了高性能互連,有望使兩個芯片的效率接近一個的。其次,使用先進的工藝技術批量生產多個小芯片比大芯片更容易,因爲小芯片通常缺陷較少,因此比大芯片的產量更好。

AMD 的合作夥伴HPE證實,即將推出的 Frontier 超級計算機將使用 AMD 代號爲 Trento CPU(最有可能是具有額外緩存或其他增強功能的 Milan 版本)和 Instinct MI200 加速器,成爲世界上最快的超級計算機,峯值性能爲 1.5 ExaFLOPS。

除了AMD和英特爾,另一大GPU廠商英偉達也在摩拳擦掌,很可能緊隨AMD之後推出其首款MCM GPU產品Hopper。

據悉,Hopper GPU架構是爲數據中心應用專門設計的,與英偉達的Ampere架構產品不同,後者同時服務於 GPGPU(數據中心/工作站)和遊戲市場。

早期的爆料稱,Hopper由兩個稱爲GPM 的GPU 模組構成,每個模組有144 個SM 單元,同時Hopper 由於是專爲運算所規劃的架構,相較Ampere 應該會取消用於光線追蹤加速的RT Core ,並強化包括FP64 、 FP16 與Tensor Core 等運算與AI 技術會使用到的單元。

據悉,Hopper GPU 將採用臺積電的5nm製程工藝,性能比 Ampere 提高 3 倍。這是一個很大的提升,具體情況如何,還要看今後爆出的更多關於Hopper的信息。

有報道稱,Hopper GPU很快就會流片。

據悉,推出Hopper GPU之後,英偉達還將推出Ampere Next 和 Ampere Next Next,它們將採用MCM封裝。Ampere Next GPU 預計在 2022 年推出,而 Ampere Next Next 將在 2024 年推出。

 

結語

 

MCM的自身特點使其在高性能計算領域如魚得水,不只是是CPU,如今在GPU領域也得到了拓展,而隨着數據中心、邊緣雲、物聯網的發展,以及CPU、GPU、DPU等產品形態的日益增多和複雜,留給MCM的發展空間可能會越來越大。

新技術產品和應用的發展給以MCM爲代表的芯片封裝、整合技術提供了更多的想象空間。

關注uSMART
FacebookTwitterInstagramYouTube 追蹤我們,查閱更多實時財經市場資訊。想和全球志同道合的人交流和發現投資的樂趣?加入 uSMART投資群 並分享您的獨特觀點!立刻掃碼下載uSMART APP!
重要提示及免責聲明
盈立證券有限公司(「盈立」)在撰冩這篇文章時是基於盈立的內部研究和公開第三方資訊來源。儘管盈立在準備這篇文章時已經盡力確保內容為準確,但盈立不保證文章資訊的準確性、及時性或完整性,並對本文中的任何觀點不承擔責任。觀點、預測和估計反映了盈立在文章發佈日期的評估,並可能發生變化。盈立無義務通知您或任何人有關任何此類變化。您必須對本文中涉及的任何事項做出獨立分析及判斷。盈立及盈立的董事、高級人員、僱員或代理人將不對任何人因依賴本文中的任何陳述或文章內容中的任何遺漏而遭受的任何損失或損害承擔責任。文章內容只供參考,並不構成任何證券、金融產品或工具的要約、招攬、建議、意見或保證。
投資涉及風險,證券的價值和收益可能會上升或下降。往績數字並非預測未來表現的指標。
uSMART
輕鬆入門 投資財富增值
開戶