本文來自格隆匯專欄:半導體行業觀察
現代圖形處理單元 (GPU) 最初是作為 Windows 視頻遊戲的加速器,但在過去 20 年中已演變為用於高性能計算和人工智能應用程序的企業服務器處理器。
現在,GPU 在超級計算、人工智能訓練和推理、藥物研究、金融建模和醫學成像中處於性能領先地位。在 CPU 不夠快的情況下,它們也被應用於更主流的任務,例如在 GPU 驅動的關係數據庫中。
隨着對 GPU 需求的增長,為服務器製造 GPU 的供應商之間的競爭也越來越激烈。
這三個供應商認識到數據中心對 GPU 的需求是一個不斷增長的機會。這是因為 GPU 比 CPU 更適合處理企業數據中心和超大規模網絡中人工智能和機器學習所需的許多計算。CPU可以處理工作,但需要更長的時間。
由於 GPU 旨在通過將複雜的數學問題分解為它們同時處理的單獨任務來並行解決複雜的數學問題,因此它們可以更快地解決這些問題。為了實現這一點,它們具有多個內核,比通用 CPU 多得多。例如,Intel 的 Xeon 服務器 CPU 有多達 28 個內核,而 AMD 的 Epyc 服務器 CPU 有多達 64 個。相比之下,Nvidia 當前一代的 GPU Ampere 有 6,912 個內核,所有內核並行運行以做一件事:數學處理,特別是浮點數學。
GPU 的性能是通過它們每秒或 FLOPS 可以執行多少次浮點數學運算來衡量的。此數字有時指定進行測量時使用的標準化浮點格式,例如 FP64。
那麼服務器 GPU 的這一年會怎樣呢?事實證明,相當多。英偉達、AMD 和英特爾已經將他們的近期計劃擺在桌面上,看起來這將是一場激烈的競爭。
英偉達在 3 月份發佈了其Hopper GPU架構,並宣佈了其今年的 GPU 路線圖。根據使用情況,它可以提供其先前架構 Ampere 的三到六倍的性能,速度為 9.7 TFLOPS FP64。Nvidia 表示,Hopper H100 的 FP64 性能將達到 60TFLOPS。
與以前的 GPU 一樣,Hopper H100 GPU 可以作為獨立處理器運行,在服務器的附加 PCI Express 板上運行。但英偉達還將把它與定製的 Arm 處理器上的 CPU 配對,該處理器名為 Grace,它開發並預計在 2023 年上市。
對於 Hopper,Nvidia 所做的不僅僅是增強 GPU 處理器。它還修改了通常用於智能手機的低功耗雙倍數據速率 (LPDDR) 5 內存,以創建 LPDDR5X。它支持糾錯碼 (ECC) 和兩倍於傳統 DDR5 內存的內存帶寬,吞吐量為 1TBps。
與 Hopper 一起,Nvidia 宣佈了其最新的 GPU 到 GPU 互連 NVLink 4。NVLink 4C2C 允許 Hopper GPU 直接相互通信,最大總帶寬為 900GB——比通過 PCIe Gen5 總線連接快七倍。
“如果您考慮數據中心產品,您將擁有三個組件,並且它們都必須以相同的速度向前發展。那就是內存、處理器和通信,”Jon Peddie Research 總裁 Jon Peddie 説。“而 Nvidia 已經通過 Hopper 做到了這一點。這三種技術不會同步發展,但英偉達已經做到了。”
Nvidia 計劃從 2022 年第三季度開始出貨 Hopper GPU。而其OEM 合作伙伴包括 Atos、BOXX Technologies、Cisco、Dell Technologies、Fujitsu、GIGABYTE、H3C、Hewlett Packard Enterprise、Inspur、Lenovo、Nettrix 和 Supermicro。
由於其芯片製造商台積電的持續供應壓力,英偉達打開了可能與英特爾的代工業務合作的大門,但警吿稱這樣的交易將需要數年時間。
AMD 逆風而行。銷售額逐季增長,x86 CPU 市場份額不斷增長,2 月份完成了對 Xilinx 及其現場可編程門陣列 (FPGA)、自適應片上系統 (SoC)、AI 引擎和軟件專業知識的收購. 預計 AMD 將在 2022 年底推出其 Zen 4 CPU。
AMD 基於其 RDNA 3 架構的新遊戲 GPU 也將於今年推出。
AMD 一直對 RDNA 3 規格守口如瓶,但遊戲愛好者的博主已經散佈了未經證實的消息,即性能比 RDNA 2 提高了 50% 到 60%。
與此同時,AMD 已經開始推出用於企業計算的Instinct MI250系列 GPU 加速器,新產品比之前的 MI100 系列快得多,內存總線從 4096 位翻倍到 8192 位,內存帶寬從 1.23TBps 翻了一倍多到 3.2TBps,性能從 FP64 的 11.5 TFLOPS 翻了兩番多到 47.9TFLOPS。這比 AMD 的 Hopper 60TFLOPS 慢,但它仍然具有競爭力。
Futurum Research 首席分析師 Daniel Newman 表示,AMD 搶佔市場份額的機會將隨着 AI 市場的增長而到來。他表示,他相信 AMD 在 CPU 市場上的成功可以幫助其 GPU 銷售。
“AMD 在過去五七年真正創造的是一種非常強大的忠誠度,這種忠誠度可能會延續下去,”他説。“問題是,他們能否顯着增加 AI/HPC 市場份額?”
他説答案可能是“是的”,因為該公司一直非常擅長尋找市場機會和管理其供應鏈以實現其目標。在首席執行官 Lisa Su 的掌舵下,“我發現在他們決定在這一點上競爭的任何領域都很難排除 AMD,”他説。
Omdia 高級計算、人工智能和物聯網首席分析師 Jonathan Cassell 表示,他認為 AMD 在 Epyc 服務器 CPU 方面的成功將為 Instinct 處理器提供一個機會。
“我認為,隨着時間的推移,我們可以看到 AMD 在數據中心微處理器方面利用其成功,並利用這一點讓公司瞭解 [Instinct]。我認為我們將看到 AMD 試圖利用其與客户的關係來擴大其在國外的影響力,”他説。
Instinct 自 2022 年第一季度以來一直在發貨。到目前為止,其最引人注目的用例是橡樹嶺國家實驗室的一台超級計算機,它將大量性能打包到一個非常小的空間中。但這些實驗室也在建造一台名為 Frontier 的全 AMD 百億億級超級計算機,這將於今年晚些時候部署。Instinct 提供產品的 OEM 合作伙伴包括華碩、ATOS、戴爾科技、技嘉、惠普企業 (HPE)、聯想、企鵝計算和 Supermicro。
長期以來,英特爾一直在努力為其台式機 CPU 製造除基本集成 GPU 之外的任何產品。對於台式機,它擁有新的 Intel Xe 系列,而服務器等效產品稱為 Intel Server GPU。
現在,該公司表示今年將使用代號為 Ponte Vecchio 的處理器進入數據中心 GPU 領域,據報道該處理器在 FP64 時可提供 45TFLOPS——幾乎與 AMD 的 MI250 相同,比 Nvidia 的 Hopper 落後 25%。
“這真的會破壞環境,”佩迪説。“從他們吿訴我們的情況來看——我們從謠言和其他泄密事件中聽到——它非常具有可擴展性。” Ponte Vecchio 將於今年晚些時候推出。
Newman 也聽到了關於 Ponte Vecchio 的積極消息,但表示英特爾的真正機會在於其oneAPI 軟件戰略。
oneAPI 是該公司正在開發的統一軟件開發平台,旨在在編譯應用程序時選擇英特爾製造的最合適的芯片類型(x86、GPU、FPGA、AI 處理器),而不是強迫開發人員選擇一種類型的芯片並對其進行編碼。它還為視頻處理、通信、分析和神經網絡等功能提供了許多 API 庫。
這種抽象消除了確定最佳目標處理器的需要,以及使用不同工具、庫和編程語言的需要。因此,開發人員可以專注於業務邏輯並使用 Data Parallel C++ (DPC++) 編寫代碼,而不是使用特定語言對特定處理器進行編碼,DPC++ 是 C++ 的一種開源變體,專為數據並行和異構編程而設計。
將英特爾與 Nvidia 和 AMD 區分開來的一個因素是它製造芯片的地方。雖然其他公司使用台灣芯片製造商台積電,但英特爾在美國生產許多自己的芯片,在愛爾蘭、馬來西亞和以色列設有其他工廠。並且 intel有在美國建造更多晶圓廠的宏偉計劃。卡塞爾説,這給了它一定的優勢。“[它擁有]對自己製造的控制權使其以某種方式控制了自己的命運,”他説。“我將這些東西視為公司的資產。”
紐曼説,英偉達、AMD 和英特爾之間的競爭最終可能歸結為軟件競賽。“如果你問 [Nvidia 的] 頂級工程師,他們會説我們不是一家芯片公司。我們是一家軟件公司。我真的相信英特爾到目前為止還沒有像軟件公司那樣真正考慮過人工智能,但如果他們能夠正確地 [oneAPI],我看到了一些真正的機會,”他説。