卷完模型卷芯片！圍攻英偉達，三大巨頭再出招

uSMART盈立智投 04-19 15:32

圍繞着數據中心的創新遠未接近停止，甚至可以說因爲大模型的流行，這場戰鬥纔剛剛開始。

替換$英偉達(NVDA.US)$，甚至說幹掉英偉達已經不是什麼新鮮事了。

憑藉其PU的領先優勢，英偉達過去幾年炙手可熱，乘着ChatGPT熱潮，公司的市值從今年年初至今更是大漲近90%，過去五年的漲幅更是超過200%。雖然GPU是英偉達的最重要倚仗，但這絕不是美國芯片“當紅炸子雞”的唯一武器。

通過過去幾年的收購和自研，英偉達已經打造起了一個涵蓋DPU、CPU和Switch，甚至硅光在內的多產品線巨頭，其目的就是想在一個服務器甚至一個機架中做很多的生意。但和很多做GPGPU或者AI芯片的競爭對手想取替GPU一樣，英偉達的“取替”計劃似乎也不是不能一帆風順。

近日，三巨頭更是再次出手，想把英偉達拒之門外。

01 博通芯片，瞄準Infiniband

熟悉$博通(AVGO.US)$的讀者應該知道，面向Switch市場，美國芯片巨頭擁有三條高端產品線，分別是面向高帶寬需求的Tomahawk、面向更多功能的 Trident，以及雖然帶寬不高，但是卻擁有更深的Buffer和更高可編程性的Jericho。

近日，他們帶來了Jericho系列最新的產品Jericho3-AI。在他們看來，這是比英偉達Infiniband更適合AI的一個新選擇。

據博通所說，大公司（甚至英偉達）都認爲 AI 工作負載會受到網絡延遲和帶寬的限制，而Jericho3-AI 的存在則旨在減少 AI 訓練期間花在網絡上的時間。其結構的主要特性是負載平衡以保持鏈路不擁塞、結構調度、零影響故障轉移以及具有高以太網基數（radix）。

利用這一獨特的功能，與 All-to-All 等關鍵 AI 基準測試的替代網絡解決方案相比，Jericho3-AI 結構的工作完成時間至少縮短了 10%。這種性能改進對降低運行 AI 工作負載的成本具有乘法效應，因爲它意味着昂貴的 AI 加速器的使用效率提高了10%。此外，Jericho3-AI 結構提供每秒 26 PB 的以太網帶寬，幾乎是上一代帶寬的四倍，同時每千兆比特的功耗降低 40%。

此外，Broadcom 表示，因爲它可以處理 800Gbps 的端口速度（對於 PCIe Gen6 服務器）等等，所以它是一個更好的選擇。對於將“AI”放在產品名稱中，Broadcom 並沒有做出過多解讀，甚至關於網絡 AI計算功能，他們也沒涉及，這着實讓人摸不着頭腦，因爲這是英偉達Infiniband 架構的主要賣點。

儘管如此，Broadcom 表示其 Jericho3-AI 以太網在 NCCL 性能方面比 NVIDIA 的 Infiniband 好大約 10%。

02 微軟，自研芯片再曝進展

因爲ChatGPT大火的企業除了英偉達外，作爲ChatGPT投資人的$微軟(MSFT.US)$也備受關注。爲了發展ChatGPT，微軟已經搶購了不少GPU。隨着算力需求的增加，微軟在後續必須要更多的芯片支持。

據路透社引述The Information 的報道，微軟公司正在開發自己的代號爲“Athena”的人工智能芯片，該芯片將爲 ChatGPT 等人工智能聊天機器人背後的技術提供支持。

根據該報告，這些芯片將用於訓練大型語言模型和支持推理——這兩者都是生成式人工智能（AIGC）背後的關鍵技術，例如 ChatGPT 中使用AI 來處理大量數據、識別模式並創建新的輸出來模仿人類對話。報告稱，微軟希望該芯片的性能優於目前從其他供應商處購買的芯片，從而爲其昂貴的 AI 工作節省時間和金錢。

雖然目前尚不清楚微軟是否會向其 Azure 雲客戶提供這些芯片，但據報道，這家軟件製造商計劃最早於明年在微軟和 OpenAI 內部更廣泛地提供其 AI 芯片。據報道，該芯片的初始版本計劃使用臺積電 (TSMC) 的 5 納米工藝，不過作爲該項目的一部分，可能會有多代芯片，因爲微軟已經制定了包括多個後代芯片的路線圖。

據報道，微軟認爲自己的 AI 芯片並不能直接替代 Nvidia 的芯片，但隨着微軟繼續推動在Bing、Office 應用程序、GitHub和其他地方推出 AI 驅動的功能，內部的努力可能會大幅削減成本。研究公司 SemiAnalysis 的 Dylan Patel 也告訴The Information，“如果 Athena 具有競爭力，與 Nvidia 的產品相比，它可以將每芯片的成本降低三分之一。”

關於微軟造芯，最早可以追溯到2020年。據彭博社在當時的報道，微軟正在研究用於運行公司雲服務的服務器計算機的內部處理器設計，以促進全行業減少對英特爾公司芯片技術依賴的努力。知情人士透露，這家全球最大的軟件製造商正在使用Arm的設計來生產將用於其數據中心的處理器。它還在探索使用另一種芯片來爲其部分 Surface 系列個人電腦提供動力。

近年來，微軟加大了處理器工程師的招聘力度，在英特爾、超微、英偉達等芯片製造商的後院招聘。2022年，他們甚至還從蘋果公司挖走了一位經驗豐富的芯片設計師，以擴大自身的服務器芯片業務。據報道，這位名爲Mike Filippo 的資深專家將在由 Rani Borkar 運營的微軟 Azure 集團內從事處理器方面的工作。

今年年初，微軟更是宣佈收購了一家名爲Fungible的DPU芯片公司。由此我們可以看到微軟在芯片上做更多的發佈也不足爲奇。

03 谷歌TPU，已經第四代

在取代英偉達的這條路上，$谷歌-A(GOOGL.US)$無疑是其中最堅定，且走得最遠的一個。

目前，谷歌自研的定製芯片Tensor Processing Unit(TPU)已經進入第四代。論文中，谷歌表示，對於規模相當的系統，TPU v4可以提供比英偉達A100強1.7倍的性能，同時在能效上也能提高1.9倍。另外，谷歌超算速度還要比Graphcore IPU Bow快約4.3倍至4.5倍。

據報道，谷歌的PaLM模型，是迄今爲止公開披露的最大語言模型，它是通過分佈在兩臺4000芯片的超級計算機上進行了50天的訓練。谷歌表示，它的超級計算機可以輕鬆地動態重新配置芯片之間的連接，有助於避免問題並進行性能優化。

雖然谷歌直到最近才公開其超級計算機的詳細信息，但它自2020年以來就已經在俄克拉荷馬州梅斯縣的數據中心內運行。谷歌表示，初創公司Midjourney使用該系統來訓練其模型，該模型在輸入幾個詞的文本後可以生成新的圖像。

04 寫在最後

綜合上述報道，對於英偉達而言，其面臨的挑戰是方方面面的，而不是僅僅侷限於其GPU。其對手也不僅僅是芯片公司，因此如何在規模化優勢的情況下，保證其高性價比，是安然度過未來潛在挑戰的有效方法之一。

不過，可以肯定的是，圍繞着數據中心的創新遠未接近停止，甚至可以說因爲大模型的流行，這場戰鬥纔剛剛開始。

01 博通芯片，瞄準Infiniband

02 微軟，自研芯片再曝進展

03 谷歌TPU，已經第四代

04 寫在最後

更多內容

站點服務

關於

協議聲明