今日,聯想集團宣佈旗下首款AMD AI大模型訓練服務器聯想問天 WA7785a G3在單機部署671B(滿血版)DeepSeek大模型時,可實現極限吞吐量6708 token/s,將單台服務器運行大模型的性能推向了新高,展現了聯想在AI基礎設施領域技術的深厚積澱與研發的快速響應能力。
依託聯想萬全異構智算平台,聯想通過訪存優化、顯存優化、PCIe 5.0全互聯架構創新以及精選SGLang框架中性能最優算子等諸多創新方式,對大模型從預訓練、後訓練到推理的全流程進行持續優化。這一成績意味着單台聯想問天 WA7785a G3可以支撐1500人規模企業的正常使用,是單機部署該大模型推理性能的又一次突破。聯想表示,此次突破是聯想和AMD聯合設計、協同調優、共同實現。並且,聯想與AMD還在持續深度合作調優新方法。
在聯想集團官宣上訴性能突破的當天,AMD CEO蘇姿豐到訪聯想總部。產業人士分析,雙方將在AI PC和服務器展開更深的合作,尤其是雙方擁有眾多頭部雲計算和AI集羣客户,例如微軟、Meta、甲骨文等。
去年,AMD 在數據中心業務上的銷售額超過了英特爾,在傳統數據中心領域超越了老對手,媒體稱,這成為蘇姿豐擔任 AMD 首席執行官的第一個十年的巔峯。此外,蘇姿豐已經闡明瞭公司的目標。她傾向於使用開源軟件,並加強對大型語言模型訓練和推理客户的支持。最重要的是,她正在提高AMD軟件的標準,以便它能夠更好地與Nvidia抗衡。
近日,摩根大通分析師Harlan Sur(華爾街股票專家中排名前1%的分析師)與蘇姿豐進行了訪談,“總體而言,關鍵信息是,AMD團隊強大而多樣化的數據中心/企業/客户端計算產品組合將推動CY25的強勁增長——份額增長、需求/週期性趨勢改善以及下一代AI計算解決方案的增長勢頭相結合,”這位五星分析師表示。
AMD預計在2025年實現“強勁的兩位數增長”(Sur認為超過20%),甚至更高的盈利增長,這得益於多種因素。這些因素包括服務器CPU市場份額的增加,尤其是在雲提供商和超大規模企業中,以及受益於“服務器需求趨勢的改善”。AMD還預計在台式機和筆記本電腦CPU中增加更多份額,同時其遊戲和嵌入式業務也應會增長。此外,其AI GPU業務將“強勁增長”,Sur預計今年的增長率將超過60%。
與此同時,該公司正為下半年的強勁表現做準備,準備推出其下一代MI350 GPU。早期勢頭已經很明顯,甲骨文最近下達了一筆數十億美元的訂單,包括首批30,000個MI355X GPU,以構建一個用於AI訓練和推理的計算集羣。Sur還認為,該公司正在努力在年中之前“將現有客户”(如微軟、Meta 和甲骨文)以及新的大型雲提供商轉移到MI350平台。這一轉變將為其2026年的下一代MI400平台奠定基礎,該平台預計將支持每個擁有超過100,000個GPU的大規模AI集羣。