您正在瀏覽的是香港網站,香港證監會BJA907號,投資有風險,交易需謹慎
火爆全網!AI新星Groq橫空出世,真的能碾壓英偉達GPU?
格隆匯 02-21 10:47

火爆AI圈,刷屏互聯網!

近期,Groq引發廣泛討論,其大模型每秒能輸出750個tokens,比GPT-3.5快18倍,自研LPU推理速度是英偉達GPU的10倍

速度快得出奇

Groq名字與馬斯克的大模型Grok讀音類似,成立於2016年,定位為一家人工智能解決方案公司。

Groq爆火主要是因為其處理速度非常快。據媒體報道,該公司的芯片推理速度較英偉達GPU提高10倍,成本只有其1/10。

運行的大模型生成速度接近每秒500 tokens,碾壓ChatGPT-3.5大約40 tokens/秒的速度。

極限情況下,Groq的Llama2 7B甚至能實現每秒750 tokens,為GPT-3.5的18倍。

在Groq的創始團隊中,有8人來自谷歌早期TPU核心設計團隊,但Groq並未選擇TPU、GPU、CPU等路線,而是自研了語言處理單元(LPU)。

Groq官網顯示,在 Groq LPU™推理引擎上運行的Meta AI的Llama 2 70B的性能優於所有其他基於雲的推理提供商,吞吐量提高了18倍。

能否取代英偉達?

不過,速度並不是AI發展的唯一決定性因素。在Groq爆火的同時,也有一些質疑聲音。

首先,Groq似乎只是看起來了便宜。Groq的一張LPU卡僅有230MB的內存,售價為2萬多美元。

有網友分析,英偉達H100的成本效益應為Groq的11倍。

更為關鍵的是,Groq LPU完全不配備高帶寬存儲器(HBM),而是僅配備了一小塊的超高速靜態隨機存取存儲器(SRAM),這種SRAM的速度比HBM3快20倍。

這也意味着,與英偉達的H200相比,在運行單個AI模型時需要配置更多的Groq LPU。

另據Groq員工透露,Groq的LLM在數百個芯片上運行。

對此,騰訊科技的芯片專家姚金鑫認為,Groq的芯片目前並不能取代英偉達。

他認為,速度是Groq的雙刃劍。Groq的架構建立在小內存、大算力上,因此有限的被處理的內容對應着極高的算力,導致其速度非常快。

另一方面,Groq極高的速度是建立在很有限的單卡吞吐能力上的,要保證和H100同樣吞吐量,就需要更多的卡。

他分析,對於Groq這種架構來講,也有其盡顯長處的應用場景,對許多需要頻繁數據搬運的場景來説再好不過。

關注uSMART
FacebookTwitterInstagramYouTube 追蹤我們,查閱更多實時財經市場資訊。想和全球志同道合的人交流和發現投資的樂趣?加入 uSMART投資群 並分享您的獨特觀點!立刻掃碼下載uSMART APP!
重要提示及免責聲明
盈立證券有限公司(「盈立」)在撰冩這篇文章時是基於盈立的內部研究和公開第三方資訊來源。儘管盈立在準備這篇文章時已經盡力確保內容為準確,但盈立不保證文章資訊的準確性、及時性或完整性,並對本文中的任何觀點不承擔責任。觀點、預測和估計反映了盈立在文章發佈日期的評估,並可能發生變化。盈立無義務通知您或任何人有關任何此類變化。您必須對本文中涉及的任何事項做出獨立分析及判斷。盈立及盈立的董事、高級人員、僱員或代理人將不對任何人因依賴本文中的任何陳述或文章內容中的任何遺漏而遭受的任何損失或損害承擔責任。文章內容只供參考,並不構成任何證券、金融產品或工具的要約、招攬、建議、意見或保證。
投資涉及風險,證券的價值和收益可能會上升或下降。往績數字並非預測未來表現的指標。
uSMART
輕鬆入門 投資財富增值
開戶