您正在瀏覽的是香港網站,香港證監會BJA907號,投資有風險,交易需謹慎
聯想CTO芮勇:左手是大模型,右手是智能體
格隆匯 04-18 11:07

4月18日,第十屆聯想創新科技大會Tech World在上海舉行。聯想集團高級副總裁、首席技術官芮勇博士表示,不能再單純地用大數據+大算力+大網絡來堆砌大模型,而是要超越大模型,探索更接近人類的思維和行為方式。

2022年11月底,ChatGPT橫空出世,掀起了大模型的熱潮。從百億參數,到千億參數,再到萬億參數,大模型能力越來越強大;從語言模型,到視頻模型,再到最近的音樂模型,大模型的表現越來越出色;AI歷史上,無論是統治語音識別30年的隱馬爾可夫模型,還是稱霸整個90年代的支持向量機,從來沒有任何一個技術,能夠像今天的大模型這樣強大。大模型是AI歷史上的重要里程碑,它開啟了人工智能發展的新紀元。芮勇博士稱,但是它的理解和規劃能力還很有不少侷限性,這些侷限性需要解決。

今天的大模型沒有真正地理解語言和理解世界,也沒有推理和規劃能力。它只是根據高維語義空間的聯合概率分佈,來連接它之前見過的海量信息片段。

大模型一方面能力很強,另一方面有侷限性。所以要'揚長補短',揚長:我們要持續發揚並增強大模型的強大能力。長短:我們要打造基於大模型的智能體技術,真正解決應用場景的問題。聯想的理念是,左手是大模型,右手是智能體,兩手都要抓,兩手都要硬。

聯想倡導混合人工智能框架,是公有大模型和私有大模型的混合。從技術角度看,還有幾個重要維度的混合。

首先,小模型不會消失。今後一定是基於大模型和小模型混合的"意圖理解"技術。大家知道信息論裏面的熵 entropy 是度量信息量的。越有序,熵越小,越無序,熵越大。聯想使用交叉熵 cross entropy 損失最小化原則,將意圖理解任務最優地分配給大模型和小模型,從而兼顧精準度和複雜性。

第二,基於CPU、GPU、NPU混合調度的"異構計算"技術。今天,在大模型的訓練和推理過程中,瓶頸往往不在於芯片算力,而在於數據傳輸。這個方程式是説,我們來同時優化計算負載和數據傳輸,使總體執行時間最短。

第三,基於模型微調 (SFT) 與檢索增強 (RAG) 混合的"智能問答"技術。相信很多人都聽過RAG和模型微調。這兩種技術哪個更好呢?其實,這兩種技術各有長短。

第四,基於硬件加密與全棧可信架構的混合"隱私安全"技術。光用硬件是不夠的,光用軟件也是不夠的。我們知道,在前量子時代,我們是通過把一個非常大的整數進行質數分解進行加密。但是在後量子時代,這就不夠了。這個方程式通俗地講,就是通過在一個高維實數空間裏進行因式分解來進行加密。

可以看到,這裏講到的4 種混合式技術,需要端邊雲的協同,需要軟件硬件的協同,需要傳輸與計算的協同。聯想的新IT架構 "端邊雲網智"為混合式技術的實現提供了強大支持。

關注uSMART
FacebookTwitterInstagramYouTube 追蹤我們,查閱更多實時財經市場資訊。想和全球志同道合的人交流和發現投資的樂趣?加入 uSMART投資群 並分享您的獨特觀點!立刻掃碼下載uSMART APP!
重要提示及免責聲明
盈立證券有限公司(「盈立」)在撰冩這篇文章時是基於盈立的內部研究和公開第三方資訊來源。儘管盈立在準備這篇文章時已經盡力確保內容為準確,但盈立不保證文章資訊的準確性、及時性或完整性,並對本文中的任何觀點不承擔責任。觀點、預測和估計反映了盈立在文章發佈日期的評估,並可能發生變化。盈立無義務通知您或任何人有關任何此類變化。您必須對本文中涉及的任何事項做出獨立分析及判斷。盈立及盈立的董事、高級人員、僱員或代理人將不對任何人因依賴本文中的任何陳述或文章內容中的任何遺漏而遭受的任何損失或損害承擔責任。文章內容只供參考,並不構成任何證券、金融產品或工具的要約、招攬、建議、意見或保證。
投資涉及風險,證券的價值和收益可能會上升或下降。往績數字並非預測未來表現的指標。
uSMART
輕鬆入門 投資財富增值
開戶