您正在瀏覽的是香港網站,香港證監會BJA907號,投資有風險,交易需謹慎
中信證券:GPT-4發佈,持續逼近通用人工智能AGI

本文來自格隆匯專欄:中信證券研究 ;作者:陳俊雲 許英博 賈凱方 劉鋭

近日openAI採用閉源模式發佈多模態大語言模型GPT-4 ,該模型採用和GPT-3.5/ChatGPT相同的技術路線,但帶來了更好的創造性、協作性、推理能力、安全性等,同時訓練過程中採用定製超級計算機進行算力承載,並完善了大語言模型scaling law基礎理論,實現訓練資源可控。我們判斷,GPT-4的良好效果,有望推動全球AI領域技術棧持續向LLM(大語言模型)模型收斂,並通過暴力美學+工程技巧的結合不斷加速AI產業發展,帶來更多應用場景落地的同時,亦幫助人類不斷逼近通用人工智能AGI。我們持續看好openAI及全球AI領域的產業投資機會,並建議持續聚焦芯片、算力設施、模型架構&工程實踐、應用場景等核心環節。

報吿緣起:OpenAI正式發佈GPT-4。

北京時間2023年3月14日晚,OpenAI發佈了正式版本的GPT-4,取代了此前ChatGPT使用的GPT-3.5版本,並開始為付費的Plus用户提供服務。OpenAI在官網表示,GPT-4雖然在大多數現實場景中的能力不如人類,但在一些專業問題和學術基準上表現已經和人類持平。本篇報吿將基於對GPT-4底層技術邏輯、實現功能詳細分析的基礎上,探討GPT-4對全球AI產業帶來的可能技術路徑影響,以及產業層面的變化和機遇。

GPT-4:完全閉源模式發佈,耗時6個月迭代調整完成的多模態大語言模型。

本次OpenAI推出GPT-4的形式與以往模型的發佈都有所不同,OpenAI既沒有公開發布GPT-4的相關論文,也沒有提供詳細的框架説明,僅僅提供了一份98頁的技術文檔(主要描述模型能力以及相關評測的得分,幾乎沒有任何技術細節)。通過這一方式,OpenAI阻斷了所有借鑑者參考的直接途徑(模型大小、數據集構建、訓練方法等),將閉源的路線堅持到底,這也符合我們之前對行業未來發展的判斷:領先的頭部公司(OpenAI、Google)將堅持閉源路線,避免其他公司復現其模型;落後一到兩個身位的公司(Meta、Amazon、NVIDIA等)可能會選擇開源路線,寄希望通過社區的力量加速迭代。

根據OpenAI發佈的這份技術報吿,GPT-4的訓練以及迭代的耗時長達6個月以上,是之前發佈的ChatGPT的兩倍以上,在技術路徑上沿用了自迴歸的Transformer模型加上人類反饋強化學習。模型能力方面最大的提升在於引入了多模態的處理能力,除了此前ChatGPT就支持的文字外,GPT-4還可以接受圖片輸入,不過暫時還沒有開放給用户使用。此外,模型在面對複雜任務的可靠性與輸出的安全性上均有顯著的提升。

模型訓練關鍵點:採用定製化超級計算機,完善了大語言模型scaling law基礎理論。

儘管OpenAI沒有公佈模型的及具體訓練細節,但從其在技術文檔中的表述出發,我們找到了兩點可能會影響整體產業的關鍵點:

1)OpenAI在去年開始就與微軟合作重新構建一台用於大語言模型訓練的超級計算機,而本次GPT-4的訓練以及迭代環節應該是完全通過這台計算機所完成的。根據Bloomberg的相關報道,OpenAI與微軟所搭建的這台計算機總共耗資數億美元,使用了近萬張英偉達A100顯卡,這也與我們之前報吿中對訓練大語言模型所需要的顯卡體量計算相一致。從OpenAI在技術文檔中描述的結果看(訓練+迭代總共耗時6個月),GPT-4的訓練過程遠短於此前的預期(從之前的論文出發,如此體量的模型迭代部分的對其就要耗費數月時間),這也表明了構建專用超級計算機的必要性。我們認為,在未來數月時間我們將會看到更多AI大廠效仿OpenAI的做法,將定製化的超級計算機提上日程。

2)Scaling Law是OpenAI團隊在2020年發表的論文,主要對模型能力與模型大小、訓練時長間的關係做了推算,也成為了大語言模型研究的重要理論。而在本次OpenAI的技術報吿中,我們看到對scaling law有了進一步的完善。OpenAI表示在開發GPT-4的過程中進一步完善了Scaling Law,對此前無法解釋的湧現能力(當模型體積大小突破到某一階段時會突然出現某種新能力)可以更好的預測。Scaling Law的完善也意味着在模型訓練資源的投入將會更加可控,AI廠商將不再需要為了湧現能力一味擴大參數,這將進一步降低AI訓練階段的成本。

應用場景:多模態能力加速多領域創新。

GPT-4相較於ChatGPT最直觀的改變在於加入了支持圖片輸入的多模態的能力。儘管OpenAI表示目前多模態能力的重點還在於圖片轉文字,對於音頻、視頻、圖片編輯等還不支持,但這也給了市場足夠的想象空間。

1) 搜索領域:結合圖片輸入的多模態將更好的為目前傳統搜索引擎+大語言模型輔助的模式進行服務。

2)智能客服:圖片與文字結合輸入的模式更加貼合目前ToC智能客服所遇到的一些痛點。

3)中小模型公司微調模型應用到具體細分領域:GPT-4被描述為一個通用的大語言模型,從OpenAI的文檔看他們也沒有興趣對具體細分領域進行微調以求更好效果,那麼這個在未來就自然會交到中小人工智能廠商手中:在GPT-4的基礎上針對細分行業進行微調來獲得更好效果。

風險因素:

AI核心技術發展不及預期風險;科技領域政策監管持續收緊風險;全球宏觀經濟復甦不及預期風險;宏觀經濟波動導致歐美企業IT支出不及預期風險;全球雲計算市場發展不及預期風險;企業數據泄露、信息安全風險;行業競爭持續加劇風險等。

投資策略:

GPT-4 採用與 GPT-3.5/ChatGPT 相同的技術路線,但帶來了更好的創造性、協作性、推理能力,以及多模態能力等。GPT-4的良好效果,有望推動AI領域技術棧持續向LLM模型收斂,並通過暴力美學+工程技巧的結合不斷加速AI產業發展,幫助人類不斷逼近通用人工智能AGI。我們持續看好openAI及AI領域的產業投資機會,並建議持續聚焦芯片、算力設施、模型架構&工程實踐、應用場景等核心環節。

注:本文節選自中信證券於2023年3月16日發佈的《前瞻丨GPT-4發佈,持續逼近通用人工智能AGI》報吿

報吿分析師:陳俊雲S1010517080001;許英博S1010510120041;賈凱方S1010522080001;劉鋭S1010522110001

關注uSMART
FacebookTwitterInstagramYouTube 追蹤我們,查閱更多實時財經市場資訊。想和全球志同道合的人交流和發現投資的樂趣?加入 uSMART投資群 並分享您的獨特觀點!立刻掃碼下載uSMART APP!
重要提示及免責聲明
盈立證券有限公司(「盈立」)在撰冩這篇文章時是基於盈立的內部研究和公開第三方資訊來源。儘管盈立在準備這篇文章時已經盡力確保內容為準確,但盈立不保證文章資訊的準確性、及時性或完整性,並對本文中的任何觀點不承擔責任。觀點、預測和估計反映了盈立在文章發佈日期的評估,並可能發生變化。盈立無義務通知您或任何人有關任何此類變化。您必須對本文中涉及的任何事項做出獨立分析及判斷。盈立及盈立的董事、高級人員、僱員或代理人將不對任何人因依賴本文中的任何陳述或文章內容中的任何遺漏而遭受的任何損失或損害承擔責任。文章內容只供參考,並不構成任何證券、金融產品或工具的要約、招攬、建議、意見或保證。
投資涉及風險,證券的價值和收益可能會上升或下降。往績數字並非預測未來表現的指標。
uSMART
輕鬆入門 投資財富增值
開戶