夜讀 | ChatGPT的最強科普
作者:李睿秋Lachel
來源:L先生說
我想,最近許多朋友的生活中,可能或多或少都被 ChatGPT 刷屏了。
你或許已經看過了許多相關的文章。它們或許從商業角度出發,告訴你 ChatGPT 引發了怎樣的商業浪潮;或許從技術角度出發,告訴你 ChatGPT 的原理和技術有多厲害;又或者,直接向你推銷各種各樣的類似產品,告訴你這些產品多麼有前途……
但這些,離我們的生活都有些遙遠。你可能看了很多文章,依然沒有搞明白,ChatGPT 究竟是什麼,它跟我有什麼關係?
如果你對 ChatGPT 從未聽聞,那希望能告訴你一些新信息;如果你對此感興趣但不熟悉,那希望能爲你提供一點指引。
ChatGPT 實際上不是一個新事物。它是2022年11月推出的,剛推出的時候我就使用了,還在知乎發了一條想法吐槽了一下。
沒想到,時隔兩個月之後,隨着微軟及一票商業公司的入場,它又開始火了,火得家喻戶曉。
從原理上來講,ChatGPT 其實也不是新事物,它背後的基礎,是母公司 OpenAI 在幾年前發佈的自然語言模型 GPT。對人工智能有所瞭解的朋友一定知道,OpenAI 於 2018 年發佈了 GPT-1,首次讓人工智能能夠讓人類一樣「理解文字」、寫出文字。
隨後幾年裏,OpenAI 陸續推出了 GPT-2、GPT-3,用更龐大的參數實現了更精細的學習。通俗來說,就是讓人工智能更「像人」了。
目前 GPT-3 已經用在了很多場合。像國外已經有用 GPT-3 來寫新聞的應用,至於用 GPT-3 寫小說、生成遊戲臺詞、生成代碼,也都在探索中了。
而 ChatGPT,就是在 GPT-3 的升級版 GPT-3.5 的基礎上,進行一定的包裝、微調、優化,所做出來的產品。過往的 GPT-3 只是一個底層引擎,必須接入到一個軟件中才能使用。而 ChatGPT,可以理解爲 OpenAI 自己爲 GPT 做了這麼一個軟件,讓用戶可以直接使用它。
所以它才叫 ChatGPT,也就是「可以聊天的 GPT」。
那麼,GPT 又是什麼呢?它的全稱是 Generative Pre-trained Transformer,生成式預訓練轉換器。簡單來說,它的原理是:先給它提供一個龐大的語料庫(通常是直接從互聯網上抓來的),讓模型通過上千億個參數對這些文本進行打散、標記、學習,構建起一個複雜的預測模型。
然後再依據這個預測模型,判斷一個單詞在這個情境下應該接哪一個單詞。就這樣一個一個單詞串起來,形成一段話,或者一篇文章。
這種預測的模式,其實跟我們大腦的學習和加工模式是非常相似的(詳見《打開心智》第一章)。因此,這也是它能夠更「像人」的一個重要原因。
-
這個模型背後無需人工參與的「無監督」式預訓練自學習原理,或者說讓模型像大腦「自由生長」的過程,就是它的動力層;
-
藉由這個原理所完成的 GPT-3.5,就是一個結構層,是 ChatGPT 起作用的主要基礎;
-
而對這個 GPT-3.5 進行包裝、優化所形成的 ChatGPT,就是一個交互層,它的本質就是加了一層更友好的用戶界面和交互方式,讓個人用戶能夠更容易地應用它。
瞭解完 ChatGPT 的原理,我們自然會關心一個問題:就目前而言,ChatGPT 究竟能做什麼?
這可能是 ChatGPT 最簡單的應用。你在聊天界面裏向它提問,比如「波粒二象性是什麼意思」,它就會用流暢的語言向你解釋,把這個概念講解得非常清楚。就我試用的體驗而言,效果非常好,簡潔曉暢,表達能力勝過許多人。
你可以向它提要求,讓它按照你的要求撰寫一篇文章。這是我去年做的一個實例,大家可以看看:
你可以讓它撰寫一封郵件,告訴客戶你的報價,並且用禮貌、懇切的語言去表述。它寫出來的作品保證用詞精確,句子流程,比一般人寫的要好;
你可以給它一個主題,再給一些背景和指引,讓它撰寫一份策劃方案,甚至讓它幫你想創意、提供各種不同方向的點子和靈感。這可以幫你節省大量時間精力;
你可以給它一些數據,讓它根據這些材料撰寫一份報告。它會非常智能地組合這些材料,生成一份文質兼美、結構清晰的報告,省去你斟酌文字的大量功夫;
你可以給它一個選題,讓它生成大量內容、風格和行文都截然不同的文章,發佈在各個平臺上。據說已經有一些營銷號開始這麼幹了;
你甚至可以讓它按照老師的要求寫一篇論文。實際上,國外已經有許多學生開始用 ChatGPT 完成作業了,也開始有大學教授跟 ChatGPT 「鬥智鬥勇」,比如要求學生現場寫作,要求學生解釋每段話的意思,等等。
老師對 ChatGPT 說:請幫我想一個題目;學生對 ChatGPT 說:請按照這個題目幫我寫一篇文章;助教對 ChatGPT 說:請幫我給這些文章寫評語並打分。
ChatGPT 還有一個非常強的能力,就是對輸入的材料進行總結提煉。比如:你可以給它輸入一篇文章,讓它概括文章大意;或者給它輸入一段討論,讓它總結主要觀點和論證。
現在也已經出現了一些產品,利用 ChatGPT 背後的 GPT 構建,能夠實現這樣的效果:你輸入一個視頻、一個播客,AI幫你收聽,聽完,用簡潔的語言總結出視頻或播客的要點,呈現給你。
許多程序員朋友盛讚 ChatGPT 的一點,在於它的代碼能力非常強。你提一個要求,比如「如何實現XXXX效果」,ChatGPT 會告訴你幾種可行的方案,並提供這些方案的主要函數和算法;你向它提問,比如「在XXXX情況下出現了一個bug,爲什麼」,ChatGPT 會告訴你幾種可能的原因,並告訴你如何處理每一種可能性。
我自己試了一下,我覺得它寫代碼的能力比我強多了,大概有100倍吧。
之所以 ChatGPT 能夠掀起這麼大的熱潮,一大原因是因爲它太「像人」了。你會感覺,跟你對話的似乎不是一臺機器,而是一個非常聰明,幾乎無所不知、無所不能,並且能滿足你任何要求的人。這一點,令許多人慾罷不能。
1)每一次跟 ChatGPT 聊天時,只要你不關閉窗口,你說的每一句話都會成爲它的「上下文」。
換言之,你可以像跟真人對話一樣,不斷問它「然後呢?」「還有嗎?」,或者表達你的態度,它會給出像真人一樣的迴應,無需你不斷重複、補充、完善問題。
舉個例子:你拋出一個話題,它回答,你對它的回答裏有個地方不太滿意,可以直接指出來,它會道歉,然後給出一個更好的、滿足你要求的回答。這個過程非常自然、流暢,你就像在跟一個真人對話,它能完全理解你的每一句話,並給出合乎邏輯的迴應。
2)得益於海量的訓練參數(GPT-3 有 1750 億個參數),ChatGPT 的文字生成能力非常精細,質量極佳。
它寫的文章,表達能力甚至強於許多不擅長寫作的普通人。我有時向它提幾個問題,它給出的回答會讓我感到「有啓發」,或者是一個新的角度,或者是一個完善的框架,這已經非常有價值了。
但是,ChatGPT 也並非絕對完美。實際上,就目前而言,ChatGPT 依然存在好幾個亟待解決的問題。
最嚴重的問題,就是 ChatGPT 的錯誤率實在是太高了。舉一個簡單的例子,這是我去年用 ChatGPT 測出來的實例:
爲了模仿一個外行人,我刻意把問題寫得不太準確,可以看到,答案非常離譜。這可能跟 ChatGPT 的訓練語料庫主要是英文材料有關。用英語提問的話,答案的正確率會提升,但依然會出錯。
並且,ChatGPT 往往會用非常自信、言之鑿鑿的語氣來回答問題。這就導致了,如果你是一個外行人,很多時候你可能壓根沒辦法分辨它給出答案的準確性。哪怕是內行,對於一些較爲瑣碎的細節,也很難去驗證。
去年 ChatGPT 剛發佈時,知名的程序開發交流論壇 Stack Overflow 就很快將其封禁。官方的解釋是:這是因爲 ChatGPT 給出的答案經常有錯誤,但我們很難看出錯誤在哪裏。
從我的角度來說,如果一款人工智能工具,100次回答裏面有3-5次是錯誤的,那我可能就不會用它。因爲我很難判斷它會不會再某一次突然犯一個大錯誤,給我造成嚴重損失。
實際上,我可能希望等它的錯誤率達到千分之一以下時纔會去使用。但就目前來看,可能還需要很長一段時間,才能達到這個水平。
ChatGPT 是一個人工智能程序,它只會忠實地按照內在的預測模型回答問題。因此,如果你向它進行誘導性提問,那可能會得到一些偏離道德倫理的答案。這可能會引起不必要的負面反應。
儘管官方已經在不斷修復漏洞了,但畢竟防不勝防。再者,你修復得越多,也就意味着這個工具能夠發揮作用的場景越少。這可能是一個需要考慮的平衡。
ChatGPT 不能憑空生成信息,它所有的知識,都只能來自於它被餵養的語料。那麼,顯而易見,它所能夠提供的答案,能夠輸出的內容,也不會超過這些語料的平均水平。你不可能指望它攝入一大堆插科打諢的帖子,要求它寫出《三體》。
而由於互聯網上存在大量的劣質信息,這就導致了:ChatGPT 攝入的信息越多,它整體的水平可能也就越低下。
遺憾的是,我們至今還沒有一套可靠的方法,能夠客觀地判斷內容質量的優劣。高引用的論文也可能是錯的,名氣頗大的學者也可能是灌水出來的,關注者頗多的 KOL 也可能是營銷號。
而如果依賴於用戶的點贊或轉發等數據去判斷內容質量,常識和經驗告訴我們:這樣帶來的勢必是大量譁衆取寵、吸引眼球的劣質內容,只會更嚴重地污染這個池子。
並且,隨着大量工具和服務開始使用 ChatGPT 等工具,大量由人工智能生成的文章會充斥互聯網。這就會造成「自產自銷」。一旦人工智能只能餵養由其他人工智能產出的語料,它的水準就將會遭遇一面難以打破的障壁。
有研究認爲,在5-10年內,互聯網上的內容可能就會被用光。屆時,人工智能將成爲無米之炊,只能再次反芻自己所產出的信息。
這可能會是制約 ChatGPT 等 AIGC(人工智能生產內容,AI Generated Content)工具的一個最嚴重的問題。
如果我們用樂觀的眼光去看待,認爲 AIGC 能夠克服上述這些問題,那麼,它對我們的生活,會帶來什麼樣的改變呢?
互聯網發明之前,我們的信息獲取可以說是搜索1.0時代。那時,我們只能到圖書館去查閱資料,用卡片和筆記本做筆記,通過攝影或手抄的方式記錄,繁瑣,麻煩,成本又高。因此,「做研究」成了一件陽春白雪的事情,只有少數人有能力去做。
後來,有了互聯網,有了搜索引擎,大量的信息被電子化,放到網絡上。我們獲取信息的方式被大大拓寬了。只需要輸入關鍵詞,就能看到刊載在各種期刊上面的文獻,存放在圖書館裏面的資料,看到別人的分析、觀點和見解。我們迎來了一個信息爆炸的搜索2.0時代。
而有了 ChatGPT 等 AIGC 工具的輔助,我們可能會迎來搜索3.0的時代。
搜索2.0迫切需要解決的問題是什麼呢?信息太多了。如何有效地篩選、提煉、整合這些信息,就成了一個難題。但 AIGC 可以解決這個問題。我們向它提問,給出一個關鍵詞,它快速整合知識庫裏相關的信息,總結提煉出最符合我需求的答案,呈現給我們。
整個過程流暢,自然,舒適,可以省去我們在大量信息間來回穿梭、整理的時間,極其便捷 —— 這就是搜索3.0。
現在已經有一些類似這樣的工具了。比如我在用的學術搜索引擎 Elicit,就是使用人工智能檢索我想要的論文,不過還停留在比較初級的階段。也許等有了更成熟 GPT 的加持,會再上升一個臺階。
因此,ChatGPT 也吸引了許多巨頭的關注。目前最受關注的,應該就是微軟和谷歌了。
微軟已經直接投資了 OpenAI,並且計劃在自己的搜索引擎必應和瀏覽器 edge 中嵌入 ChatGPT。目前,ChatGPT 版必應已經在國外向少量媒體開放,個人使用可能還要等一段時間。你可以登錄必應國際版,會有一個加入等待清單的提示。
谷歌也宣佈將一個人工智能 Bard 嵌入 Google 搜索之中。Bard 背後依託的是谷歌自己開發的人工智能模型 LaMDA,跟 GPT 效果相似但不同。
前面提到,ChatGPT 有總結提煉的能力。這一點,可能徹底改變我們閱讀和學習知識的方式。
試想一下:未來我們會如何學習一個新概念?你向人工智能提問,它直接把概念詳細講解給你。不懂的地方可以繼續追問,它會進一步向你解釋。那麼,你還需要去到處找資料、看教材、聽課程嗎?不需要了。有人工智能就夠了。
未來我們會如何閱讀一本書?也許你可以把它導入人工智能,它會自己幫你總結提煉出書裏最有價值的內容。可能是作者的觀點,可能是方法論和步驟,可能是案例或論據……你想要什麼,就向它下達什麼指令,讓它幫你「脫水」,呈上一份完善的摘要。
未來我們會如何看視頻、聽播客?或許我們也不用看、不用聽了,直接導入人工智能,它會幫我們總結出其中的要點,甚至可以幫我們寫一份妙趣橫生、文採飛揚的閱讀報告,讓我們能輕鬆愉快地攝入知識。
未來,我們可能每個人都有擁有屬於自己的專屬醫生、律師、財務經理……無論我們想要諮詢什麼問題,直接問人工智能就好,它會給出最新、最全面、最準確的答案。
當然,上面說的這些,現在的人工智能還遠遠不能做到。但很可能我們離這一天也不會多遙遠了。
我們不再需要自己字斟句酌去寫郵件,只需要給它一個指令,人工智能就會自動幫我們寫好一份郵件。
我們不再需要自己寫材料、寫報告,只需要給它足夠的信息,人工智能就會自動幫我們整理好文字,並且文筆上乘。
我們不再需要把大量的精力耗費在撰寫方案、文檔上面,而只需要思考,想出各種各樣的創意、主題、想法……再把這些想法告訴人工智能,它就可以自動幫我們把這些繁瑣的事務全都搞定。
甚至,連思考本身都可以讓人工智能來輔助 —— 你可以給它一個話題,讓它幫你尋找素材、案例、參考資料;或者讓它幫你頭腦風暴,提供各種各樣的點子供你參考……
在這些應用之中,最令我感興趣的,其實是微調(fine-tuning)。
什麼意思呢?它指的是:在人工智能本身的基礎上,你再餵給它一些獨特的、專屬於你自己的材料,把它訓練成一個屬於你自己的人工智能,讓它能夠回答一些更具針對性的問題,滿足你獨特的需求。
國外有人分享了一個實例:她把自己童年時的日記上傳到一個人工智能模型中,讓程序去學習她的思維、經歷和文字,從而製造出了一個「童年的自己」。然後,跟這個「童年的自己」交談。把自己遇到的問題,產生的困惑,面臨的抉擇向她詢問,從自己的內心中尋找答案。
同樣,如果把一位作家的所有作品輸入進去,或許再加上他的生平和經歷,這個人工智能就能用作家的口吻去回答一些相關問題。國外有人做了這麼一個嘗試,向 ChatGPT 輸入《反脆弱》作者塔勒布的作品,讓它煞有介事地回答問題,使得塔勒布本人不得不出來糾正。
那麼,如果把《紅樓夢》以及明清的各種史料餵給一個更成熟的人工智能,它有沒有可能續寫出《紅樓夢》?我想,這是可能的。
我感興趣的點在於:通過微調,我們完全可能創造出一個專屬於我們自己的人工智能 —— 只需要把我們所有的筆記,工作中產生的材料,平時的思考和日記……都餵給它,就可以了。
在這個情況下,它就是你,甚至它比你自己還更接近你自己 —— 因爲許許多多你可能已經忘卻了的記憶,它都能夠忠實地保留着,並依據一套算法完善自己的預測模型,做出更符合你內心和需求的選擇。
換言之,這就是一個專屬於我們的「內腦」。當我們有疑惑時,當我們需要搜尋信息時,當我們需要分析問題、做出判斷時,都可以參考它的意見。
不過,目前的 ChatGPT 似乎還不提供微調的功能,但 OpenAI 官網是有幾個模型提供微調的,只不過需要一定的技術能力。感興趣的朋友可以試一試。
另外,現在有些工具也在往這個方向嘗試。比如有一些新興工具,嘗試記錄你在電腦上瀏覽過的一切信息;以及知名筆記軟件 Notion 也推出了 Notion AI,能夠提供類似 ChatGPT 的功能。
那麼,如果在我們的電腦中內置一個人工智能助手,或者在筆記軟件中內置一個人工智能,把我們攝入和記錄的信息都作爲語料餵給它,似乎並不是遙不可及的事情。
到時也許可以出現這樣的事情:你閒來無事,向它提問:最近有沒有什麼適合我看的電影?它會向你推薦一個清單。上面的內容來自哪裏呢?來自它對你打過分的電影、讀過的小說、有感而發的想法、平時搜索的內容、甚至跟朋友聊天的信息……這些數據進行綜合分析之後,所推斷出的你的喜好。
它甚至會告訴你:這部電影用到了你三年前偶然想到的一個點子,處理得非常好,有沒有興趣看一下?這部電影探討了一個議題,正好是你前段時間一直感興趣的,不妨參考一下……
當然,這個「內腦」無法繞開的,就是隱私安全的問題。如何確保我們的隱私不被別人所獲得?我們願意付出多少隱私作爲代價來換取這樣一個內腦?我們又能否接受它的存在,如何理解它與我之間的同一性?
不過,我的答案依然是比較樂觀的。就目前來看,甚至就上文所述的近未來來看,ChatGPT 等 AIGC 工具,什麼都不會替代 —— 它只會提升我們的效率。
原因很簡單:AIGC 的定位不是一項「職能」,而是一種「工具」。
什麼叫職能?比如有一款人工智能,功能是幫助你看X光片,那這是一項職能,它可能會替代掉一部分醫生的功能;但 AIGC 的功能是搜索、閱讀、寫作,這是所有職業都需要的基礎技能。它本質上是輔助性的,是一種輔助的工具。
AIGC 可以幫我們做到的是什麼呢?我們不需要再給每個 NPC 寫一堆重複的臺詞了,而是可以設計 NPC 的背景,讓 AIGC 自動生成他們的臺詞,甚至產生任務和劇情;我們也不再需要給小說中的每個人物設定人設了,可以先做好背景框架,再讓 AIGC 生成一大堆人物,我們從中挑選,潤色一下就好……
因此,有了 AIGC 的存在,我們能夠想象的未來是:搜索信息更準確了,閱讀效率更高了,得到的專業建議有了更多的渠道可以參考對比,遊戲的劇情和任務可以更豐富了,小說和影視劇可以更多元化了,新聞可以更加實時地推送給我們……
所有的創作型職業都應該爲此感到開心,因爲困擾着他們的最大障礙 —— 無聊的、繁瑣的、勞動密集型的操作性工作,可以被 AIGC 替代掉了。
那麼,面對 ChatGPT 等 AIGC 工具,最需要、可能也是最重要的一項能力是什麼呢?—— 是明確自己想要什麼,並且能夠表達清楚自己想法的能力。
能夠提出一個好問題,有時候比能夠解決一個問題更重要。ChatGPT 的出現,更加清楚地表明瞭這一點。
你對自己的清晰認知,對外部世界的獨特見解,深入事物本質的洞察力,以及將其表達出來的溝通能力。
這四點,會是我們在面對一個由人工智能驅動的世界時,更加瀟灑自如的武器。
隨着 ChatGPT 等 AI 工具的發展,我們還需要記筆記嗎?未來我們該如何管理知識?
ChatGPT 等 AI 工具,能夠替代的是絕大部分的一,以及一部分二。也就是它能替代客觀信息庫,以及我們對客觀信息的總結。但二裏面我們自己的思考加工, 以及三裏面我們的實踐記錄,是沒有辦法被替代的。
實際上,這也是讓每個人的知識體系和知識結構真正有別於其他人的地方:重要的不是你收集和掌握到了多少信息,而是你對這些信息有着怎樣的理解、形成了哪些自己的看法。
隨着 AI 的發展,未來更好的形態,可能是一個「公用的外腦+私人的內腦」。我們可以接入這個公用的外腦,詢問客觀知識庫所存在的一切信息和資料,包括論文、互聯網文章、書籍、視頻,等等。
而每個人基於他所記錄的思考和項目實踐,可以有一個經過自己微調和訓練的內腦,讓它學習自己的生活和思考方式,通過向它提問獲得更加私人的、針對自己需求的答案,成爲自己的祕書。
到時所謂的「記筆記」,可能就會變成向這個內腦喂材料和微調的過程。而每個人的大腦+內腦,可能就會變成一個專屬於他的思考機器,也是將每個人區分開來的方式。
使用 ChatGPT 需要註冊 OpenAI 的賬號。遺憾的是,註冊賬號有一定的門檻。目前,OpenAI 不接受中國大陸的 IP 訪問,也不接受中國大陸的手機接收驗證碼。如果你有海外朋友,可以請求他們的幫忙。
然後,ChatGPT 現在需要付費了,每月的價格是20美元。免費賬戶也能用,但是會有限制,經常遇到網絡堵塞。也許過段時間熱度下去了會好一些。
最後,也許是這幾天熱度太高了,ChatGPT 的官網經常出問題,經常訪問不了。因此,不妨多等幾天,不用急着去嘗試。
另外,前文也講過,微軟的必應和谷歌都在嘗試將類似產品嵌入到搜索引擎之中,等正式上線了也可以體驗一下。
同樣,國內應該很快也會有類似產品出現,或者直接接入 OpenAI 的 API。大家可以留意一下。
關注uSMART
重要提示及免責聲明
盈立證券有限公司(「盈立」)在撰冩這篇文章時是基於盈立的內部研究和公開第三方資訊來源。儘管盈立在準備這篇文章時已經盡力確保內容為準確,但盈立不保證文章資訊的準確性、及時性或完整性,並對本文中的任何觀點不承擔責任。觀點、預測和估計反映了盈立在文章發佈日期的評估,並可能發生變化。盈立無義務通知您或任何人有關任何此類變化。您必須對本文中涉及的任何事項做出獨立分析及判斷。盈立及盈立的董事、高級人員、僱員或代理人將不對任何人因依賴本文中的任何陳述或文章內容中的任何遺漏而遭受的任何損失或損害承擔責任。文章內容只供參考,並不構成任何證券、金融產品或工具的要約、招攬、建議、意見或保證。
投資涉及風險,證券的價值和收益可能會上升或下降。往績數字並非預測未來表現的指標。