作者:陳彬
來源:遠川研究所
Chat-GPT背後的明星企業OpenAI,始於幾個硅谷極客想要“拯救人類”的瘋狂念頭。
2014年,特斯拉正在爲產能問題焦頭爛額,來中國求援的馬斯克順便做客央視《對話》欄目,遭到楊元慶靈魂拷問:2013年聯想一共賣出了1.15億臺設備,特斯拉賣了幾輛車?
同一時期的美國,“AI取代人類”成爲了硅谷new money的關鍵詞,這讓結過3次婚、生過10個孩子的馬斯克深感不安。谷歌創始人拉裏·佩奇就曾批評馬斯克是一個“物種主義者”,不願用“硅”創造新物種。
2015年夏天,馬斯克找到了他的知音——薩姆·阿爾特曼。
這位名字也能翻譯成“奧特曼”的帥哥,是創業孵化器Y Combinator的新任掌門,也是一個標準的科技狂,擁有兩家核聚變企業和一家區塊鏈公司。
2009年,YC創始人曾在博客上分享了過去30年最有趣的5位創始人,24歲的阿爾特曼與喬布斯、谷歌創始人、賽普拉斯半導體CEO和Gmail之父並列。
在一次私人聚會上,兩位明星企業家宣佈掏出10億美元,籌備一家非盈利導向的AI實驗室OpenAI,“讓人類以更接近於安全的方式構建真正的AI”。
在Chat-GPT橫空出世之前,絕大多數人都不知道這家站在人類智商密度高地上的公司都做了些什麼,到底花掉了多少錢。
這是一段用美元堆出來的理想主義故事。
信仰:AGI神教
OpenAI誕生的那場聚會上,馬斯克幾乎沒有招到人。現場所有人都在追問一個問題:此時谷歌、Facebook、百度早已把世界上最頂尖的AI學者搜刮殆盡,你碰什麼瓷呢?
這羣野心家不肯死心,向蒙特利爾大學一位教授要來了一份10人挖角名單,上面寫着圈內最有前途的年輕AI研究員。這其中最爲重要的挖角對象,是一個名叫伊利亞·薩特斯基弗的俄羅斯人。
小薩是AI研究宗師傑夫·辛頓的學生。2012年,辛頓帶着27歲的小薩和另一個學生髮明瞭一個AI模型,該模型識別圖像的準確率高得嚇人,在學術界引起了轟動,也直接奠定了小薩產業泰鬥的歷史地位。
這也讓谷歌等企業迅速意識到:AI終於有搞頭了,直接把小薩挖走了。
OpenAI給這10人挨個打電話,所有人都表示,除非別的人都答應才入夥。爲了搞定小薩一行人,OpenAI將他們騙去了當地的一個葡萄酒之鄉,好生伺候了一天。最終,9個人上了“賊船”。
可就在馬斯克與阿爾特曼準備召開新聞發佈會時,小薩卻反悔了。
爲了留住小薩,谷歌先給小薩的薪資翻了一番,數字是OpenAI的兩到三倍,但對方不爲所動。隨後,谷歌採取了另一條策略:加更多的錢。
此時的OpenAI急得像熱鍋上的螞蟻,但考慮到自身囊中羞澀,只能天天發短信求小薩談理想。直到阿爾特曼召開新聞發佈會的那一天,小薩才決定加入OpenAI,從谷歌的心腹變成了心腹大患。
小薩的決定其實出於一個有些難以啓齒的“理想”:他想實現AGI(通用人工智能)。
所謂AGI,即“超級智能”,接近科幻電影中萬能的人工智能;與之形成對比的是人臉識別、翻譯、下圍棋等只能完成單一任務的人工智能。
即便2012年,傑夫·辛頓和小薩的論文讓AGI的可行性跨出了一大步,但以當代的科研基礎,談論AGI,依舊就像談論如何長生不老一樣民科。
科學家all in AGI,賭贏,可以在教科書裏與比肩牛頓;賭輸,成爲美版知乎Quaro的民科代表。
但企業all in AGI,大概只有一個結局——成爲先烈。龐大的資本支出,讓無論是相信“專家算法”的IBM,還是“深度學習”神教的谷歌、百度,無論信奉何種AI路線,巨頭們的一切AI研究,都爲產業化服務。
願意成爲這個冤大頭的,只有OpenAI一家。
阿爾特曼將OpenAI打造成了一個象牙塔:在實驗室成立的前15個月,OpenAI都沒一個明確的研究目標。平日裏,馬斯克便帶着這羣夢想家一起腦暴,探討AGI將如何實現。
2016年5月,時任谷歌首席AI研究員曾參觀過OpenAI,對其工作方式相當困惑。他詢問OpenAI的目標是什麼,沒想到難倒了OpenAI,“我們現在的目標,就是……做點好事[3]。”
然而在數月之後,這位研究員卻毅然辭職加入了OpenAI——一起做點好事。
畢竟在當時的硅谷,“放肆做夢”是個極其稀缺的特質。哪怕是AGI曾經的佈道者DeepMind,在被谷歌收購後也更實際了些。產業界與學術界的差異,促使了大批科學家的“叛逃”:
從2017年開始,吳恩達、李飛飛等著名AI學者先後迴歸大學校園。
此般大環境下,高舉理想主義大旗的OpenAI,成功抄到了歷史的大底,拉攏了不少頂尖人才。
2017年3月,隨着團隊越來越龐大,阿爾特曼決定給OpenAI設立一個更具體的目標,這時,等待他們的是一個好消息與一個壞消息。
接盤:讀作理想,寫作美元
2017年是OpenAI命運的分水嶺。
好消息是,谷歌幫OpenAI解決了沒有具體目標的困擾。2017年,谷歌在一篇論文中開源了“Transformer神經網絡架構”。它的革命性在於可以讓AI“聽懂人話”,而這很可能會是通往AGI的關鍵鑰匙。
一直在做好事的OpenAI,瞬間有了攻堅的方向。
壞消息則是,沒錢攻堅了。
一個熱知識是,如果沒一個出手闊綽的靠山,根本沒資格搞AI。光算力——也就是芯片的開銷,就是一筆鉅額成本。從2012年的AlexNet模型到2017年的AlphaGoZero,算力消耗足足翻了30萬倍。同期英偉達股價翻了整整15倍,黃仁勳做夢笑醒好幾回。
早些年,一大批科學家紛紛跳槽去硅谷巨頭,就是爲了找靠山。2010年,還在斯坦福的吳恩達研究出一套新算法,卻發現大學的算力條件遠遠不夠。他從美國東海岸找到西海岸,發現只有谷歌符合條件。
2017年,Transformer橫空出世後,AI進入大模型階段。所謂大模型,背後支撐的是大算力、大數據以及大算法,而這也意味着燒大錢。
以OpenAI的GPT-3模型爲例,有機構做過測算,發現訓練一個GPT-3,需要至少1024張A100顯卡持續運轉足足一個月[7]。而A100顯卡最便宜的版本也要8769美元。
也就是說,什麼還沒算,就先給英偉達交了900萬美元入場費,這還沒算搭建機房的成本和後續源源不斷的電費。
如今,ChatGPT訓練一次的成本高達1千萬美元,這是一般企業無法承受的。小冰公司CEO李笛算過一筆賬:“如果按照ChatGPT成本來考量的話,每天我要燒3億人民幣,一年要燒一千多億。”
回到2017年,仍是非盈利機構的OpenAI,根本無力負擔這些費用。原本的大靠山馬斯克也在2018年初宣佈辭職,原因是避免與特斯拉AI業務有所衝突。
風雨飄搖之際,阿爾特曼悄悄修改了OpenAI“非盈利”的使命,開始給OpenAI另謀靠山。
此時,既無科研成果,又無大牛坐鎮的微軟,進入了阿爾特曼的視野。
作爲美國高科技領域老牌列強,微軟在AI上的決心不可謂不強,但長期被谷歌的DeepMind來回摩擦。
2019年,恨鐵不成鋼的微軟遇見人才濟濟的OpenAI。當時,比爾·蓋茨本人並不相信OpenAI會成功——投資談判中,他很直白地對其發展路線表達了悲觀,認爲Transformer這類大語言模型在過去五年都沒什麼進展,沒人知道它會有什麼價值。
但話雖如此,微軟還是爽快的掏出了10億美元。
這次接盤,很可能會成爲微軟歷史上最成功的一筆抄底。
2022年12月,OpenAI沿着Transformer路線開發出了最新款AI,名爲Chat-GPT。2個月後,Chat-GPT的全球月活突破了1億。
這回,該輪到谷歌睡不着覺了。
突圍:難以復刻的奢侈品
Chat-GPT登上熱搜之後,公衆常常會討論一個問題:爲什麼又在美國?
事實上,復刻一個Chat-GPT並非難事。Chat-GPT的本質,其實以GPT-3模型爲框架,通過“對話”這一場景,搭建了一個普通用戶也能使用的AI應用,兩者之間的技術進步並不算大。
如果翻一翻前兩年的新聞能發現,早在GPT-3時代,中國公司已經在如法炮製,大可不必對各種中國版Chat-GPT冷嘲熱諷。在純粹的技術層面,中國企業落後的並不太多。
我們回到一開始,大模型發展的三要素:算法、算力、數據。
算法,如同人類大腦,決定了AI的學習能力。
一個業內主流觀點是,儘管沒有率先做出來Transformer、GPT-3,但國內企業在大模型上的技術,距離ChatGPT的差距其實也僅在半年到兩年之間。
比如GPT-3發佈之後,百度、騰訊、阿裏等企業諸如一言、M6、混元等十萬億參數級別的大模型也很快跟進。
算力,這意味着一種資源,決定了算法的運行效率。
AI訓練高度依賴英偉達A100、H100等AI專用顯卡。常見的消費級顯卡通常會將部分算力讓渡於光追等功能,相比之下,A100的特點則是從硬件設計到軟件配套 all in AI。
儘管從2022年開始,美國已經限制英偉達向中國大陸銷售A100/H100顯卡,但很快英偉達也推出了A800,成爲中國特供版A100平替。
數據,訓練算法的優質教材,決定了AI會學到哪些知識。
站在OpenAI背後的,是一座數據富礦,即豐富的高質量英文文本數據。例如在全球最大的百科網站維基百科上,擁有最多百科文章的語言正是英文。
除此之外,英文互聯網還有衆多類似Github這樣的專業論壇、海量的圖書、學術論文、專業新聞等數據。儘管,中文互聯網的文本質量有待提升,但數據總量卻是碾壓級別的優勢。
無論是算法的調教,還是算力的堆積,本質都是砸錢砸人。在這方面,中國其實並不落後於美國。正如百米賽跑中,冠軍和亞軍的差距往往不到一秒鐘。
然而不到一秒鐘的差距,卻決定了鮮花與掌聲的歸屬,這可能也是Chat-GPT和“中國版Chat-GPT”的差別。
OpenAI的誕生似乎離不開無數偶然的堆積,但也有着同樣多的必然。“造福人類”的AGI神教,聚集了世界上最有才華的青年AI學者;適時出現的技術突破讓OpenAI的路徑有跡可循,微軟的出現組成了最後一塊拼圖。
Chat-GPT的昂貴之處,既在於天文數字的投資和令人心生畏懼的燒錢速度,也在於一個能夠包容瘋狂想法的商業環境。正如阿爾特曼所說:
成千上萬的創業公司在做社交軟件,只有不到20家公司致力於核聚變。然而偉大的事情實際上更容易,因爲飛向太空是每一個人的夢想。
夢想並不昂貴,但敢於夢想的勇氣卻是一件奢侈品。