近日,“AI大神”、第四範式公司創始人、CEO戴文淵做客格隆匯高端訪談《格隆博士會客廳》。
訪談中,戴文淵談及自己在上海交大、香港科技大學的求學和做研究經歷,以及如何從學術界轉入業界的過程。
在戴文淵讀大三時,學校有要求學生選擇一個細分的領域做深入研究,他當時陰差陽錯地被分配到了最為冷門的AI。
他介紹,當時計算機領域最熱門的方向是圖形學,即好萊塢的CG。當時的計算機技術還不夠先進,阿凡達的第一部拍了可能有將近十年,電影中的絕大多數場景是算出來的,劇組在這上面就花了很長時間。
所以,那個時候最優秀的計算機人才都是去學圖形學,如果代碼寫得好,計算機的執行效率更高,可能就不需要算10年,5年就行。隨着時代的變遷,計算的能力加快,阿凡達2和阿凡達3拍得就會比第一部要快得多。他回憶,在2005年剛開始進入AI領域時,大家都去看一部叫人工智能的好萊塢電影。電影講述了一個小男孩的故事,他經歷了很多事情,到結尾才突然發現原來自己不是人,而是一個機器人。
戴文淵看完這個電影后就非常迷茫,不知道這樣的機器人什麼時候能誕生。他表示,即便是在2024年的今天,已經有了具身智能、大模型的存在,距離做到連機器人自己都不知道自己是人還是機器人的狀態,依然有很大的差距。
當時,他覺得 AI 根本就沒有實現的可能,也正是因為這個原因,大多數人沒有選擇AI領域。他在第一次參加AI領域的頂級會議時,發現該領域有超過半數的人根本不是計算機系的,他們是因為本專業學不出來了才轉行的,即使是計算機專業的人也大多是被迫選AI領域。戴文淵坦言,自己也曾迷茫過,也想過換專業。如果沒有在2007年聽到第四範式的理論,説不定自己現在也不做AI了。
他表示,儘管自己當時已經寫出了最好的論文,但自己並不享受,也覺得可能沒有什麼意義,只不過是一些履歷上的東西,並沒有為社會創造價值。2007年,戴文淵在聽到Jim Gray談到科學發展的四個範式時突然頓悟。Jim Gray認為,人類科學發展分四個階段,每個階段是個範式:
第一範式叫做實驗科學,就是人開始學會記錄現象。
第二範式是理論科學,有些科學家根據歷史上記錄的現象總結出了規律。第三範式是計算科學,當計算機出現後,這些理論可以由計算機來推演,可以模擬複雜的現象。
未來科學要進入到第四個階段,第四個階段叫做數據密集型科學,這個時代最大的一個特點就是科學理論要由計算機從數據裏面發現。
在聽到這個理論後,戴文淵突然發現,AI不一定要做出一個以假亂真的小孩。這個小孩可能是30年、40年、50年以後才能做到的,但此時此刻,如果能在各行各業發現規律,就已經能創造價值,AI變得有用的週期也就大大拉近了。在剛開始學AI時,戴文淵發現基於Bing的數據能做出比原來好得多的AI模型。從這個邏輯推理,用的數據更好,AI模型就能做更好的效果。這也是他為什麼選擇離開學術界、加入行業的一個重要原因。第四範式在戴文淵心中有一個非常深的烙印,他認為,自己這麼多年做的所有事情,它們的底層邏輯是第四範式,所以公司成立之初就定了這個名字。
他還表示,香港科技大學讓自己接觸到了世界上一流的學術水平,再加上自己足夠努力,才發表了一些影響較大的論文。不過,那段經歷對他影響最大的不是那些論文,而是接觸到了第四範式的方法論。從那以後,他就堅定了要為 AI 行業的價值而努力。
談及自己當時提出的遷移學習,戴文淵介紹,它通俗來説是一種知識轉移或遷移的能力。比如,人就有非常好的遷移學習能力,你會發現數學好的同學學起物理來,就會簡單一點,因為學物理的時候能把數學上的一些能力遷移過來。
在當下的大模型時代,遷移學習已經比較普遍了,但在2005年,絕大多數的AI跟遷移學習是沒有關係的,那個時候的AI數學學得再好,去學物理的時候還得從頭再來,就好像一個剛出生的嬰兒,沒有遷移學習的能力。
談及選擇走出舒適區、進入AI行業的經歷,戴文淵表示,當時有很多人來跟自己聊過,他們都很不理解,問他是怎麼想的?怎麼會想去工業界?他在學術圈的論文都夠評個教授了,幹要去工業界?又不是混不下去了?
當然,現在大家會發現AI圈裏的好多知名教授都進入了行業。但在當時,戴文淵也並未感到很多壓力,因為他從來不在乎別人會怎麼看待自己的選擇,以及這個選擇到底是不是最優的。
重要的是,他在思考,AI的商業化成果最早會出現在哪?他當時判斷最早應該在互聯網公司,原因有三點:1)它們的數據比Bing更好;2)當時做AI的成本還挺高的,需要有一個很好的商業化結果支撐;3)此外,獲取數據的成本要低。
在進入AI行業時,戴文淵同時接到了谷歌和百度的offer,但由於去百度能有更多的選擇空間,他就從博士退學去了百度。
他可謂是非常地不走尋常路,寧可退學也要去把握AI可能落地的機會。對此,戴文淵表示,做那樣的決定很容易的,並不需要糾結,就是覺得到那個點了,就要去幹那個事,即使代價是沒了博士學位。