來源:科技新知
2月7日消息,經百度確認,百度類ChatGPT項目名字確定爲“文心一言”,英文名ERNIE Bot,預計3月份完成內測,面向公衆開放,目前正在做上線前的衝刺。早盤,百度股價聞聲大漲超13%,領漲恆生科技指數成分股。
去年9月,百度CEO李彥宏判斷人工智能發展在“技術層面和商業應用層面,都有方向性改變”。據推測,百度那時候就開始做文心一言。
按照谷歌和微軟節奏,文心一言開放內測還有可能提前。
百度方面表示,ChatGPT相關技術,百度都有。百度在人工智能四層架構中,有全棧佈局。包括底層的芯片、深度學習框架、大模型以及最上層的搜索等應用。文心一言,位於模型層。
國產版ChatGPT要來了?
據悉,百度將於3月份推出類似OpenAI旗下ChatGPT的人工智能聊天機器人服務。
據悉,百度推出類ChatGPT風格的應用,一開始會將其嵌入到公司的主要搜索服務中。這一工具的名稱尚未確定,但它將會讓用戶獲得對話式的搜索結果,就像OpenAI的那個流行平臺一樣。
前不久,由人工智能實驗室OpenAI發佈的對話式大型語言模型ChatGPT在國內外掀起了一陣追捧之風。國外,谷歌、Meta、微軟等科技巨頭均在該領域積極佈局;國內,ChatGPT成爲A股熱詞,拓爾思、萬興科技、佳都科技等多家上市公司都宣佈要開展由ChatGPT引爆的AIGC概念相關佈局。
作爲國內AI領域的代表企業,百度此刻率先出陣,意欲何爲?ChatGPT式的產品,又能給百度帶來何種想象力?
在ChatGPT發佈的第一天,就有生成式AI要取代搜索引擎的聲音出現,而這也是被業內人士討論最多的問題。
其中,推波助瀾作用最大的,莫過於開發人員Josh Kelly的那句感嘆——Google is done。在這條爆火的推文下,不少共鳴者認爲ChatGPT將有望撼動谷歌搜索的地位。
有意思的是,對於該稱讚,ChatGPT“本身”卻是最大的反對派。當你嘗試用問題形式詢問ChatGPT能否取代搜索引擎時,它給出的答案卻是否定的。
“不太可能。ChatGPT是一個使用自然語言處理技術的對話式語言模型,它主要用於對話式的問答和聊天應用中,旨在模擬人類的對話行爲。相比之下,搜索引擎是一種針對網絡信息的檢索工具,可以根據用戶的查詢請求,快速找到符合條件的網絡信息。兩者不具備相同的功能,因此ChatGPT不能取代搜索引擎。它們可以相互補充和輔助,共同爲人類提供更好的服務。”
聽起來,ChatGPT的回答似乎是“正確的廢話”,不過也有業內人士爲該觀點站臺。
長期從事NLP和推薦搜索相關研究張俊林發文分析,ChatGPT目前暫時還不能取代搜索引擎,原因有三:其一,如果提問者對於所提的問題不知道正確答案,那將無法作出判斷的ChatGPT給出的結果;其二,ChatGPT對於LLM模型吸納新知識是非常不友好的;其三,ChatGPT或GPT4的訓練成本以及在線推理成本太高,想要兼顧用戶基數和成本是個兩難選擇。
需要注意的是,儘管ChatGPT暫且無法取代傳統搜索引擎,但不代表沒有絲毫威脅。
億萬富翁Chamath Palihapitiya預測,隨着人工智能的崛起,谷歌今年將受到最大的影響,因爲人工智能開始讓谷歌搜索功能變得不那麼重要。這位風險投資家表示,谷歌可能不會失去其全球頂級搜索引擎的地位,但隨着其他網站的加入(ChatGPT),谷歌仍可能失去相當大的使用量。
簡單來說,Chamath認爲從盈利能力和參與度的角度看,谷歌搜索是失敗者:
- 其他公司將能夠產生高質量搜索結果。
- ChatGPT直接給你答案,爲什麼還要搜索?
- 哪怕只流失10%-15%的使用量,是谷歌的巨大損失。
從國外大廠的動作來看,這種觀點也比較有說服力。譬如瞅準機會想要挑戰谷歌地位的微軟。
據外媒報道,微軟公司打算將OpenAI的ChatGPT聊天機器人引入其搜索引擎Bing(必應),以從強大的競爭對手谷歌那裏搶奪市場份額。
有知情人士透露,微軟相信,聊天機器人提供的更對話化、情境化的回覆,會使搜索用戶更樂意使用Bing,因爲通過這種方式提供的答案毫無疑問要比直接拋出網頁鏈接要更加優質。
作爲回擊,谷歌緊急發佈“紅色警報”。
根據《紐約時報》的一份內部記錄顯示,谷歌首席執行官Sundar Pichai參加了幾次圍繞谷歌人工智能戰略的會議,並指示公司的許多團隊重新集中精力解決 ChatGPT對其搜索引擎業務構成的威脅。
一攻一防之中,道理其實很淺顯。
巨頭們不願錯過任何機會,特別是隨着人工智能技術進一步成熟,確實有再次錯失良機的風險,而這是谷歌最不願意看到的。
對於有着同樣處境的全球最大的中文搜索引擎百度而言,此番出擊也成了必然。說白了,ChatGPT能否取代搜索引擎,是未知的,但風險是已知的,因此最穩妥的策略便是攻防兼備、搶先佈局。
實際上,早在1月初的百度Create AI開發者大會前夕,百度搜索就宣佈將基於百度自研的生成式模型,升級“生成式搜索”能力。並指出,生成式AI和搜索引擎是互補關係而不是替代,而搜索底層技術和AI底層技術是相通的,百度從2021年就開始嘗試把AIGC與搜索兩者結合起來。
此外,百度自身在生成式AI領域也有一定的基礎。據知情人士透露,百度的文心(Ernie)系統,一種經過多年數據訓練的大規模機器學習模型,將成爲其即將推出的類ChatGPT風格工具的基礎。
就如同,新事物的出現,往往會破壞原有的體系。在ChatGPT賦予百度更多想象力之前,首先需要考慮ChatGPT對於原有系統的衝擊,這裏主要指廣告系統。
谷歌主要業務分爲兩類,一類是廣告在內的服務業務,一類是雲業務。而廣告業務是谷歌的收入支柱。
具體而言,谷歌搜索服務的廣告來源是多樣的。其中,關鍵詞競價,就是廣告主通過競價來爭奪搜索引擎結果頁面上的顯示位置或“排名”,而競價金額和關鍵字設置方式將決定相對於其他競價方的排名。
此外,廣告主可以設計文字版廣告,並將廣告文案顯示在用戶的搜索結果中,或者創建可以顯示關鍵購買信息(例如產品照片,價格和評分)的谷歌購物廣告。
於是乎,問題就出現了。當採用ChatGPT的方式來進行搜索,如果系統直接給出對應的信息,自然會影響到廣告的投放。前谷歌廣告團隊負責人Sridhar Ramaswamy也曾表示,ChatGPT的使用從一定程度上阻止了用戶點擊帶有廣告的谷歌鏈接。
據上述知情人士表示,百度計劃在用戶提出搜索請求時引入ChatGPT 生成的結果,而不僅僅是鏈接。因此,對於百度目前的廣告系統而言,挑戰也是存在的。
當然,也有機器學習行業人士表明,“從商業模式的角度,廣告業務最大的關鍵點是平臺的控制力,平臺的控制力越大,粒度越細,變現的空間越大。這種直接給出答案的產品形態中,平臺的控制力是最強的,怎麼會擔心商業化的問題。”
總之,ChatGPT對於原有系統商業模式的影響更多是懸而未決的,不妨再來探討其對於百度可能帶來的利好層面。
例如,百度此前一直夢寐以求的“框計算”會實現嗎?2009年8月18日,李彥宏在百度技術創新大會上提出了這個全新的技術概念。
簡單來說,“框計算”就是要在百度的搜索框裏,幾乎能夠解決用戶的所有需求,相當於百度成爲一切信息乃至服務的入口。此後,爲了完善“框計算”概念,百度先後佈局“中間頁”、“輕應用”,又大手筆投資或收購一些具有巨大用戶需求的垂直平臺,等等。
不過遺憾的是,隨着移動互聯網時代來臨,百度想要“框”住一切的野望並沒有得償所願。也正因此,市場的格局也發生改變,誕生了兩種搜索引擎,通用搜索和垂直搜索。
所謂通用搜索主要爲百度、谷歌等,無需過多贅述。而垂直搜索則主要是針對某一個領域的專業搜索引擎,是通用搜索引擎的細分和延伸。一般來說,和通用搜索不同,垂直搜索引擎的數據多來源於自身平臺,當某一平臺上的信息達到足夠量大的時候自然形成,例如淘寶。
此前,市面上已經有分析人士認爲,高度專業化的垂直搜索廠商對通用搜索平臺將構成重大的潛在威脅。而百度若推出類似ChatGPT風格的應用嵌入到搜索服務後,借用生成式搜索的能力,由此或將引發一連串的蝴蝶效應。
此外,除了搜索引擎呢?譬如雲業務,實際上微軟已經這樣做了。據外媒報道,微軟公司將馬上把OpenAI旗下的人工智能機器人 ChatGPT添加到Azure雲平臺中。
微軟公司CEO薩蒂亞・納德拉 (Satya Nadella) 發佈推文稱:“在我們幫助客戶將世界上最先進的人工智能模型應用於他們自己的業務需要時,ChatGPT 很快就會出現在Azure OpenAI服務中,該服務現在已經普遍可用。”
同樣,對於百度的雲業務而言,作爲一直強調在雲計算市場中具備AI差異化優勢的雲廠商,雲計算與AI的結合或將爲其競爭日漸激烈的雲市場中帶來更多新變量。
AI學者Tom Goldstein曾算了筆賬,按照ChatGPT是基於GPT3.5的說法,它的參數量可能爲1750億。因此大約需要5個80GB的A100來加載模型和文本,ChatGPT每秒鐘能產生大約15-20個單詞,如果它使用A100,那麼可以在8-GPU服務器上完成。
而在Azure上每張A100每小時3美元,通常ChatGPT一次響應會回答約30個單詞,生成一個單詞約350ms,所以每次回答大約需要花費1美分,也就是人民幣約7分錢。
若按照超過百萬用戶數據(注:截至發稿月活用戶已超1億),以及一個人一天約有10次提問來估算,ChatGPT一天提供1000萬次回答是合理的。由此,粗略估計ChatGPT每天成本消耗有10萬美元,實際成本應該肯定比這個高,畢竟並行效率不會是100%。
來自摩根士丹利的分析師布萊恩·諾瓦克(Brian Nowak)估計,ChatGPT每次查詢的成本大約是谷歌傳統搜索查詢成本的七倍。
對此,百度架構師辜斯繆曾表示,該技術很貴,所以在具體推出時還有很多改良空間,百度已考慮很多方案來大幅降低它的單次服務成本,但如果真的要推出,也需要投入一定比例的資源維持。對於百度而言,甚至還要考慮公關問題(LaMDA曾在去年5月份引起爭議)。
顯然,即便業界對於ChatGPT的熱情超過了預期,但客觀來說,考慮到成本和缺乏行業知識積累,ChatGPT要真正做到商用,仍還有很長一段路要走。
當然,隨着ChatGPT距離人工智能越來越近,對於現有商業格局勢必將產生巨大挑戰,百度、谷歌之外,其他領域的商業巨頭們也該保持警惕了。