您正在瀏覽的是香港網站,香港證監會BJA907號,投資有風險,交易需謹慎
AI開始為數字人注入靈魂

這幾天,國內“冷門歌手”憑藉AI翻唱再度走紅。

B站網友用AI模型生成了歌手孫燕姿的AI分身,其實跟車載導航上的“林志玲”、“郭德綱”類似。拿歌手本人的音頻去訓練,生成一個音色一模一樣的“孫燕姿”。

然後,讓偶像唱自己喜歡的歌的心願,就以這樣一種詭異的方式實現了。

圖源:B站

海外的玩法更加離譜。

美國一個擁有180萬粉絲的23歲女網紅,通過用GPT-4復刻了自己的AI分身,然後同時與1000多個網友談戀愛,每分鐘收費1美元。

僅一週,她就狂賺了7.16萬美元。

並且還遠不止如此,現在她的“男友”還在急速增加中,目前已經增加到了近萬人,排隊等待與她“談戀愛”時間已經長達96小時。

有分析認為,按照趨勢,她月入500萬美元沒有任何難度,如果不是技術限制,她賺到的錢,將可能是一個天文數字。

這些現象已經可以充分説明,一個由AI+帶來的新技術紅利時代,正在被急速到來。

01 數字人軍團湧入直播間

直播帶貨是虛擬IP變現最具潛力的場景。

Z世代對社交、視頻、網購等工具的使用深度遙遙領先於全網平均水平,數字人和虛擬空間結合的新玩法給他們帶來了體驗感和交互性,虛擬IP的核心粉絲大多來自18-24歲的年輕羣體。

這一趨勢讓品牌方看到了讓產品打破圈層的機會。

2020年,虛擬歌手洛天依和樂正綾等來到淘寶直播間,為博士倫、美的、歐舒丹等品牌帶貨。這場直播觀看人數高達270萬,有近200萬人打賞互動。

這在當時一度掀起巨大的討論,虛擬數字人直播的時代已經來了。

而隨着今年由chatGPT掀起的人工智能大模型熱潮,虛擬數字人領域又迎來一輪更加磅礴的爆發。

一大批量的虛擬數字人開始扎堆湧進直播間。

今年4月份,天娛數科旗下的虛擬數字人“朏朏”已完成 ChatGPT 模型接入,並完成直播首秀,不僅能夠實時響應顧客的提問,還能根據不同問題進行自主回答。

圖源:抖音

在短視頻上,出現過很多這樣的場景:一家公司的整個辦公室裏空無一人,只有一排排辦公桌上有數十台電腦屏幕裏的AI美女們正在直播......

圖源:短視頻

這家公司,只靠2D超寫實的虛擬形象,提前準備好的話術和背景,就可以直播一天,雖然單個效果不如真人直播,但成本低到令人髮指,而且還可以超低成本複製,勝在以量取勝,真正是做到躺着讓AI掙錢也並非不可能。

這一切,在説明,一場基於“AI+”的內容效率革命,正在數字人領域爆發。

虛擬數字人根據製作技術、應用場景、形象特點分為很多種。

與3D人氣偶像不同,現在大多數直播間裏説話的根據真人原型復刻聲音、表情的2D寫實數字人,你根本分辨不出是真是假,但製作成本遠低於勇闖娛樂圈的A-Soul IP們。

一個虛擬主播可以進行7*24全天候的直播工作,隨叫隨到,也不用擔心人設翻車的問題,減少了直播運營中的人工成本。

這背後,是AIGC在重新塑造數字人的生產流程。

2D數字人的製作用上了深度學習,只需要確定形象設計,圖文音頻數據經過採集、預處理後上傳到模型訓練,製作方式相對3D更簡單,更標準化,製作效能不斷提升。

這種工廠流水線的方式,使數字人的製作門檻、成本和週期得到了大幅縮短。

同時,隨着行業製作端的技術迭代和成本驟降,針對小型客户的數字人解決方案也開始湧現。

在4月份,騰訊雲發佈的數字人生產平台,需要生成真人形象的數字分身可以在平台上採購服務,只需上傳圖像音視頻即可實現定製,根據不同音色、視頻時長收費。

除了製作數字人,還可以提供整套數字人直播解決方案,功能包括了真人音頻接管直播間,獲取用户評論智能回覆,定價僅需要千元級別。

而有些渠道商,打包售賣AI主播的定價甚至只要200元以內。

這些主播形象大多來自模特經紀公司的授權,投放質量雖然粗糙,摳圖痕跡明顯,聲音也沒有特點。

但對普通的中小企業來説,沒有大V帶貨,花不起上百萬定製高端IP,想要壓縮運營成本, 快速起量,幾千塊的數字人已經夠香了。

數字人直播間,硅基

企業如果想要自己修改代碼,產出不同的數字人,還可以向技術提供商購買源碼,售價要比直接買AI主播更貴,不僅能自用,還可以使用源碼發展代理,甚至比自己做數字人直播還賺錢。

但AI數字人的故事,還沒有講完。

02 AI注入靈魂

IDC在《中國AI數字人市場現狀與機會分析》報吿中將數字人分為五個等級,目前數字人發展經歷從手工製作到AI建模的階段,初步具備人的外形,但還只能做簡單的交互決策。

當智能化水平來到L4、L5級別時,AI驅動的數字人能夠接管大多數場景決策,支持更多模態的實時交互,類似鋼鐵俠的私人AI管家“賈維斯”。

虛擬數字人過去三十年的發展,技術發展和市場需求基本圍繞着兩點在演變,一是視覺效果;二是交互體驗。

虛擬數字人最早出現在遊戲、動漫、電影裏,對新潮事物的情感連接和IP價值的延伸遙相呼應。

早期的角色型IP使用手繪,動作要一張一張地畫。1982年,日本動畫《超時空要塞》的女主角林明美成為了首個發行音樂專輯的虛擬歌手。

初代歌姬林明美

在電影裏,形象可以用計算機建模,但動作還得讓人來做,CG技術和動作捕捉等技術逐漸普及,依靠綠幕,捕捉設備,演員可以成為任何角色。

千禧年後,從02年的《指環王》到去年的《阿凡達2》,角色的渲染效果已經細緻入微,為藝術創作帶來了巨大便利。

《指環王》中“咕嚕”的形象由真人捕捉

到這裏,數字人技術的發展圍繞更像“人”的極限一步步逼近,不僅僅要求外觀、服裝上的視覺效果趨近真實,還包括驅動(呈現真實細膩的表情和動作)和渲染(讓畫面更加精細實時)。

不過,總覺得還是缺了點什麼。

1970 年,日本機器人專家森昌弘提出“恐怖谷”理論,由於機器人與人類在外表、動作上相似,所以人類會對機器人產生正面的情感。

當機器人與人類的相似程度達到一個特定程度的時候,一點點的差別都會被放大,並帶來負面和反感情緒。而當機器人與人類的相似度繼續上升,人類對其情感會再度回到正面。

與電影不同,社交屬性更強的應用場景對數字人實時交互的要求更高,不只是滿足於製作一個好看的“花瓶”而已。

在交互方面,自然語言模型填補了這一空缺。

文本生成能力已經驚豔眾人的GPT,給數字人的“智商”加上了兩道槓。

NLP大模型是AI驅動虛擬人的技術基石,簡單來講就是讓虛擬數字人能説會道,減少標準化內容的製作成本,被訓練來擔任智能客服、主持人、導遊等角色。長期來看,隨着個性化和情感理解的能力提高,為老人提供陪伴關懷,成為小孩子的”私人教師“也將實現。

此外,嘴型動作也可以由AI驅動,建立起與文本的映射關係,隨着寫實程度的提高,微表情也就更豐富,説話的時候表情、口型能夠對得上,這樣的數字人不僅“形似人”,而且“神似人”。

新華社:全球首位數字航天員:小諍

Midjourney是基於diffusion model擴散模型的爆款產品,在去年7月發佈,通過文本輸入指令訓練AI繪畫。

一對情侶,由Midjourney製圖

有機構測算過,目前其年收入就已經能夠達到1億美元的規模。

有B站up主用Midjourney復原了奶奶的寫實形象,從外觀上看,衰老的皮紋和白頭髮細節感十足,加上過去的音頻重現奶奶的聲音,最後通過D-ID生成了奶奶的數字分身。

為了彌補未與奶奶好好吿別的小遺憾,孫子和眼前的數字“奶奶”開啟了對話,而“奶奶”親切地迴應,其實是ChatGPT提供的回答素材。

圖源:B站

正是通過這些用户端的越來越多的嘗試,反過來為AI的“人格化”不斷添加海量訓練素材,加速豐富AI模型數據,最終讓AI為數字人注入靈魂,帶來更大可能。

 

03 尾聲

對虛擬分身的探索至今持續了三十餘年,從手繪到真人驅動,再到AI驅動,擬真感和交互性的體驗進步打開了廣闊的應用場景,涓流匯成大海。

AIGC幫助將普通人的外觀、聲音等特徵全面數字化,更低的製作門檻打開了市場的想象空間。

IDC預計,到2026年中國AI數字人市場規模將達到102.4億元人民幣,但能夠給我們帶來多麼良好的體驗,決定了數字人最終的命運。

同時,AI數字人具備下一代人機交互入口的潛質,未來我們面對的或不再是冰冷的屏幕,而是生動活潑的數字人類,越能夠挖掘最深層次的情感需求,成為我們生活裏的參與者。

或許正如AI教父所言,人類只是智慧演化的過渡階段,以便創造出數字智能,如今我們終於有一個長得像人類的數字分身,像我們一樣説話,以後或許還能像我們一樣思考。

關注uSMART
FacebookTwitterInstagramYouTube 追蹤我們,查閱更多實時財經市場資訊。想和全球志同道合的人交流和發現投資的樂趣?加入 uSMART投資群 並分享您的獨特觀點!立刻掃碼下載uSMART APP!
重要提示及免責聲明
盈立證券有限公司(「盈立」)在撰冩這篇文章時是基於盈立的內部研究和公開第三方資訊來源。儘管盈立在準備這篇文章時已經盡力確保內容為準確,但盈立不保證文章資訊的準確性、及時性或完整性,並對本文中的任何觀點不承擔責任。觀點、預測和估計反映了盈立在文章發佈日期的評估,並可能發生變化。盈立無義務通知您或任何人有關任何此類變化。您必須對本文中涉及的任何事項做出獨立分析及判斷。盈立及盈立的董事、高級人員、僱員或代理人將不對任何人因依賴本文中的任何陳述或文章內容中的任何遺漏而遭受的任何損失或損害承擔責任。文章內容只供參考,並不構成任何證券、金融產品或工具的要約、招攬、建議、意見或保證。
投資涉及風險,證券的價值和收益可能會上升或下降。往績數字並非預測未來表現的指標。
uSMART
輕鬆入門 投資財富增值
開戶