3月28日,第十一屆中國網絡視聽大會在成都舉行,美圖公司創始人、董事長兼首席執行官吳欣鴻發表主題演講《視頻大模型如何助力網絡視聽創作》。
本屆大會以"極視聽強賦能"為主題,有2000餘家業內企業和機構、5000餘位行業代表、近萬名嘉賓共赴盛會。
今年年初,Sora的亮相引發了視頻生成領域的風潮。吳欣鴻透露,目前美圖公司正緊鑼密鼓進行視頻模型的更新和迭代,準備在視頻生成領域大展拳腳。
大會現場,吳欣鴻展示了一支主題為"動物瘋狂賽車"的60秒視頻。
這支視頻基於美圖視覺大模型MiracleVision(奇想智能)的圖像生成、視頻生成能力。具體來説,它使用了開拍的"AI腳本"、"AI數字人"功能,WHEE的"文生圖"、"AI生視頻"功能,Wink的"視頻編輯"功能,僅用半天就完成了故事腳本、分鏡設計、視頻生成、脣形同步、視頻編輯等視頻製作流程。
"以Sora為代表的視頻大模型只是開始。"在吳欣鴻看來,目前只是視頻大模型的2.0階段,以Sora為代表的視頻大模型正在嘗試理解世界,具有一定湧現能力,能夠生成30-60秒的視頻。
吳欣鴻認為,在視頻大模型3.0階段,可以實現更豐富的物理運動,視頻大模型也將具備劇情設計、分鏡、轉場等能力,值得用户和行業期待。
談及視頻垂直場景,吳欣鴻認為,視頻垂直場景與AI原生工作流的結合,在AI視頻生成、AI視頻編輯、AI視頻渲染等領域有巨大應用機會。美圖正在上述領域進行創新探索,新產品將在今年6月的美圖影像節上亮相。
自2014年起,美圖公司通過美圖秀秀、Wink、開拍等一系列影像工具,持續助力網絡視聽內容創作。目前,Wink已進入中國視頻編輯賽道前三名,開拍已成為口播博主的新寵。
截至2023年12月,我國網絡視聽用户規模達10.74億。2023年網絡視聽市場規模首次突破萬億元。
針對網絡視聽的內容生產和產業發展,吳欣鴻表示,美圖公司將全力推進自研大模型的視頻能力,為網絡視聽行業提供更優質的視頻創作工具。