本文來自格隆匯專欄:中金研究,作者:趙麗萍 陳星宇等
決策AI已經在互聯網行業證明具備顯著的商業價值,是互聯網巨頭智能化轉型的底層推動力,但在傳統行業中仍處在商業落地初期,尚有較大滲透潛力。本文認為,決策AI是傳統企業數字化轉型的底層推動力,能夠在數據積累成熟的銀行、零售等行業率先落地,完成職業增強或替代從而實現降本增效。在AI研發成本高企、人才稀缺的背景下,以平台為中心的決策AI是落地趨勢,有望降低企業的AI應用門檻,助力智能化轉型。
摘要
決策AI是數字化轉型的重要支撐,也是數據爆發的必然結果。數字化轉型經歷“信息化數據積累-基於大數據決策”兩大階段,銀行及能源等傳統行業具備較好的大數據積累,基於數據的決策AI應用是幫助企業實現數字化轉型的主要推動力。中國決策AI市場坡長雪厚,根據灼識諮詢,2021年決策AI市場規模約460億元,預計2025年達1,850億元,CAGR達47%,有望成為增速最快的AI細分賽道。
以平台為中心的決策AI是降低AI應用門檻的核心,也是未來落地趨勢,核心技術包括AutoML、強化學習、遷移學習等。決策AI算法生產目前已經入“工業革命”階段,其底層支撐技術包括AutoML、強化學習、環境學習、遷移學習、無監督學習、聯邦學習等,其中AutoML能夠實現建模流程自動化,是降低AI應用門檻的核心,強化學習+環境學習能夠較好解決應用中高試錯成本痛點,遷移學習在小數據場景具備明顯優勢,無監督學習則可以在無標註前提下冷啟動建立高精度模型。企業落地AI具備認知、數據、技術人才三道門檻,因此以平台為中心的決策AI是落地趨勢。
落地層面,決策AI已經在互聯網行業創造了顯著價值,逐漸在銀行、零售、自動駕駛等領域百花齊放。C端,字節跳動在互聯網下半場突圍,核心在於決策AI個性化推薦算法驅動的商業模式創新,隨後推廣至多互聯網公司。B端,決策AI基於海量數據挖掘規則,率先在金融、零售等結構化數據成熟的行業落地,銀行反欺詐/反洗錢、APP精準營銷和零售供應鏈管理、製造業質檢和運營優化以及藥物研發均有成熟落地案例,頭部廠商在決策AI領域積極佈局尋求智能化轉型。G端,決策AI也已在交通控制、醫保欺詐風控等領域發揮重要價值。
風險
國內技術進步不及預期,AI落地節奏慢,行業競爭加劇。
正文
從感知AI到決策AI,人工智能發展重心演變
AI技術正經歷從感知AI到決策AI演變的關鍵節點。感知AI與決策AI是通用人工智能的兩大基石,感知AI是自環境中獲取信息,完成提取要素、分析、得出結果的過程,是對環境的靜態感知,計算機視覺是典型代表,目前發展相對成熟;決策AI則泛指動作控制、風險管理、運營規劃、營銷等複雜的決策,即獲取來自環境的信息後,行為和環境產生動態交互,因此行為具有一定不確定性且更為複雜。在大量的實際應用場景中,以強化學習為主的決策AI能力能夠突破大規模落地的瓶頸,因此,AI技術正進入從感知到決策AI的重心演變。
圖表:決策型AI涉及和環境的動態交互,感知型AI則為靜態感知
資料來源:OpenDILab,中金公司研究部
與技術發展階段對應,企業數字化轉型經歷兩大階段,階段二決策AI技術是關鍵。傳統企業數字化轉型經歷兩大階段:階段一,企業進行業務數字化、流程線上化的遷移,數據逐步積累,此階段感知AI是關鍵,以視覺AI為典型代表,已在零售、銀行等領域較大規模落地;階段二,企業基於成熟的數據積累,利用決策AI模型通過大數據提取規律,代替業務專家做決策,例如,互聯網巨頭基於用户點擊、購買行為刻畫人物畫像並進行精準營銷。數字化轉型過程中,決策環節所能創造的商業價值巨大。
圖表:數字化轉型從感知AI到決策AI兩階段
資料來源:中金公司研究部
受益於深度學習,感知AI自2012年起算法泛化能力明顯提升, AI在視覺領域已能突破人眼水平。2012年,在Hinton團隊設計的AlexNet廣泛應用下,簡單特定任務閉集得以實現;隨後2014-2016年,DeepID和FaceNet等算法取得突破,計算機視覺能夠實現一定複雜任務,並在特定領域突破人眼水平;2017-2020年,AutoML等半自動模型訓練技術逐漸推廣,一定程度上替代了複雜的人工調參;2020年起,以商湯科技為代表的大模型路徑(即通用預訓練模型)幫助解決現實中大量長尾問題,大模型路徑也在谷歌、Facebook、特斯拉、華為等國內外巨頭之間得到認可。
圖表:泛感知AI發展歷程梳理
資料來源:上海人工智能實驗室,中金公司研究部
決策AI的數據收集成本更高,因此算法落地尚處於早期,也在深度學習興起後迎來高速發展。2012年Google DeepMind團隊推出強化學習DQN以來,決策AI進入發展新階段;2016年,AlphaGo戰勝世界圍棋冠軍李世石,決策AI在中等特定環境中已能夠實現超過人腦,但其核心是基於仿真環境或已知模型的閉集,在現實世界中收集數據成本過高,決策AI的泛化能力受到限制,突破的重要因素是環境和算法的革新,並實現標準化。
圖表:決策AI發展歷程梳理
資料來源:上海人工智能實驗室,中金公司研究部
在應用層面,決策AI難點在於會改變環境反饋的狀態和環境本身,動作具有不唯一性。在實際應用中,1)AI動作產生後,相對於環境所處的位置發生變化,從而改變環境反饋的狀態;2)決策AI動作可能會改變環境本身,比如交通場景中,單車的遵守或違背規則的決策會直接影響交通環境,改變整體環境的狀態,動態交互的過程對決策AI技術提出了極其嚴格的要求;3)鑑於環境的動態性和複雜性,決策AI的動作很多情況下不唯一,不同結果差別懸殊。
我國人工智能市場中,決策AI增速最快。決策AI市場規模僅次於視覺AI,2025年市場規模有望達到1,847億元。據灼識諮詢,2016-2020年決策AI市場規模CAGR高達83.5%,預計2021-2025年CAGR達47.1%,決策AI有望成為人工智能增速最快的賽道。
圖表:中國AI行業細分市場中,決策AI規模增速最快
資料來源:灼識諮詢,中金公司研究部
決策AI市場集中度較高,CR5超50%,頭部AI廠商與互聯網巨頭卡位。根據灼識諮詢,AI解決方案分為以平台為中心的解決方案和單點解決方案兩種,其中以平台為中心的決策AI解決方案除提供應用外,也提供AI開發平台,包括統一的開發標準、高兼容性和靈活拓展應用。我國以平台為中心的決策AI為未來趨勢,以2020年收入口徑測算,第四範式在國內以平台為中心的決策AI市場份額排名第一,市佔率18.1%,互聯網巨頭百度、阿里、華為、騰訊則依託於頭部技術與資源,佔據2-5名卡位,CR5超過50%,決策AI市場集中度較高。
圖表:國內決策AI市場集中度較高(以平台為中心的市場),2020
資料來源:第四範式招股説明書,中金公司研究部
科技發展進入第四範式,數據智能為數字化轉型的核心驅動力
科技發展進入第四範式,數據驅動科學規律的發現,決策AI是實現數據智能的關鍵技術。圖靈獎得主Jim Gray於2007年提出,科學的發展在經歷了數據規律探索後已經進入第四範式,即數據密集型科學研究範式。在這一區間內,科學家沿着探索規律的主線,逐漸以更高效的機器代替人腦,並通過海量數據和算力來探索前沿。深度學習具備數據-模型反饋優化機制,我國市場廣大、應用場景豐富,互聯網、銀行業數據資源領先世界,AI在國內落地具備天然優渥土壤與良好條件。在成熟數據基礎驅動的第四範式階段,決策AI基於大數據提取規律,代替傳統專家規則做出決策,是實現數據智能的關鍵技術。
圖表:科學發展進入第四範式
資料來源:第四範式官網,中金公司研究部
中國企業有望在新的技術發展範式階段,依靠數據優勢率先實現基於決策AI的數字化轉型。據IDC測算,隨着通訊設備、IoT設備接入數量與應用豐富度增加,中國的數據量有望在2025年達到48.6ZB,2018-25年數據量增速CAGR約30%,高於全球3ppt,此外,2025年,僅中國智能互聯設備有望達800億,數據優勢為數字化轉型打下良好基礎。
圖表:我國具有顯著的網民規模優勢,具備天然優渥土壤
資料來源:CNNIC,ITU,艾瑞諮詢,中金公司研究部
企業數字化轉型,決策AI是關鍵驅動力
從“工業時代”到“烏卡時代”,以數據驅動的決策模式是企業管理升級的關鍵。“烏卡時代”在商界率先由寶潔公司CEO羅伯特提出,在2020年疫情後更為高頻,用於形容我們所處環境的易變、不確定和複雜性。從“工業時代”到“烏卡時代”,企業面臨供需關係的飛速變化,企業管理更具挑戰性,因此以數據驅動實現智能化轉型是企業管理升級的關鍵。
機器參與的環節已從執行上升到策略制定。企業的內部角色大體分成:高層戰略制定、中層策略制定、基層策略執行。深度學習賦能前的AI多用於替代人工重複性的工作,即執行環節,隨着決策AI的技術成熟和落地,非戰略制定層面的決策可以由AI完成,且決策AI在營銷、風控、運營決策甚至具備超越人腦的優勢。
本質上,決策AI替代各行業專家從結構化數據中挖掘業務規律,且效率超越大部分人類數據專家。人工智能的核心是從數據中心發現規則,指導企業做出更為精準的決策。以百度鳳巢搜索系統為例,過去團隊工程師耗費數月積累上萬條專家規則,用於廣吿推薦,在應用了深度學習技術後,決策AI挖掘的數據規則數量快速攀升至上億級別,實現“rule base”到“transition base”的轉變、從量變到質變的切換。
圖表:非戰略級別決策可以由決策AI替代
資料來源:第四範式公眾號,中金公司研究部
AI助力企業數字化轉型價值顯著,但企業落地AI需跨越認知、數據、算法三道門檻。
►認知門檻:企業落地AI的認知門檻可大體分為兩類,1)高管團隊對AI創造增量價值的認知和推廣意識不足,根據灼識諮詢,國內72%企業處在AI落地的單點試驗和局部推廣階段,AI廠商的早期推廣核心在於增加公司核心管理層對於AI應用的認知,即從0至1過程;2)業務部分與技術部門的認知結合不充分,深度學習具有較高技術門檻,業務人員也具有自身深刻的業務積澱,傳統模式下技術人員難以高效地將AI技術服務於業務,因此,通過平台將技術與業務的認知相結合是亟待解決的問題。
圖表:國內72%企業處在AI單點試驗至局部推廣的早期階段
資料來源:灼識諮詢,中金公司研究部
►數據門檻:大數據分為BI和AI大數據,傳統意義下大數據多為BI所設計,旨在幫助IT工程師實現數據查詢、統計和展示功能,喪失了數據的原始完整、實時和閉環特徵,因此,部分具備初步結構化數據庫的企業仍難以有效落地AI,BI大數據甚至成為AI落地的阻礙。
►技術及人才門檻:AI模型生產過程中,耗時的環節之一是調參,其要求的頂尖的AI技術人才在全球範圍內較為稀缺,且即使是頂級調參師也需要耗費數月完成一個AI模型的參數設置,過分強調了調參師的能力,不能滿足AI模型工業化生產的需求。AutoML技術能夠使得無技術背景的業務人員開發AI模型,將AI模型開發週期縮短為幾天,得以降低AI在企業落地的門檻。
相較於企業自主開發AI系統,以平台為中心的決策AI能更好地解決三大門檻痛點,是未來落地趨勢。在企業數字化轉型進程中,自建AI對於大部分企業來説高門檻帶來高試錯成本。儘管不乏互聯網巨頭的開源框架,但自由調度使用發揮作用依舊比較困難。相比於自建,藉助外力引入成熟的AI平台則會更為高效,只需要擁有數據並明確業務目標,即可擁有先進AI能力,助力企業智能化轉型。
決策AI率先在互聯網行業落地並創造顯著商業價值,目前逐步向銀行金融及各行業具備完善信息化基礎的行業龍頭滲透。以銀行為代表的金融行業是次於互聯網、政府的數字化轉型先鋒行業。銀行業資產規模大,有充足的數字化研發投入資本,在金融領域數字化轉型最早,擁有豐厚的技術儲備與IT人員,且商業流程基於數據,具備良好的數據儲備。此外,零售、餐飲行業的數字化程度也較高,具備決策AI落地的潛力。
圖表:銀行在傳統行業中具備較好的數據基礎,決策AI率先滲透
資料來源:賽迪顧問,神策研究院,中金公司研究部
AutoML:降低AI應用門檻的核心方法論
傳統企業數字化轉型過程中經歷人工階段、基於專家規則的人工智能階段和基於機器的人工智能階段。
►階段一:人工階段。依靠業務人員經驗,提煉業務中的規律並推廣到更多實際操作中,但數量有限,依賴專家技能和經驗,且遠不能覆蓋長尾情況。
►階段二:基於專家規則的人工智能。為AI專家基於業務場景來提取規則,相較於階段一,AI模型的覆蓋業務廣度與決策效果均大幅改善,企業擁有AI能力的侷限性在於面臨數據、人才、技術等多個門檻。根據Gartner,培養一位合格的AI科學家需要6-10年時間,具備AI技術與研究經驗的專家年薪上百萬,遠超普通傳統企業可承擔範圍。
►階段三:基於機器的人工智能。隨着AutoML技術誕生,企業進入基於機器的人工智能階段,涉及的維度和效果進一步提升,但技術門檻大幅降低,大部分傳統企業在數字化轉型中“用得起”AI。
圖表:傳統企業智能化的三階段
資料來源:2018年世界互聯網大會,第四範式公眾號,中金公司研究部
AutoML本質上並不指具體AI技術,而是降低AI門檻的方法論、技術發展方向。AutoML技術框架中包含多項子框架:自動特徵處理、自動算法選擇和匹配、自動傳統機器學習、自動深度學習等。使用AutoML之前,傳統企業引入AI能力需要3-6個月,AutoML可以將該過程縮短至幾小時。AutoML作為思想貫穿在多類機器學習過程中,降低AI在企業落地的門檻。
圖表:AutoML彙集多種人工智能技術
資料來源:CSDN,中金公司研究部
AutoML替代生產AI模型的科學家,帶來AI模型生產的工業革命。AutoML減少人類專家在機器學習全過程中的參與度,核心在於由企業的數據自動提取規律、建立模型,大幅降低AI的應用門檻,解決了AI人才短缺、成本高昂和無法規模化推廣應用的痛點。AutoML將技術與業務強耦合,使得業務人員也能成為AI使用者,幫助企業在數字化轉型中創造更多價值。
企業數字化轉型層面,AutoML通過機器學習流程自動化,算法自動挖掘大數據中的新規律,降低對於AI科學家的依賴,從而降低AI落地門檻。在AutoML的支持下,AI模型可以根據數據自動提取特徵,進行學習、調參,降低AI模型的實施成本、人力工作量和調參等環節複雜程度,同時,擺脱人力即可不斷進行AI模型的自動更新迭代,降低AI在企業的落地門檻。
圖表:AutoML自動化機器學習建模全流程
資料來源:Gartner,中金公司研究部
從落地效果看,AutoML已具備在諸多場景替代AI科學家的潛力,能自動執行AI流程中的大部分工程性任務。開發人員在AutoML的幫助下可以聚焦於客户業務需求,AI落地過程也不再依賴高成本的AI科學家,目前的決策AI龍頭廠商和百度、阿里、華為等互聯網頭部廠商積極佈局AutoML能力。基於Kaggle機器學習競賽結果,Google Cloud AutoML、第四範式AutoML已分別能超過46%、98%的AI科學家,在違約風險預測、二手車風險預測、社交網絡預測等認知領域具備替代AI專家的技術水平。此外,以商湯佈局的機器視覺大模型領域為例,AutoML可以解決半自動視覺超大模型設計與優化問題,進一步提高AI模型的生成效率、降低行業落地門檻。
強化學習:解決大規模連續精準決策問題
強化學習是決策AI核心技術,擅長制定動態策略,應用典例包括圍棋程序AlphaGo和電競AlphaStar,近年來在工業控制、自動駕駛等領域取得良好進展。強化學習是通過決策主體與決策環境不斷交互,以分數為導向,獲得得分反饋,從而在多次試錯中尋求最優分數的過程。
►AlphaGo圍棋程序基於深層神經網絡,經歷AI科學家16萬局監督學習和3千萬局計算機自博弈訓練的強化學習過程,先後擊敗李世石、柯潔等世界冠軍。其中,強化學習的意義在於將策略目標確定為贏取比賽,訓練出強化學習的落子策略,通過優化自我博弈的終局來提升有監督學習訓練中的策略網絡。
►AlphaStar是首個在沒有遊戲限制的條件下進入電競頂級聯賽的AI,在《星際爭霸》中與大師級別玩家對戰。制定策略是《星際爭霸》中的關鍵挑戰之一,每一步中,一個代理可能對應1,026種操作的可能,且代理需要學習在終局之前的數千種操作,基於強化學習、模仿學習等技術,AlphaStar在自我遊戲中基於人的策略開展偏見性的探索,允許從舊的遊戲策略中有效更新為新策略,最終在Battle.net上玩家排名超99.8%。
圖表:AlphaGo基於強化學習制定落子策略
資料來源:深度學習科研平台公眾號,中金公司研究部
實際決策場景往往需要大規模連續實施決策問題。基於專家或傳統機器學習的優化方式難以解決現實場景中的複雜問題:1)實際決策場景中影響因素龐雜無序;2)實際場景中通常更重視長期回報,需要連續而非單次決策,效果具有滯後性;3)現代商業中決策需要精細化,決策量大且部分依賴毫秒級響應機制。
強化學習適用於大規模連續實施精準決策問題等複雜場景。1)深度強化學習藉助深度學習,使得決策策略可以將複雜場景的大量因素考慮進來;2)結合分數分配(credit assignment),可量化連續決策的長期結果;3)在決策鏈中,可以實現不同決策層級的自主決策,因此,強化學習得到的策略可具備實時響應能力。
圖表:強化學習以分數為導向,在多次試錯中尋求最優分數
資料來源:CSDN,中金公司研究部
實際應用層面,高試錯成本是限制強化學習落地的重要因素。強化學習技術依託於試錯後的反饋做出最優決策,在真實環境中的試錯代價很高且不可逆,例如無人駕駛事故、排產調整、疫情下是否封城等,因此,目前典型場景下的試錯成本限制了強化學習在實際場景中的大規模落地。
環境學習:強化學習的最佳幫手,基於數字孿生和仿真模擬的技術革新
環境學習是指利用模擬器來輔助人的判斷。過去,輔助決策依賴數字孿生和仿真模擬等技術。數字孿生是指利用傳感器等系統收集的數據,來打造與物理世界相一致的全生命週期的數字化系統,核心在於幫助企業完成決策流程中的“觀察”環節。
環境學習能夠較好地結合“觀察”與“判斷”,彌補數字孿生、仿真模擬的缺陷。環境學習融合了基於大數據的機器學習和專家驅動的模型,構建更接近複雜實際業務的虛擬環境。在疫情防控中,AI廠商採用環境學習推演方案,相比於傳統的傳染病SEIR模型誤差降低超90%。
►數據方面,環境學習融合打通專家經驗與大數據,解決數據孤島問題;
►定量分析方面,專家難以基於大數據做出判斷,環境學習則由機器學習及非梯度類優化技術補足虛擬環境的細節,並通過機器自學習循環迭代,快速追蹤變化,並及時反饋到模型中,解決what-if及預測類問題;
►推演決策方面,融合了專家與大數據的優勢,環境學習能夠基於更精準的虛擬環境,提供精準的輔助判斷,推演不同決策結果下的業務進展。
圖表:環境學習將機器學習與專家知識結合起來,更好地輔助人的決策
資料來源:第四範式公眾號,中金公司研究部
強化學習+環境學習可以解決試錯成本高的痛點。環境學習加速了強化學習落地,通過環境學習構建虛擬環境,為強化學習提供低成本試錯和迭代的環境模型,很大程度上減少真實環境中試錯的採樣,大幅降低試錯成本。二者的融合方案構建了機器的自主決策能力,打通“觀察”、“判斷”、“決策”和“行動”四大環節。基於環境學習+強化學習的解決方案已在業內廣泛推廣,落地於產品研發、派工排產、精準營銷等場景中,供應鏈成本得以大幅降低。
圖表:環境學習讓強化學習落地成為可能
資料來源:WAIC 2021,中金公司研究部
遷移學習:解決AI在小數據層面的應用問題
遷移學習(Transformer learning)旨在發現共性,實現知識遷移複用,幫助AI在數據敏感或稀缺領域落地應用。遷移學習本質是把源領域的知識遷移到新目標領域,通常情況下,源領域的數據量充足,能夠訓練出精度性能較為優越的模型,而目標領域數據量不足,因此基於源領域的模型在新目標領域的小數據中迭代,目標領域往往能夠達到更好的學習效果。在通用人工智能的大背景下,遷移學習重要性凸顯。Transformer大規模預訓練模型已成為學界與國內外互聯網巨頭一致認可的路線,遷移學習是底層技術基礎。
圖表:相比於傳統機器學習方法,遷移學習指不同領域間知識的遷移
資料來源:大數據與人工智能Lab,中金公司研究部
遷移學習具備小數據、可靠性、個性化三大優點:
►小數據:現實生活中小數據居多,在小數據中實現人工智能才是達到通用智能。人臉識別場景中人臉數量規模上億,訓練過程中可以充分挖掘規律,準確率達到99%已具備充分的技術實力實現。但在工業領域,產線差異較大,單產品的缺陷、形態類別數據不足一百個,而工業零部件的精度要求則高達99.9%,在智能製造等各類數據短缺的領域,遷移學習對於AI落地十分必要。
►可靠性:建造通用的AI系統可以在不同領域之間進行知識遷移、“舉一反三”,在底層模擬人腦的學習過程,具備可靠的知識遷移效果。
►個性化:基於個體的個性化數據往往由通用系統中疊加個人的小數據得來,遷移學習是其中發展個性化的有效工具。
無監督學習:無標註情況下的機器學習
無監督學習是在無標註情況下,探索數據機構來提取信息。從是否有標註的層面上看,機器學習為監督學習、無監督學習和強化學習。監督學習是指在標籤規則已知的情況下進行學習,強化學習則是依據和環境的多輪反饋進行策略決策,無監督學習則是在缺少標籤、規則的情況下,自主探索數據結構來提取有價值的信息,弱監督或半監督學習介於有監督和無監督之間,常用於標籤不確定、少量標籤情況自主挖掘和使用規則。
圖表:監督學習與無監督學習對比
資料來源:大數據DT,中金公司研究部
無監督機器學習具備三個顯著優勢:
►不依賴歷史標籤:無監督學習不依賴數據標籤,因此能夠更靈活高效地發現未知的“特殊”行為,例如銀行欺詐。
►在生命週期中較早期也常用:相比於監督學習適用於成熟數據場景,無監督學習在生命週期中早期場景中也適用,比如對於銀行異常賬户,開户申請過程中的異常行為也可以被識別。
►可解釋性強:深度學習在多場景應用中因AutoML的助力更為高效,但同時存在解釋性差的“黑箱”弊端,相比之下,無監督學習能夠識別銀行欺詐中的具體異常行為聚集點,具備決策判斷依據,具備較高的可解釋性。
無監督/半監督學習帶來銀行反洗錢識別新模式。反洗錢場景下,歷史標籤樣本稀缺,但新型洗錢方式層出不窮,確定的“壞人”標籤大部分在產生損失後才能得出。同時,洗錢活動具有很強的團伙性和潛伏性,監督學習多關注單賬户屬性,因此難以直接鑑別。無監督學習從聚類明顯、可疑度高的團伙中提取關聯特徵,訓練模型,同時通過聚類異常檢測和模型將結果可視化,可解釋線索可以輔助專家調查,指導系統調優,進入自迭代、自學習的閉環,及時識別洗錢交易。
聯邦學習:保護隱私的前提下,實現多方數據聯合訓練
聯邦學習作為分佈式機器學習方法,解決隱私安全及數據孤島問題,是下一代AI算法協同協作的基礎。聯邦學習是新興的AI基礎技術,最早由谷歌在2016年提出,本意是解決安卓手機終端用户在本地進行模型更新的問題,目標是能夠在不共享本地數據的情況下,對多主體的數據聯合建模,技術上保護數據安全,同時解決數據孤島問題。
具體而言,聯邦學習中數據不出本地即能進行訓練,並由中央服務器協調建模。聯邦學習允許多個協作者協同訓練基於多方數據的全局模型,全過程無需分享本地數據,由聯邦學習系統的中央服務器作為協調者,中央服務器將現有全局模型發送給各方,各方根據本地數據訓練模型,並將更新的各方模型返回中央服務器,由中央服務器對全局模型統一更新,此為一輪更新。其中,設備與中央服務器之間交換的是加密模型,經多輪迭代,聯邦學習完成對模型的訓練。
圖表:相比傳統機器學習,聯邦學習構建多源數據應用生態
資料來源:中國信息通信研究院,中金公司研究部
聯邦學習是新興突破性質的AI底層技術,具備無可比擬的優勢。多個參與方能夠參與協作,共同訓練高精度AI模型,各參與方地位平等,且具備完備的數據隱私保護機制,模型信息以加密方式進行傳輸,能夠在不犧牲數據安全的前提下實現AI模型“共贏”。
圖表:聯邦學習的主要特徵
資料來源:中國信息通信研究院,中金公司研究部
廣吿投放是適用聯邦學習的典型場景。廣吿投放場景中往往包含媒體、廣吿主、第三方廠商作為參與方,分別提供媒體上的行為信息和人物畫像、過往廣吿反饋、其他樣本特徵。在數據分離的情況下,模型訓練層,媒體可以通過引入分層的模型加密,實現廣吿主和第三方的聯合建模;在模型管理層,媒體可以對聯邦學習的模型進行管理;在模型調用曾,多方分別研發引擎,在權限內使用模型,將結果用於廣吿推薦場景。
圖表:聯邦學習落地於廣吿投放場景案例
資料來源:中國信息通信研究院,明略軟件,中金公司研究部
C端:決策AI率先落地,為互聯網巨頭創造顯著價值
字節跳動在互聯網下半場突圍,核心在於決策AI驅動的商業模式創新
C端算法推薦誕生於海外互聯網平台,字節跳動標誌着國內互聯網應用開端。1998年,亞馬遜平台基於協同過濾算法為用户個性化推薦商品,這是算法推薦第一次成功的商業化實踐,助力亞馬遜銷售額增長百倍;隨後Netflix和YouTube基於個性化信息流將算法拓展至視頻平台。算法推薦在國內的落地開端是2012年今日頭條APP上線,3個月內今日頭條APP即獲得了超1,000萬註冊量,隨後在字節其他業務線和美團、滴滴等其他互聯網公司迅速推廣。
圖表:算法推薦發展史
資料來源:各公司官網,中金公司研究部
字節跳動在互聯網下半場突圍,本質在於決策AI驅動的商業模式創新。今日頭條為字節跳動建立了原始的數據積累並培育了個性化推薦系統,上線3個月後日活即突破100萬,2015年成為僅次於騰訊新聞的國內第二大新聞類APP,積累大量原始用户數據。今日頭條率先為個性化推薦技術完成打磨並做好大規模應用的鋪墊,將推薦模型推廣到字節旗下西瓜視頻、火山小視頻、抖音等應用。推薦系統對於字節跳動本質上是藉助決策AI在大數據中積累上億條規律,實現商業模式的創新。
技術視角,以字節跳動、美團為代表的互聯網公司個性化推薦系統的本質是基於深度學習,從大數據中找規律,實現精準營銷。互聯網公司推薦系統架構相似,基於用户、內容與外部信息的大數據,採用多種推薦算法並進行多路融合和過濾,形成推薦排序,其中推薦算法包括:基於內容的推薦算法(基於內容標籤推薦強相關內容)、協同過濾算法(將用户按興趣聚類,推薦相似興趣的用户喜歡過的內容)、基於知識的推薦算法(構建領域本體,將以上方法融合)等。本質是在海量數據源中挖掘規則,並基於不同算法進行打分排序進行精準營銷,並用AI輔助風控審核。
圖表:字節跳動個性化推薦技術形成自數據至商品推薦的決策閉環
資料來源:火山引擎,中金公司研究部
B端:在金融、零售、能源、製造、醫療等行業多點開花
決策AI始於互聯網行業,逐步推動傳統行業數字化轉型。決策AI可以在海量數據中學習,在分秒之間打通決策環全流程,我們認為未來決策體系有望從“人為決策中心”向“人機協同”演進。傳統企業不具備與互聯網巨頭匹敵的研發人才與資金投入,決策AI廠商及互聯網AI平台通過將技術產品化、平台化,降低AI使用門檻,推動傳統行業數字化轉型,幫助企業享受AI帶來的價值增益。決策AI率先在結構化數據成熟的金融業落地,再向零售、製造業等信息化基礎較好的龍頭滲透。
圖表:B端金融、零售、製造、醫療行業數據產生量位居前列,2019
資料來源:智研諮詢,中金公司研究部
決策AI在營銷推薦、預警及運營預測等職能中可以實現職業增強或替代,助力傳統企業智能化轉型。根據灼識諮詢,以平台為中心的決策AI解決方案前五大供應商主要為金融、零售、能源、製造等行業客户提供平台型解決方案,聚焦營銷推薦、預警和運營預測功能。
圖表:決策AI助力企業在營銷推薦、預警、運營預測等多領域轉型
資料來源:各公司官網,中金公司研究部
決策AI+金融:基於成熟數據積累,營銷推薦與風控預警已大規模落地
銀行、券商所在的金融行業具備較為成熟的數據積累,領跑數字化轉型進程。頭部銀行每年百億元IT預算中,近年來多用於大數據、人工智能佈局,借貸風控、理財產品營銷推薦等領域已在金融行業具備成熟落地應用。
►營銷推薦領域:將海量客户和龐大的營銷產品體系快速精準匹配,在減少營銷打擾的前提下最大化營銷收益。
決策AI幫助銀行精準營銷,降本增效。決策AI能夠基於海量非結構化數據,實現基金產品推薦模型效果驗證,替代信用卡、理財經理角色向潛在客户定向投放產品。以全球龍頭商業銀行為例,通過業務部門和AI科技團隊配合,搭建決策AI營銷數據自迭代平台,對目標客户羣外呼營銷形成產品購買的成功率提升約200%,響應率提升且有效優化了客户體驗。
決策AI助力證券公司發掘潛在用户,精準營銷。券商借助決策AI技術對用户投顧行為建模並得出打分,將分數高於閾值的用户定義為潛在用户,進行線上/線下營銷。對比AI規則和專家規則,AI規則營銷準確率提升4.03%,並發現線下營銷成功率是線上的三倍。基於這一結論大力推廣線下營銷力度,營銷成功率最高可及線上的12.8倍。在證券公司歷史客户激活場景中,決策AI助力下激活率為專家規則模型下的4.5倍,整體營銷策略匹配度高達72.3%。
圖表:證券公司藉助決策AI助力投顧客户挖掘(左)和歷史客户激活(右)
資料來源:第四範式官網,中金公司研究部
►風控預警領域:精準刻畫每一筆交易背後的欺詐風險、洗錢等違法行為風險,並在毫秒之間做出決策,提升效率的同時儘量避免違法違規交易。
決策AI挖掘反欺詐規則,幫助銀行降低風險。決策AI可以實現自獲客至放貸前中後期的全線管理,替代人工審核員識別並阻斷可疑交易。藉助決策AI與傳統專家規則相結合的方式,頭部決策AI廠商已助力國有大行推行智能反欺詐服務,線上測試結果中,控制48%召回率不變,模型的準確率可達83%,較原有規則提升了316%。興業銀行信用卡中心處理單筆交易僅需20ms,99.9%的交易可在50ms內完成,同召回率下準確率提升5倍。
決策AI助力銀行識別反洗錢交易,大幅節約人力成本。決策AI助力快速識別高風險洗錢案宗,頭部30%的案宗召回率可達90%,前70%的案宗召回率達99.6%,在無明顯遺漏情況下,可拋棄尾部案宗,大幅節約人工成本。
圖表:銀行藉助決策AI助力反欺詐系統(左)和反洗錢系統(右)
資料來源:第四範式官網,中金公司研究部
決策AI+零售:頭部零售企業採用決策AI助力精準營銷和精細化運營
零售行業中頭部廠商數據積累充分,供應鏈較為成熟,適合決策AI落地。在私域流量運營大趨勢下,對於現有客户的適時激活和潛在客户的精準營銷是獲客端經營重點,此外,生產運營端,自選址至供應鏈全鏈條管理均存在精細化運營降本增效的需求,決策AI提供技術助力。
►營銷推薦領域:借鑑互聯網推薦算法,決策AI將推薦原理遷移至線上零售。
百勝中國旗下品牌APP藉助決策AI,實現精準營銷。公司構建決策AI平台,在數據資產整合、餐廳人貨場管理、物料追蹤方面持續優化運營,同時精細化運營旗下餐飲連鎖品牌APP的私域流量客户,決策AI技術通過提取用户個性化特徵(瀏覽、下單行為等)和社會性特徵(性別、收入水平等),將規則從幾十條拓展至2,000萬條,實現精準推薦,為客户帶來營收增量。
圖表:決策AI助力百勝中國旗下廠商精準推薦
資料來源:第四範式公眾號,中金公司研究部
►運營預測領域:基於打通供應鏈全鏈條數據,進行銷量預測和運營動態調整。
決策AI在線上運營、門店選址、智慧供應鏈等領域助力企業精細化運營。零食品牌來伊份在全國擁有超3,000家門店及3,000餘萬會員,已完成信息化佈局。2021年,來伊份與華為雲及決策AI廠商開展戰略合作,將運營思維從“商品運營”切換至“消費者運營”,從“今天進店多少人”轉換至“今天進店的是什麼人”,盤活供應鏈體系。此外,打造智慧供應鏈體系,形成“門店選址——個性化營銷——消費趨勢預測——物品佈局——優化選品策略——貨架監測及補庫存”的智能決策閉環,將運營效率提升約20%。與之類似,良品鋪子、周黑鴨等知名零售企業與華為雲展開合作,打造全渠道智能零售管理平台,實現數字化轉型。
圖表:決策AI助力打造智慧供應鏈
資料來源:第四範式公眾號,中金公司研究部
展望未來,決策AI技術在零售行業有望“由點及面”向全業務全流程滲透,面向多業態鋪開。決策AI在精準營銷和運營管理領域已有成熟落地方案,但在無人零售、消費者行為洞察等領域還處於打磨初期,對於不具備互聯網基因、缺乏原始數據積累的零售企業,將AI與業務有機結合起來仍需探索。我們預計,隨着AI算法不斷優化、新一代人工智能基礎設施完善和應用場景打磨催化,AI+零售將“由點及面”逐步滲透。
決策AI+能源:攜手頭部企業強化能源預警和運營預測
能源產業具備重資產屬性,具有較為成熟的數據積累,但大數據分析及AI應用發展較為早期。能源行業正從傳統生產型業務,加速向綜合能源服務、能源數字化等方向轉型,加速數字化成為行業共識,以國家電網、中國石油、中國石化為代表的龍頭公司率先探索能源行業預警及營運智能化,為產業結構轉型做出示範。
►預警領域:準確定位故障信號,完成端到端安全預警。
中國石油借力決策AI實現管道光纖安全預警。中國石油藉助決策AI平台,搭建從光纖信號採集、存儲、實時檢測與分析,到管道異常信號報警的端到端安全預警應用,大大提升管道破壞事件預警的及時性、準確性,替代了人工檢測員的職能,保障油氣長輸管道平穩運行。
龍頭電網公司以決策AI算法協助風機設備故障預警。電網公司通過AI算法構建故障診斷模型,判斷機組隱含或現存的故障信息,並智能化分析故障模式、產生原因。在200餘次齒輪箱故障檢測中,決策AI算法模型下故障檢測準確率大幅提升,保證召回率達100%,兩個月內預測準確率在81%以上。
圖表:決策AI助力石油管道異常檢測(左)和風機設備故障預警(右)
資料來源:第四範式公眾號,中金公司研究部
►運營預測領域:預測石化產品價格,打造智慧能源服務平台。
國內龍頭石油化工企業基於GBRT等AI算法提升化工品價格預測與油層識別準確率。基於市場供求關係、化工產品成本、銷售體系及金融形勢等多重影響,決策AI對化工品價格預測的平均準確率從97%提升至99.33%,1-7天預測的最高準確率達到99.99%。此外,國內龍頭石油化工企業依託AI技術完善檢測系統、診斷系統、運營系統和監管平台,形成閉環的油田智能服務平台,油層識別率提升96%。同領域,中海油與阿里雲合作,打通天然氣氣井、生產平台、運輸管網、上岸加工全鏈條,為複雜地質環境加上“AI決策大腦”;中石油全資子公司大慶油田與華為雲合作,利用工區數據對地質結構進行分析,進而調整油田開發方案,助力油田精細開發和增儲上產。
圖表:決策AI助力化工品價格預測(左)和油層識別(右)
資料來源:第四範式公眾號,中金公司研究部
決策AI+製造:生產線精度要求高,質量檢測與運營優化率先落地
我國製造業正處在自傳統生產模式向數字化、智能化發展的新階段,生產線追求高精度,對算法定製化要求高,以AutoML為主的決策AI能力起到關鍵作用。製造業具備豐富的場景、規模化的生產線和海量數據,但工業驗收對精度要求較高。以手機為例,一部智能手機有幾百個零件,以200個作為假設,如果要實現整機良品率99.9%以上,單零件的良品率至少達到5個9的準確率,人工調參難以滿足複雜算法的需求,AutoML為主的決策AI能力可以在銷售線索評級、排產派工、異常和缺陷檢測等流程發揮重要作用,實現職業替代,大幅提高效率。
寧德時代的電池生產線中,決策AI助力產品研發、產線質檢、排程優化等環節。公司電池生產的核心目標之一是降低研發缺陷率,2020年提出動力電池缺陷率從ppm(百萬分之一)級別向ppb(十億分之一)級別提升,決策AI基於研發-生產的全鏈條智能化檢測助力目標實現。在塗布工序質檢場景中,決策AI模型對運行狀況、任務調度實行實時監控管理,實現高速推理預估服務能力和系統穩定性。此外,電池在不同温度、不同駕駛員使用習慣下,故障率差別較大,決策AI基於環境學習與強化學習測試電池故障率,並提出解決方案提升良品率。與之類似,創新奇智在面板缺陷檢測中將視覺與決策AI結合,降低研發缺陷率。
圖表:寧德時代在產品研發、產線質檢等環節落地決策AI
資料來源:寧德時代官網,中金公司研究部
展望未來,決策AI技術輔助提升模型準確度,運籌優化與決策AI相輔相成指導製造業落地,逐步規模化。AI技術在工業製造業領域落地尚處於早期階段,我們預計未來五年將逐步滲透早期使用者,走向規模化。針對現階段工業製造業領域對精度要求較高、需要動態連續建模的痛點,決策AI的強化學習、環境學習等技術能夠促進不斷提升模型精度,同時,工業領域的運籌優化算法有望和強化學習相輔相成,提升具體問題落地的穩健性和決策AI的場景泛化能力,我們認為技術層面將有望做到滿足更多複雜需求。
決策AI+醫藥:藥物研發和慢病篩查是早期落地方向
醫療行業數據化較為完善,但存在數據孤島、羣體性地域差異、數據鏈條不完整和數據隱私保護等痛點,目前AI僅在早期落地試驗階段。在現有的AI+醫療落地案例中,糖尿病等慢病篩查、術後生存分析,以及新藥研發過程中尋找靶點、臨牀測試過程為早期落地方向。
►藥物研發:AI+醫藥具備高技術壁壘,AI賦能藥物研發處早期階段。
晶泰科技基於AI算法尋找並測試靶點,大大縮短藥物研發週期。在類藥的1060化學空間分子中,靠專家經驗尋找治療疾病的藥物需要漫長的試驗期。通過AI和量子物理算法,可以將發現先導化合物的速度從12個月縮短至3個月,藥物發現的合成分子數從上千減小至200,僅需14天即可得到常規研發過程1年的成果。
圖表:AI藥物發現解決方案中通過算法測試並篩選
資料來源:《麻省理工科技評論》(2020),晶泰科技公眾號,中金公司研究部
展望未來5-10年,AI助力疾病篩查有望在醫療體系中普及,AI製藥會成為醫藥企業的標準配置。強化學習有望在生物合成的設計和預測領域延展出更多解決方案,助力AI+生物醫藥的場景拓展。藥物研發方面,有望將AI賦能藥物研發自動化作為基建過程,自機理研究藥物設計至臨牀研究擴展,從局部優化逐漸走向全局優化,大幅提升藥物研發關鍵環節的效率,進一步縮短研發週期,降低藥物成本。
►慢病篩查和生存分析:已在頭部醫院推廣,落地空間廣闊。
瑞金醫院與決策AI廠商合作研發糖尿病篩查模型。瑞金醫院的決策AI早期篩查干預技術在健康階段即開始介入,通過決策AI可解釋模型,基於人體基礎指標即可獲得糖尿病精準風險評估、危險因素分析、個性化干預方案建議和健康管理全流程服務,預測模型準確率超過美國、芬蘭糖尿病預防標準。慢病的早期介入準確率提升依託於健康人羣的更大體量數據,早期介入的意義遠大於後期治療,為儘早採取預防手段、降低患病率做出切實貢獻。
大型三甲醫院藉助決策AI完成胰腺癌術後生存分析模型。基於決策AI技術的生存分析模型具備科學準確性,能夠先驗判斷病人術後生存時間,採取合理的治療措施。
圖表:決策AI助力糖尿病預警(左)和術後生存分析預測(右)
資料來源:第四範式官網,中金公司研究部