2018年的中興事件和2019年的華爲事件之後,“芯片”成爲一個國民熱詞,也有大量的芯片創業公司成立。
來自:甲子光年
國內的芯片熱潮主要有兩次,第一次是“AI芯片”——包括圖形處理單元(GPU)、現場可編程門陣列(FPGA)和專門用於人工智能的特定應用集成電路(ASIC)。
2017年,成立僅17個月的寒武紀獲得一億美元A輪融資,成爲AI芯片的首個獨角獸;隨後地平線也宣佈完成了超過一億美元的融資。與此同時,深鑑科技和比特大陸也分別獲得了數千萬美元的投資。創業公司之外,以雲知聲、依圖爲代表的AI公司嘗試跨界造芯,以BAT爲首的互聯網巨頭也加入造芯大潮。
時至今日,這些創業公司有的已經成爲行業獨角獸,有的被成功併購,還有的已經成功上市。
投資者內,除了紅杉、金沙江創投、創新工場這樣關注科技領域的頂級VC之外,也不乏芯片行業的龍頭,比如投資了地平線的英特爾,投資了深鑑科技的賽靈思、三星等。有些晚入場的投資人甚至感嘆,“還沒等我弄明白GPU、CPU、ASIC、FPGA的差異,別人就已經投完了”。
2020年,芯片行業掀起了第二波創業熱潮,這次主要集中在GPU領域。
2019年,前商湯科技總裁張文創立了壁仞科技,在之後的18個月內累計融資超過47億元,並先後邀請到華爲海思GPU負責人洪洲、AMD全球副總裁李榮新等加盟;2020年,前英偉達全球副總裁張建中創辦了摩爾線程,在100天內募資數十億元;幾乎同一時期成立的還有沐曦集成電路,創始人陳維良曾任AMD總監,一年內獲得四輪融資。
融資金額巨大,創始人有英偉達、AMD等國際巨頭的工作經驗,是這次GPU創業公司的共同標籤。
GPU曾主要用來做圖形計算,但隨着人工智能的發展,GPU被證明在大規模並行運算中有很好的處理能力,於是成爲了當今最流行的AI芯片之一。而定義了GPU的英偉達,在2021年11月一度市值衝向8000多億美元,成爲全球市值最高的芯片公司。
芯片創業是一個長週期的過程。國產的GPU公司不但要面對行業週期規律,還要從英偉達的“大山”夾縫中尋求突破。
這一次,國產替代的GPU故事應該怎麼講?
在2017年的第一次AI芯片浪潮中,主要做的是ASIC芯片——一種爲人工智能特定應用而定製的芯片。
ASIC芯片承載了當時人工智能發展所帶來的數據指數級上升的算力需求。據IDC測算,從2018年到2025年,中國擁有的數據量將從7.5ZB增長到48.6ZB(10^21B)。壁仞科技創始人、董事長兼CEO張文曾提到,“人工智能訓練任務所需要的算力每三至四個月就會翻倍,這個速度大大超越了摩爾定律18個月芯片性能翻倍的增長規律”。
因爲是定製化芯片,ASIC根據產品的需求進行特定設計和製造,具有更高的處理速度和更低的能耗。
但是ASIC的缺點也很明顯,因爲其是針對特定算法而設計,其所適應的算法就是固定的,一旦算法發生變化就可能無法使用。比如在2019年,比特大陸發佈了一種基於新款ASIC芯片的礦機螞蟻礦機 X3,主要是針對門羅幣(XMR)以及依賴 CryptoNight 算法的加密貨幣。但是門羅幣隨即發出反制聲明,將改變核心算法以對抗ASIC算力的入侵,這將導致比特大陸的ASIC芯片的能效大打折扣。
而應對數據量的提升,人工智能的算法也在日新月異地迭代。天數智芯CTO呂堅平告訴「甲子光年」:“在AI這個領域,突破是常態,全新演算法的產生也是常態。如果專用的演算法只用專用的芯片架構,那硬件就永遠跟不上演算法的進步、跟不上突破。”
於是,在ASIC芯片之外,還需要能夠適用多樣算法的通用AI芯片——也就是GPU。
雖然有英偉達這座大山橫亙在面前,國產GPU的第一個機會在於,這並不是一個“包袱感”很重的行業。
天數智芯和壁仞科技都把自家產品對標國際最先進的水平。壁仞科技張文在活動中曾提到,壁仞科技“要對標國際大廠的下下一代產品,而不是上上一代產品”。
天數智芯呂堅平告訴「甲子光年」:“就以圖形爲例,圖形的發展、標準、應用界面都在演化中。在這個過程中,慢慢新的架構會覆蓋、取代舊的,太老的就會被丟棄。所以我們最好的方式就是針對最新的圖形標準來直接設計,把舊的包袱都拋掉,這樣反而會簡化發展。”打個比方,未來我們做適配6G網絡的產品,並不需要產品也適配2G網絡,因爲到時候2G網絡的需求已經不在了。這也意味着,當我們現在要設計屬於中國的GPU芯片時,只需要面向當前和未來的AI計算需求來設計,不需要遵循過往AI和GPU芯片發展。
其次,GPU“可編程”的特性則降低了定製化的成本。
“可編程”的另一個含義,是基於GPU,用適當的算法,更好地發揮其算力。簡單說就是“硬件離不開軟件系統的支持”。
這就不得不提到CUDA了,CUDA(Compute Unified Device Architecture)是隨着英偉達GPU一同推廣的計算平臺和算法模型,目的是幫助用戶更好地使用GPU的算力。
過往客戶方如果需要用ASIC芯片替換英偉達GPU,就得按照ASIC廠商提供的新一套算法來重新部署,人力成本和試錯成本都非常高,客戶們望而卻步。於是,新創業的GPGPU公司,都將“可兼容”CUDA作爲必選項,儘量做到“能在英偉達上跑的都能在國產GPGPU上跑”,讓客戶更願意嘗試。
最後,在國產替代的大背景下,GPU的發展也離不開政策的支持。
2020年8月頒佈的《新時期促進集成電路產業和軟件產業高質量發展的若幹政策》指出,“集成電路設計、裝備、材料、封裝、測試企業和軟件企業,自獲利年度起,第一年至第二年免徵企業所得稅,第三年至第五年按照25%的法定稅率減半徵收企業所得稅”。
科創板和北交所的開市,不再將“盈利”作爲衡量上市的硬性指標,“允許符合科創板定位、尚未盈利或存在累計未彌補虧損的企業在科創板上市”,讓芯片設計企業能夠更好地度過盈利週期。
就在2022年1月19日,上海印發的《新時期促進上海市集成電路產業和軟件產業高質量發展若幹政策的通知》提到,“對於符合條件的設計企業開展有利於促進本市集成電路線寬小於28納米(含)工藝產線應用的流片服務,相關流片費計入項目新增投資,對流片費給予30%的支持,支持金額原則上不高於1億元”。
在這樣的綜合影響下,可以說GPU迎來了最好的時代。
根據IDC數據,2022年全球AI芯片市場將達352億美元。其中GPU佔比最大,Goldman預計到2025年GPU佔比將達到57%。
在這次GPU浪潮中,資本起到了重要的作用。
實際上,中國的GPU企業早已有之,但這些公司的GPU主要還在“第一層”——圖形計算。
成立於2006年的景嘉微是中國第一家GPU的上市公司,公司於2014年研發出第一款全知識產權的GPU芯片JM5400,打破了長期被國外壟斷的局面。後續公司又推出JM7和JM9系列芯片,主要應用於軍工及政府的圖形顯示領域。
另外還有航錦科技旗下的長沙韶光,專注於辦公和娛樂領域。從CPU轉向GPU的龍芯、兆芯,從IP核切入GPU的芯原微、芯動,致力於打造全國產化的芯片生態,目前也均在圖形領域。
而在2020年左右成立的這些創業公司,卻希望攻堅能夠同時滿足圖形處理和AI計算的GPU,也即現在國內所說的GPGPU(通用GPU,General-purposeGPU)。
根據「甲子光年」統計,僅2020~2021年,GPGPU領域就有近20起融資事件發生。
天數智芯、登臨科技、壁仞科技、摩爾線程、沐曦集成電路是國產通用GPU的代表性公司,在資本市場備受關注,甚至會在一年內密集宣佈三輪融資。
之所以融資速度極快,是因爲GPU是一個極度花錢的行業,前期投入大,回報週期長。投資了壁仞科技的啓明創投合夥人周志峯曾問其創始人張文:“你知道這事兒需要多少錢吧?”張文回答:“8到10億美金。”
這可比造車還要燒錢。
貴,也是這批GPU公司的一大特點。比如,壁仞科技的A輪融資就有11億元人民幣,估值2億美元。在這些公司的投資名單中,幾乎集齊了市面上最知名的VC/PE和產業基金。
各家的投資方裏均有國有資本參與投資。不同於2017年資本界的速度、財力之爭,在GPGPU的投資賽場上,似乎更有種“沒有點實力投資不了”的意思。這一方面或許是由於政策上的優惠讓國有資本更願意承擔風險,另一方面也是因爲在國有資本的加持下更方便進一步推進國產化的產品落地。
此外,產業資本更早地進入投資市場。過往創業者對產業資本更傾向於保守的態度,因爲選擇業內龍頭企業的加持往往意味着站隊,意味着不能再與許多公司合作。相對應的,產業資本也更傾向於在企業有了產品之後,再進行合作和投資。
但現今的情況已經大不一樣,登臨科技與安防企業、壁仞科技與平安都在B輪就鋪墊了未來的合作。
隨着2021年投資的熱點從大消費轉向科技,科技領域的熱點又從模式創新轉向技術創新,作爲“硬科技”代表的芯片賽道,更加成爲資本的焦點。雲岫資本的一份統計顯示,2020年半導體行業股權投資超過1400億元人民幣,相較於前一年增長近四倍,這也是中國芯片一級市場有史以來投資額最多的一年。
在「甲子引力」大會上,硬科技投資人也都覺得“這個賽道存在泡沫”,“有些浮躁”。這是產業、資本和環境共同造成的。在產業側,需要更頻繁地更新自己的研發進度;在資本側,好的項目所有機構都在爭搶;而國產替代大背景下“時間”的緊迫感和使命感,將兩者交織又放大。
人才也是GPU創業公司持續在面對的問題。目前所有創業團隊都至少有一位NVIDIA或AMD工作經驗的人,但幾乎所有團隊都告訴「甲子光年」招人很難。在關注有GPU設計經驗的人才之外,他們也非常關注AI泡沫消退後的這批技術人員,希望能讓他們爲AI芯片所用。
立足當下,每一家公司都定位明確,要做出能替代英偉達的GPU芯片;面向未來,每一家公司又各有規劃,要在屬於自己的市場走深也走遠。
2021年,GPU創業公司陸續告別“PPT”造芯的階段——產品真正流片(試生產),萬裏長徵也剛剛邁出第一步。
具體到每家的產品,也採取了不同的技術路線。
第一類GPU公司選擇了7nm的先進工藝,比如天數智芯、壁仞科技,而且兩家公司都已流片成功。
在2021年3月,天數智芯發佈了首款流片成功的7nm雲端訓練芯片BI100;10月,壁仞科技的第一款雲端訓練芯片BR100流片成功,兩家公司的芯片都將交於臺積電代工生產。
在產品側,壁仞科技還關注“異構計算”的提前佈局,與IDG資本、字節跳動等共同投資了國產DPU初創企業雲脈芯聯,這輪天使輪的融資達到數億元。隨後又被報道猜測與高瓴一起,投資了國產CPU公司鴻鈞微電子。
在壁仞科技看來,GPU+CPU+DPU的架構,能更好地讓GPU發揮其作用。具體來說,“DPU可卸載傳統由CPU承擔的網絡、存儲和安全任務,讓其效能更好地穿透到應用層;還可以加快與GPU的數據聯通,強化GPU算力性能與集羣能力。”
兩家公司的核心團隊也是“衆星雲集”。2021年5月,曾任紫光集團聯席總裁的刁石京出任天數智芯CEO;9月,曾通過天數智芯的投資方大鉦資本來做技術顧問的呂堅平博士正式加盟天數智芯,擔任CTO,他有在英偉達、聯發科、三星的GPU從零到一的研發經驗。
壁仞科技創始人兼CEO張文曾是商湯科技的總裁,擔任CTO兼首席架構師的洪洲曾擔任海思自研GPU負責人和首席架構師,擔任高級副總裁的陳文中曾就職於AMD等公司領導過核心產品開發團隊,擔任聯席CEO的李新榮曾擔任AMD全球副總裁、中國研發中心總經理,擔任圖形GPU產品線總經理的焦方國曾任高通的GPU團隊負責人……
採用先進工藝往往意味着更慢的商業化落地,因此第二類公司選擇了7nm之上的成熟工藝,代表公司爲登臨科技。
登臨科技成立於2017年底,在2020年發佈了第一代三款Goldwasser芯片,分別針對邊緣計算和數據中心。與天數智芯和壁仞科技已經流片的雲端“訓練芯片”不同的是,登臨科技的芯片選擇了更爲成熟的12nm工藝,以“推理”爲主、兼顧訓練。
登臨科技創始人李建文告訴「甲子光年」,這些都源自“商業化”的考量。“英偉達T4是目前最主流的數據中心推理芯片,所以登臨的主力產品是對標這款設計的,這個市場夠大。”而在工藝方面他表示,“我們更關注的是如何通過架構創新,幫助客戶降低整體擁有成本(TCO)”。
同時,客戶其實不太關注芯片的“工藝”。“他們關心的是用我們的加速卡去跑他們的業務,導入是不是容易,性價比是不是更好。”這或許在巨頭的產品設計裏也有體現。AMD消費類的GPU從2015年就採用更高性能的存儲模塊HBM,2018年開始用7nm;而英偉達到2020年纔開始用7nm,且在消費類顯卡繼續採用GDDR的內存,但這完全沒有影響英偉達在GPU領域的領先地位。李建文補充道,“雖然,工藝及存儲技術對大家都是公平的,但在目前供應鏈緊張的情況下,存儲模塊長期不足、芯片製造需要排隊,就對大公司更有利了”。
2021年9月,曾就職於華爲、蘋果、思科供應鏈要職的楊劍加入登臨科技,擔任全球運營副總裁。由此,登臨科技率先進入芯片的規模化量產、商業落地環節,並希望根據穩定的週期繼續發佈新的芯片,進入良性循環。據悉,登臨科技第二個系列芯片將在2022年流片,新一代芯片將在訓練性能上有重大提升。
除了已經流片的公司,尚未流片的摩爾線程和沐曦集成電路也同樣受到關注。摩爾線程創始人張建中曾爲英偉達全球副總裁兼中國區總經理,沐曦集成電路創始人陳維良曾是AMD的高級研發總監,CTO兼首席架構師彭莉、首席架構師楊建都曾是AMD的科學家。
摩爾線程在成立300天就研製成功第一款芯片,同時擁有圖形處理和AI計算的能力,製程方面僅表示會使用“先進生產工藝”,尚未具體公佈。而沐曦集成電路曾被報道計劃採用更先進的5nm工藝打造首款芯片,但彭莉在採訪中也表示,如果在先進製程的產能上有所限制,則會“在芯片上做更多的系統級的架構創新”。據悉,沐曦預計將在2022年投片,2023年量產。
正是因爲芯片需要具體場景的驗證才能證明其可靠性、完善其軟件系統,早進入、已有產品的公司紛紛開始與客戶一起落地合作,而後成立的公司也在研發過程中就積極尋找潛在夥伴。可以說,GPGPU這波芯片創業浪潮下,創業者與投資人都更加關注芯片的“落地”。
芯片的項目“落地”,意味着與英偉達的直接對比正式開始。
目前看來,GPGPU的主要落地場景有安防及智慧城市、互聯網數據中心、邊緣計算,以及生物醫藥、能源等新興領域。
雖然GPGPU正是爲了打破英偉達在數據中心方面的壟斷地位而發展起來的,但安防和智慧城市領域是目前各家公司優先落地的場景。
國產化需求下,終端的安防設備已經完成了替代,海思等企業已經成爲終端攝像頭的主要供應商。但從邊緣端到雲端,目前主要使用的依舊是英偉達的芯片,亟需國產化替代。
信創市場有較強的緊迫感。這從過往ASIC芯片的應用上就可以看到一二,爲寒武紀2020年拿下超過80%營收的正是南京超算中心項目。同時,信創市場比較支持國產芯片,對國產替代的寬容度也較高。呂堅平說,“他們希望我們能替代現有市場需求的一部分,並逐漸擴大佔有率”。
可以想象,在不久的將來,泛智慧城市領域的主要芯片就會是這一批GPGPU芯片。
數據中心是算力需求最大的地方,也是替代最難的領域。客戶對算力要求大、價格敏感,且都有長期使用英偉達的習慣。在這個領域,雖然客戶對能有產品替代英偉達非常歡迎,但也不會因爲是國產公司就不顧成本。
能效比是成本的重要參考因素之一。李建文介紹道,由於服務器的設計限制,單卡峯值功耗一般爲75瓦,“我們思考的問題就是,在75瓦合理值內,通過架構創新,做到比英偉達產品多幾倍的性能,以提升產品整體的能效比”。在雙碳政策下,每一家人工智能企業都將面臨能效比的問題。
針對數據中心的特定的、複雜的場景,企業紛紛開始提供更完善的解決方案。投資了DPU和CPU的壁仞科技,希望以全國產化的芯片組合來服務客戶。無獨有偶,1月13日,在國產CPU公司龍芯中科召開的生態創新發布上,副總裁張戈提到已經與GPU公司天數智芯、登臨完成適配。
與國內芯片廠商的合作,不僅能爲客戶提供全自主可控的解決方案,省去多次分步替代的麻煩,也能事先解決軟件和兼容性方面的問題,讓客戶少一些人力成本和替代焦慮。
邊緣計算可能是最適合目前GPGPU做國產替代的領域。李建文介紹,“像是智慧商圈、智慧園區、智慧社區、智慧工廠、機器人都是邊緣計算的應用場景”。邊緣計算對算力有一定要求,但也沒有達到數據中心的水平;同時,邊緣計算需要算力能夠有解決不同問題的靈活性,於是要求芯片兼顧可編程性、通用性和能效比。
2022年將會是國內GPGPU開始量產和項目落地的一年。雖說不少人調侃GPU賽道“生死時速”,預判“贏者通吃”,“最終只能走出來一兩家企業”。但作爲一個足夠大的賽道,每一位玩家既直接競爭,也可以做出差異化。
不同於AI和第一波AI芯片浪潮下每家公司幾乎在同一時間成立,GPGPU的公司發展到現在已經有了進度的差異。天數、登臨和壁仞第二款芯片已經正式研發或接近發佈,摩爾和沐曦還在等待第一款芯片的誕生。後來者更應該關注先行者所在的領域,在廣闊的國產化領域裏以“替換英偉達”爲目標,而不是以同爲信創創業者爲對手。
另外,信創市場之外,芯片作爲大投入、盈利週期長的公司,也需要創業者更早地以商業化的視角來思考公司的長遠發展。用單純的“高算力”來展現實力固然也有價值,但一家公司真正的價值在於既爲國產替代提供選擇,又成爲一家“自給自足”的公司。
GPGPU的創業者似乎從來不諱言想成爲一家“偉大的公司”,但邁向偉大的路,也一樣是在腳下。