選單

第二次AI晶片浪潮下,中國版英偉達的故事誰來講?

第二次AI晶片浪潮下,中國版英偉達的故事誰來講?

作者 | 範文靖編輯 | 趙健

2018年的中興事件和2019年的華為事件之後,“晶片”成為一個國民熱詞,也有大量的晶片創業公司成立。

國內的晶片熱潮

主要

有兩次,第一次是“AI晶片”

——包括圖形處理單元(GPU)、現場可程式設計門陣列(FPGA)和專門用於人工智慧的特定應用積體電路(ASIC)。

2017年,成立僅17個月的寒武紀獲得一億美元A輪融資,成為AI晶片的首個獨角獸;隨後地平線也宣佈完成了超過一億美元的融資。與此同時,深鑑科技和位元大陸也分別獲得了數千萬美元的投資。創業公司之外,以雲知聲、依圖為代表的AI公司嘗試跨界造芯,以BAT為首的網際網路巨頭也加入造芯大潮。

時至今日,這些創業公司有的已經成為行業獨角獸,有的被成功併購,還有的已經成功上市。

投資者內,除了紅杉、金沙江創投、創新工場這樣關注科技領域的頂級VC之外,也不乏晶片行業的龍頭,比如投資了地平線的英特爾,投資了深鑑科技的賽靈思、三星等。有些晚入場的投資人甚至感嘆,“還沒等我弄明白GPU、CPU、ASIC、FPGA的差異,別人就已經投完了”。

2020年,晶片行業掀起了第二波創業熱潮,這次主要集中在GPU領域。

2019年,前商湯科技總裁張文創立了壁仞科技,在之後的18個月內累計融資超過47億元,並先後邀請到華為海思GPU負責人洪洲、AMD全球副總裁李榮新等加盟;2020年,前英偉達全球副總裁張建中創辦了摩爾執行緒,在100天內募資數十億元;幾乎同一時期成立的還有沐曦積體電路,創始人陳維良曾任AMD總監,一年內獲得四輪融資。

融資金額巨大,創始人有英偉達、AMD等國際巨頭的工作經驗,是這次GPU創業公司的共同標籤。

GPU曾主要用來做圖形計算,但隨著人工智慧的發展,GPU被證明在大規模並行運算中有很好的處理能力,於是成為了當今最流行的AI晶片之一。而定義了GPU的英偉達,在2021年11月一度市值衝向8000多億美元,成為全球市值最高的晶片公司。

晶片創業是一個長週期的過程。國產的GPU公司不但要面對行業週期規律,還要從英偉達的“大山”夾縫中尋求突破。

這一次,國產替代的GPU故事應該怎麼講?

1.時代呼喚GPU

在2017年的第一次AI晶片浪潮中,主要做的是ASIC晶片——一種為人工智慧特定應用而定製的晶片。

ASIC晶片承載了當時人工智慧發展所帶來的資料指數級上升的算力需求。據IDC測算,從2018年到2025年,中國擁有的資料量將從7。5ZB增長到48。6ZB(10^21B)。壁仞科技創始人、董事長兼CEO張文曾提到,“人工智慧訓練任務所需要的算力每三至四個月就會翻倍,這個速度大大超越了摩爾定律18個月晶片效能翻倍的增長規律”。

因為是定製化晶片,ASIC根據產品的需求進行特定設計和製造,具有更高的處理速度和更低的能耗。

但是ASIC的缺點也很明顯,因為其是針對特定演算法而設計,其所適應的演算法就是固定的,一旦演算法發生變化就可能無法使用。比如在2019年,位元大陸釋出了一種基於新款ASIC晶片的礦機螞蟻礦機 X3,主要是針對門羅幣(XMR)以及依賴 CryptoNight 演算法的加密貨幣。但是門羅幣隨即發出反制宣告,將改變核心演算法以對抗ASIC算力的入侵,這將導致位元大陸的ASIC晶片的能效大打折扣。

而應對資料量的提升,人工智慧的演算法也在日新月異地迭代。天數智芯CTO呂堅平告訴「甲子光年」:“在AI這個領域,突破是常態,全新演演算法的產生也是常態。如果專用的演演算法只用專用的晶片架構,那硬體就永遠跟不上演演算法的進步、跟不上突破。”

於是,在ASIC晶片之外,還需要能夠適用多樣演算法的通用AI晶片——也就是GPU。

雖然有英偉達這座大山橫亙在面前,國產GPU的第一個機會在於,這並不是一個“包袱感”很重的行業。

天數智芯和壁仞科技都把自家產品對標國際最先進的水平。壁仞科技張文在活動中曾提到,壁仞科技“要對標國際大廠的下下一代產品,而不是上上一代產品”。

天數智芯呂堅平告訴「甲子光年」:“就以圖形為例,圖形的發展、標準、應用介面都在演化中。在這個過程中,慢慢新的架構會覆蓋、取代舊的,太老的就會被丟棄。所以我們最好的方式就是針對最新的圖形標準來直接設計,把舊的包袱都拋掉,這樣反而會簡化發展。”打個比方,未來我們做適配6G網路的產品,並不需要產品也適配2G網路,因為到時候2G網路的需求已經不在了。這也意味著,

當我們現在要設計屬於中國的GPU晶片時,只需要面向當前和未來的AI計算需求來設計

,不需要遵循過往AI和GPU晶片發展。

其次

,GPU“可程式設計”的特性則降低了定製化的成本。

“可程式設計”的另一個含義,是基於GPU,用適當的演算法,更好地發揮其算力。簡單說就是“硬體離不開軟體系統的支援”。

這就不得不提到CUDA了,CUDA(Compute Unified Device Architecture)是隨著英偉達GPU一同推廣的計算平臺和演算法模型,目的是幫助使用者更好地使用GPU的算力。

過往客戶方如果需要用ASIC晶片替換英偉達GPU,就得按照ASIC廠商提供的新一套演算法來重新部署,人力成本和試錯成本都非常高,客戶們望而卻步。於是,新創業的GPGPU公司,都將“可相容”CUDA作為必選項,儘量做到“能在英偉達上跑的都能在國產GPGPU上跑”,讓客戶更願意嘗試。

最後,在國產替代的大背景下,GPU的發展也離不開政策的支援。

2020年8月頒佈的《新時期促進積體電路產業和軟體產業高質量發展的若干政策》指出,“積體電路設計、裝備、材料、封裝、測試企業和軟體企業,自獲利年度起,第一年至第二年免徵企業所得稅,第三年至第五年按照25%的法定稅率減半徵收企業所得稅”。

科創板和北交所的開市,不再將“盈利”作為衡量上市的硬性指標,“允許符合科創板定位、尚未盈利或存在累計未彌補虧損的企業在科創板上市”,讓晶片設計企業能夠更好地度過盈利週期。

就在2022年1月19日,上海印發的《新時期促進上海市積體電路產業和軟體產業高質量發展若干政策的通知》提到,“對於符合條件的設計企業開展有利於促進本市積體電路線寬小於28奈米(含)工藝產線應用的流片服務,相關流片費計入專案新增投資,對流片費給予30%的支援,支援金額原則上不高於1億元”。

在這樣的綜合影響下,可以說GPU迎來了最好的時代。

根據IDC資料,2022年全球AI晶片市場將達352億美元。其中GPU佔比最大,Goldman預計到2025年GPU佔比將達到57%。

在這次GPU浪潮中,資本起到了重要的作用。

2.資本湧入GPU

實際上,中國的GPU企業早已有之,但這些公司的GPU主要還在“第一層”——圖形計算。

成立於2006年的景嘉微是中國第一家GPU的上市公司,公司於2014年研發出第一款全智慧財產權的GPU晶片JM5400,打破了長期被國外壟斷的局面。後續公司又推出JM7和JM9系列晶片,主要應用於軍工及政府的圖形顯示領域。

另外還有航錦科技旗下的長沙韶光,專注於辦公和娛樂領域。從CPU轉向GPU的龍芯、兆芯,從IP核切入GPU的芯原微、芯動,致力於打造全國產化的晶片生態,目前也均在圖形領域。

而在2020年左右成立的這些創業公司,卻希望攻堅能夠同時滿足圖形處理和AI計算的GPU,也即現在國內所說的

GP

GPU

(通用GPU,General-purposeGPU)

根據「甲子光年」統計,僅2020~2021年,GPGPU領域就有近20起融資事件發生。

第二次AI晶片浪潮下,中國版英偉達的故事誰來講?

天數智芯、登臨科技、壁仞科技、摩爾執行緒、沐曦積體電路

是國產通用GPU的代表性公司,在資本市場備受關注,甚至會在一年內密集宣佈三輪融資。

之所以融資速度極快,是因為GPU是一個極度花錢的行業,前期投入大,回報週期長。投資了壁仞科技的啟明創投合夥人周志峰曾問其創始人張文:“你知道這事兒需要多少錢吧?”張文回答:“8到10億美金。”

這可比造車還要燒錢。

貴,也是這批GPU公司的一大特點。比如,壁仞科技的A輪融資就有11億元人民幣,估值2億美元。在這些公司的投資名單中,幾乎集齊了市面上最知名的VC/PE和產業基金。

各家的投資方里均有國有資本參與投資。不同於2017年資本界的速度、財力之爭,在GPGPU的投資賽場上,似乎更有種“沒有點實力投資不了”的意思。這一方面或許是由於政策上的優惠讓國有資本更願意承擔風險,另一方面也是因為在國有資本的加持下更方便進一步推進國產化的產品落地。

此外,產業資本更早地進入投資市場。過往創業者對產業資本更傾向於保守的態度,因為選擇業內龍頭企業的加持往往意味著站隊,意味著不能再與許多公司合作。相對應的,產業資本也更傾向於在企業有了產品之後,再進行合作和投資。

但現今的情況已經大不一樣,登臨科技與安防企業、壁仞科技與平安都在B輪就鋪墊了未來的合作。

隨著2021年投資的熱點從大消費轉向科技,科技領域的熱點又從模式創新轉向技術創新,作為“硬科技”代表的晶片賽道,更加成為資本的焦點。雲岫資本的一份統計顯示,2020年半導體行業股權投資超過1400億元人民幣,相較於前一年增長近四倍,這也是中國晶片一級市場有史以來投資額最多的一年。

在「甲子引力」大會上,硬科技投資人也都覺得“這個賽道存在泡沫”,“有些浮躁”。這是產業、資本和環境共同造成的。在產業側,需要更頻繁地更新自己的研發進度;在資本側,好的專案所有機構都在爭搶;而國產替代大背景下“時間”的緊迫感和使命感,將兩者交織又放大。

人才也是GPU創業公司持續在面對的問題。目前所有創業團隊都至少有一位NVIDIA或AMD工作經驗的人,但幾乎所有團隊都告訴「甲子光年」招人很難。在關注有GPU設計經驗的人才之外,他們也非常關注AI泡沫消退後的這批技術人員,希望能讓他們為AI晶片所用。

立足當下,每一家公司都定位明確,要做出能替代英偉達的GPU晶片;面向未來,每一家公司又各有規劃,要在屬於自己的市場走深也走遠。

2021年,GPU創業公司陸續告別“PPT”造芯的階段——產品真正流片(試生產),萬里長征也剛剛邁出第一步。

3.從PPT到產品

具體到每家的產品,也採取了不同的技術路線。

第一類GPU公司選擇了7nm的先進工藝,比如天數智芯、壁仞科技,而且兩家公司都已流片成功。

在2021年3月,天數智芯釋出了首款流片成功的7nm雲端訓練晶片BI100;10月,壁仞科技的第一款雲端訓練晶片BR100流片成功,兩家公司的晶片都將交於臺積電代工生產。

在產品側,

壁仞

科技還

關注“異構計算”的提前佈局,

與IDG資本、位元組跳動等共同投資了國產DPU初創企業雲脈芯聯,這輪天使輪的融資達到數億元。隨後又被報道猜測與高瓴一起,投資了國產CPU公司鴻鈞微電子。

在壁仞科技看來,GPU+CPU+DPU的架構,能更好地讓GPU發揮其作用。具體來說,“DPU可解除安裝傳統由CPU承擔的網路、儲存和安全任務,讓其效能更好地穿透到應用層;還可以加快與GPU的資料聯通,強化GPU算力效能與叢集能力。”

兩家公司的核心團隊也是“眾星雲集”。

2021年5月,曾任紫光集團聯席總裁的刁石京出任天數智芯CEO;9月,曾透過天數智芯的投資方大鉦資本來做技術顧問的呂堅平博士正式加盟天數智芯,擔任CTO,他有在英偉達、聯發科、三星的GPU從零到一的研發經驗。

壁仞科技創始人兼CEO張文曾是商湯科技的總裁,擔任CTO兼首席架構師的洪洲曾擔任海思自研GPU負責人和首席架構師,擔任高階副總裁的陳文中曾就職於AMD等公司領導過核心產品開發團隊,擔任聯席CEO的李新榮曾擔任AMD全球副總裁、中國研發中心總經理,擔任圖形GPU產品線總經理的焦方國曾任高通的GPU團隊負責人……

採用先進工藝往往意味著更慢的商業化落地,因此第二類公司選擇了7nm之上的成熟工藝,代表公司為登臨科技。

登臨科技成立於2017年底,在2020年釋出了第一代三款Goldwasser晶片,分別針對邊緣計算和資料中心。與天數智芯和壁仞科技已經流片的雲端“訓練晶片”不同的是,登臨科技的晶片選擇了更為成熟的12nm工藝,以“推理”為主、兼顧訓練。

登臨科技創始人

李建文告訴「

甲子光年

」,這些都源自“商業化”的考量。

“英偉達T4是目前最主流的資料中心推理晶片,所以登臨的主力產品是對標這款設計的,這個市場夠大。”而在工藝方面他表示,“我們更關注的是如何透過架構創新,幫助客戶降低整體擁有成本(TCO)”。

同時,客戶其實不太關注晶片的“工藝”。

“他們關心的是用我們的加速卡去跑他們的業務,匯入是不是容易,價效比是不是更好。”這或許在巨頭的產品設計裡也有體現。AMD消費類的GPU從2015年就採用更高效能的儲存模組HBM,2018年開始用7nm;而英偉達到2020年才開始用7nm,且在消費類顯示卡繼續採用GDDR的記憶體,但這完全沒有影響英偉達在GPU領域的領先地位。李建文補充道,“雖然,工藝及儲存技術對大家都是公平的,但在目前供應鏈緊張的情況下,儲存模組長期不足、晶片製造需要排隊,就對大公司更有利了”。

2021年9月,曾就職於華為、蘋果、思科供應鏈要職的楊劍加入登臨科技,擔任全球運營副總裁。由此,登臨科技率先進入晶片的規模化量產、商業落地環節,並希望根據穩定的週期繼續釋出新的晶片,進入良性迴圈。據悉,登臨科技第二個系列晶片將在2022年流片,新一代晶片將在訓練效能上有重大提升。

除了已經流片的

公司

,尚未流片

摩爾執行緒和沐曦積體電路

也同樣受到關注

摩爾執行緒創始人張建中曾為英偉達全球副總裁兼中國區總經理,沐曦積體電路創始人陳維良曾是AMD的高階研發總監,CTO兼首席架構師彭莉、首席架構師楊建都曾是AMD的科學家。

摩爾執行緒在成立300天就研製成功第一款晶片,同時擁有圖形處理和AI計算的能力,製程方面僅表示會使用“先進生產工藝”,尚未具體公佈。而沐曦積體電路曾被報道計劃採用更先進的5nm工藝打造首款晶片,但彭莉在採訪中也表示,如果在先進製程的產能上有所限制,則會“在晶片上做更多的系統級的架構創新”。據悉,沐曦預計將在2022年投片,2023年量產。

正是因為晶片需要具體場景的驗證才能證明其可靠性、完善其軟體系統,早進入、已有產品的公司紛紛開始與客戶一起落地合作,而後成立的公司也在研發過程中就積極尋找潛在夥伴。可以說,GPGPU這波晶片創業浪潮下,創業者與投資人都更加關注晶片的“落地”。

4。替代英偉達,還要多久?

晶片的專案“落地”,意味著與英偉達的直接對比正式開始。

目前看來,GPGPU的主要落地場景有安防及智慧城市、網際網路資料中心、邊緣計算,以及生物醫藥、能源等新興領域。

雖然GPGPU正是為了打破英偉達在資料中心方面的壟斷地位而發展起來的,但安防和智慧城市領域是目前各家公司優先落地的場景。

國產化需求下,終端的安防裝置已經完成了替代,海思等企業已經成為終端攝像頭的主要供應商。但從邊緣端到雲端,目前主要使用的依舊是英偉達的晶片,亟需國產化替代。

信創市場有較強的緊迫感。這從過往ASIC晶片的應用上就可以看到一二,為寒武紀2020年拿下超過80%營收的正是南京超算中心專案。同時,信創市場比較支援國產晶片,對國產替代的寬容度也較高。呂堅平說,“他們希望我們能替代現有市場需求的一部分,並逐漸擴大佔有率”。

可以想象,在不久的將來,泛智慧城市領域的主要晶片就會是這一批GPGPU晶片。

資料中心是算力需求最大的地方,也是替代最難的領域。客戶對算力要求大、價格敏感,且都有長期使用英偉達的習慣。在這個領域,雖然客戶對能有產品替代英偉達非常歡迎,但也不會因為是國產公司就不顧成本。

能效比是成本的重要參考因素之一。李建文介紹道,由於伺服器的設計限制,單卡峰值功耗一般為75瓦,“我們思考的問題就是,在75瓦合理值內,透過架構創新,做到比英偉達產品多幾倍的效能,以提升產品整體的能效比”。在雙碳政策下,每一家人工智慧企業都將面臨能效比的問題。

針對資料中心的特定的、複雜的場景,企業紛紛開始提供更完善的解決方案。投資了DPU和CPU的壁仞科技,希望以全國產化的晶片組合來服務客戶。無獨有偶,1月13日,在國產CPU公司龍芯中科召開的生態創新發布上,副總裁張戈提到已經與GPU公司天數智芯、登臨完成適配。

與國內晶片廠商的合作,不僅能為客戶提供全自主可控的解決方案,省去多次分步替代的麻煩,也能事先解決軟體和相容性方面的問題,讓客戶少一些人力成本和替代焦慮。

邊緣計算可能是最適合目前GPGPU做國產替代的領域。

李建文介紹,“像是智慧商圈、智慧園區、智慧社群、智慧工廠、機器人都是邊緣計算的應用場景”。邊緣計算對算力有一定要求,但也沒有達到資料中心的水平;同時,邊緣計算需要算力能夠有解決不同問題的靈活性,於是要求晶片兼顧可程式設計性、通用性和能效比。

2022年將會是國內GPGPU開始量產和專案落地的一年。

雖說不少人調侃GPU賽道“生死時速”,預判“贏者通吃”,“最終只能走出來一兩家企業”。但作為一個足夠大的賽道,每一位玩家既直接競爭,也可以做出差異化。

不同於AI和第一波AI晶片浪潮下每家公司幾乎在同一時間成立,GPGPU的公司發展到現在已經有了進度的差異。天數、登臨和壁仞第二款晶片已經正式研發或接近釋出,摩爾和壁仞還在等待第一款晶片的誕生。後來者更應該關注先行者所在的領域,在廣闊的國產化領域裡以“替換英偉達”為目標,而不是以同為信創創業者為對手。

另外,信創市場之外,晶片作為大投入、盈利週期長的公司,也需要創業者更早地以商業化的視角來思考公司的長遠發展。用單純的“高算力”來展現實力固然也有價值,但一家公司真正的價值在於既為國產替代提供選擇,又成為一家“自給自足”的公司。

GPGPU的創業者似乎從來不諱言想成為一家“偉大的公司”,但邁向偉大的路,也一樣是在腳下。