選單

《瞭望》對話王恩東院士:AI 算力不夠用怎麼辦

未來,人工智慧對計算的需求將佔全球計算需求的80%以上,而承載這種需求的就是智慧計算中心。國家樞紐節點建設應做好網路、能源、算力、資料、應用等一體化發展,最終構建成以資料流為導向的新型算力網路格局。

《瞭望》對話王恩東院士:AI 算力不夠用怎麼辦

中國工程院院士王恩東

算力供給正呈現供不應求之勢。

當前,AI 技術漸趨成熟,智慧農機、智慧農業等改變著延續上千年的農業生產方式;智慧工廠讓生產效率顯著提升;無接觸送貨、無人機送餐成為智慧物流新亮點……

各種人工智慧場景和數字化業務加速落地,對計算力需求旺盛。人工智慧非營利組織 OpenAI 曾於2018年釋出報告,提出自2012年以來,AI 訓練任務所運用的算力每3。43個月就會翻倍。到2018年,AI算力需求增長了30萬倍。

該如何彌補人工智慧算力“鴻溝”?中國工程院院士、高效能伺服器和儲存技術國家重點實驗室主任王恩東的答案是:計算技術與產業需構建新發展格局,加速計算向智算轉型,其中多元算力融合是關鍵,算力供給基建化是支撐。

AI 算力供不應求

《瞭望》:人工智慧時代,如何看待計算力的地位與作用?

王恩東

:社會的數字化轉型升級離不開智慧化改造,隨著 AI 融入各行業,我們正進入一個智慧時代,全社會資料總量暴發式增長,對計算力需求大幅提升。計算力正成為數字經濟發展的核心驅動力。

計算力之於智慧時代就像電力之於電氣時代,都是生產力的重要形式。我們可以透過計算力的情況,來分析一個國家的經濟發展情況。根據國際資料中心(IDC)釋出的《2020全球計算力指數評估報告》,計算力與經濟增長緊密相關,計算力指數平均每提高1個點,數字經濟和 GDP 將分別增長3。3‰和1。8‰。從各個國家 GDP 數字與伺服器的出貨量來看,GDP 與伺服器採購額呈現出明顯的正線性相關。美、中兩國不僅 GDP 遠遠領先於日本和德國,每萬億 GDP 的伺服器數量也遠遠高於他們,數字經濟的貢獻佔比明顯高於他們。實際上,我國各省份的情況與此類似,北上廣浙每千億 GDP 的伺服器出貨量遠大於其他省份。可以說計算力是衡量經濟社會發展水平的重要指標。

從實體企業層面,在10年前,全球市值最高的企業大部分是能源公司、金融企業,市值靠前的IT公司僅僅微軟一家。到了近些年,全球最值錢的公司幾乎清一色的資訊科技與服務公司,如亞馬遜、蘋果、微軟、中國的 BAT 等。有趣的地方還在於,這些排名靠前的公司也是全球採購伺服器最多的公司,海量的計算力為這些公司創造了巨大價值。根據 IDC 釋出的《2020-2021中國人工智慧計算力發展評估報告》,2020年中國人工智慧基礎設施市場規模高達39億美元,伺服器是人工智慧基礎設施的核心,支出佔比達87%。資料直觀地反映了算力在整個產業的重要性。

從更高維度看,我們正在向智慧時代轉型,資料成為新的生產資料。海量資料的處理,必須依靠強大的計算力。據 IDC 預測,未來三年新產生的資料量將超過過去三十年的總和。雖然資料的總量在增長,但是真正被有效利用的資料佔比仍然不足1%。如何有效抓取高質量的資料並透過這些資料建立精準的模型,則取決於 AI 演算法。深度學習是人工智慧的一種演算法,要訓練出一個深度神經網路模型,就需要足夠強的算力支撐。

《瞭望》:目前 AI 算力能否滿足各行業的需求?

王恩東

:算力是裝置計算能力的一種量化。雖然目前無法具體統計 AI 算力缺口資料,但中國正在加速數字化轉型,AI 應用版圖隨之不斷擴大。AI 在金融、製造、電信、醫療、交通等行業應用的深入加劇了算力短缺。由此可見,AI 的應用擴充套件,對算力的需求只會越來越大,目前的算力供給已難以滿足這一需求。

此外,進入智慧時代,企業普遍希望採用具有公共基礎設施意義的人工智慧算力基礎設施。根據 IDC 調研,超過九成的企業正在使用或計劃在三年內使用人工智慧,其中74。5%的企業期望在未來可以採用具備公用設施意義的人工智慧新型基礎設施,這同樣加劇了算力短缺。

智算中心將成為未來計算力主要生產中心

《瞭望》:如何加速計算到智算轉型?

王恩東

:面對算力供給“鴻溝”,計算技術與產業需要構建一個新的發展格局,簡單概括起來可以描述為:要透過多元算力融合和算力供給基建化加速計算到智算轉型。

智慧計算是藉助自然界,特別是生物界規律的啟示,設計出求解問題的演算法。例如人工智慧神經網路模仿人腦的生理結構和資訊處理過程,模擬人類智慧。智慧計算有著傳統計算無法比擬的優越性,其最大特點就是不需要對問題自身建立精確的數學模型,非常適合於那些由於難以建立有效的形式化模型因而無法用傳統數值計算方法解決的問題。

執行智慧計算的有各種人工智慧專用晶片和加速卡。資料顯示,2020年,全世界以 GPU 為代表的 AI 加速晶片所交付的計算力總和已經超過了通用 CPU,預計到2025年,AI 加速晶片所提供的計算力可能超過全球算力總量的80%。智算將是智慧時代計算的主要形態,我們要加速這一轉型程序。

加速計算到智算轉型,多元算力融合是關鍵。進入智慧時代,算力多元化發展趨勢愈加明顯,主要體現在計算場景和計算架構的複雜多元。多架構引發了無法相容、效率不高等問題。我們需要打破傳統體系結構設計,創新智算體系結構,實現算力高效聚合和按需定義。

在體系結構方面,我們在2014年提出融合架構以及三步走技術路線,指明瞭資料中心體系結構的發展方向。目前已經從1。0走到2。0,實現了儲存資源和 FPGA、GPU、XPU 加速裝置池化,正逐步進入3。0階段,提供更高效、靈活、智慧的體系架構。在融合架構3。0階段,可以透過晶片內大容量快取、晶片外高頻寬記憶體等存算一體方式實現計算資料結合,突破記憶體提供資料速度遠遠落後晶片處理資料速度的儲存牆難題,加速資料在記憶體與晶片之間的搬運效率;透過高速互聯交換網路,支援更廣泛的 CPU、GPU、FPGA 等多元異構計算、支援新型儲存資源池化,提高效能、降低能耗,實現更大規模資源可擴充套件,並進一步透過在互聯處理單元中解除安裝控制平面,實現控制計算分離,進而達到更為靈活的資源可重構,提高算力供給的效率、靈活性。

《瞭望》:該怎樣推動算力供給基建化?

王恩東

:未來,人工智慧對計算的需求將佔全球計算需求的80%以上,而承載這種需求的就是AI算力中心,即智慧計算中心,也叫智算中心。

根據2020年底國家資訊中心資訊化和產業發展部聯合浪潮釋出的《智慧計算中心規劃建設指南》的定義,智算中心是基於最新人工智慧理論,採用領先的人工智慧計算架構,提供人工智慧應用所需算力服務、資料服務和演算法服務的公共算力新型基礎設施,透過算力的生產、聚合、排程和釋放,高效支撐資料開放共享、智慧生態建設、產業創新聚集,有力促進 AI 產業化、產業 AI 化及政府治理智慧化。

2020年4月,國家發改委明確新型基礎設施建設的範圍包含以資料中心、智慧計算中心為代表的算力基礎設施,算力供給基建化已成為趨勢。可以預見,在加快推進新基建背景下,智算中心將成為未來計算力的主要生產中心、供應中心,也將成為推動經濟社會執行的重要基礎設施。

現在我們要加快推動算力供給基建化。建設智算中心必須滿足三個要求:一是開放標準。要求智算中心從硬體到軟體、從晶片到架構、從建設模式到應用服務都應該是開放的、標準的;二是集約高效。要求智算中心的建設要有超大規模,要採用領先技術,保證自身先進性;三是普適普惠。要求智算中心發揮基礎設施的社會價值,服務大眾。

目前,有越來越多的政府、企業開始進行智算中心的統籌佈局和建設,南京、西安、成都、武漢等城市已有落地專案。以今年7月正式投入運營的南京智算中心為例,這是長三角地區規模最大的城市智算中心,由浪潮與中科寒武紀科技股份有限公司聯合建設。南京智算中心採用業界領先的人工智慧晶片和算力機組構建,透過算力的生產、聚合、排程和釋放四大關鍵作業環節,提供人工智慧應用所需的AI算力服務,重點支撐科技金融、智慧製造、智慧零售、智慧醫療、智慧交通等領域的算力需求。

《瞭望》對話王恩東院士:AI 算力不夠用怎麼辦

南京智算中心

深化東西部算力協同

《瞭望》:今年5月,國家提出加快實施“東數西算”工程,提升跨區域算力排程水平。為什麼要“東數西算”?

王恩東:

以前,我國的資料中心建設沒有集約規劃,存在粗放式問題,缺乏高效的資源配比。

資料中心對網路依賴性強,傳統上,我國通訊網路主要圍繞人口聚集程度進行建設,網路節點普遍集中於北上廣等一線城市,因此資料中心也集中於這些城市部署。但近年來,數字經濟發展對資料資源儲存、計算和應用需求大幅提升,資料中心規模快速擴張,特別是東部一些應用需求大的城市,能耗指標緊張、電力成本高,已難以滿足大規模發展資料中心的要求;反觀一些西部地區,可再生能源豐富,氣候適宜,適合建設大資料中心,但因為網路頻寬小、跨省資料傳輸費用高等瓶頸,無法有效承接東部需求。

因此,我們需儘快轉變以通訊網路節點為中心的發展模式,打造資料中心、雲計算、大資料一體化的新型算力網路體系,形成以資料流為導向的新型算力網路格局。實施方案為我國佈局算力新基建、推動數字經濟發展擘畫了藍圖。

國家已經明確將在京津冀、長三角、粵港澳大灣區、成渝,以及貴州、內蒙古、甘肅、寧夏等地佈局建設全國一體化算力網路國家樞紐節點。國家樞紐節點是我國算力網路的骨幹連線點。透過國家樞紐節點佈局,可以引導實現資料中心有序發展。

按照規劃,對於京津冀、長三角、粵港澳大灣區、成渝等應用需求強烈的節點,重點統籌好城市內部和周邊區域的資料中心佈局。對於貴州、內蒙古、甘肅、寧夏等可再生能源豐富、氣候適宜、資料中心綠色發展潛力較大的節點,重點承接全國範圍需後臺加工、離線分析、儲存備份等非實時算力需求,打造成為面向全國的非實時性算力保障基地。

《瞭望》:如何實現算力統籌排程?

恩東

:算力統籌排程是實現算力資源高效供給的必要環節。強調算力統籌排程,將進一步最佳化算力供給情況。實施方案支援開展的“東數西算”工程,就是在資料中心叢集和叢集之間,建立高速資料中心直聯網路,支撐大規模算力排程。

在算力統籌層面,要加大算力基礎設施建設,對不同區域算力基礎設施建設也要區分規劃。智算的特點在於從智慧模型訓練、迭代到投入執行速度非常快,因此,必須在近場景、近資料、高頻寬、低延遲的地方投入建設智算中心。日後,隨著東部地區數字化與智慧化轉型的深入,對於智算的需求將日益凸顯。傳統的資料中心將有一部分逐步到西部建設。

在算力排程層面,需要透過算力生產方式的變革推動算力智慧排程。未來的智慧排程系統對算力技術的要求更高,為此,打造算力作業新模式十分必要,即實現生產算力、聚合算力、排程算力、釋放算力等全流程、一體化的高效交付。