選單

英偉達推出ARM架構CPU,意圖何在?

全球風口

丨 你的全球科技前哨偵察兵

你好,我是王煜全,這裡是王煜全要聞評論。

4月13日,英偉達創始人黃仁勳在GTC2021,釋出了三款基於ARM架構的處理器。儘管英偉達收購ARM尚未塵埃落定,但它已經開始了基於ARM IP的研發,打造了專為大規模人工智慧和高效能計算而設計的CPU:Nvidia Grace。

英偉達推出ARM架構CPU,意圖何在?

Grace CPU採用了更先進的5nm製程,在CPU和GPU之間可以提供高達900GB/s的雙向頻寬,比之前的產品提升了8倍。而且基於英偉達Grace CPU的系統,將比執行在X86CPU上的最先進的英偉達DGX系統性能還要快10倍。

訊息一出,大多數媒體都認為,此次英偉達釋出ARM架構CPU是為了挑戰英特爾,但如果你也這麼看,就是低估黃仁勳了。

因為在人工智慧時代,具有高並行、高密集計算能力的異構計算是AI時代的必然選擇,也就是說,晶片產業正在經歷一場巨大的革命,從傳統的單一架構的計算單元轉變為 CPU+GPU 的異構計算。

我們在【前哨科技特訓營】中講過,異構計算,需要的是一組晶片的整合設計能力,要有CPU+異構單元(例如:CPU+GPU、CPU+FPGA、CPU+ASIC,CPU+NPU神經網路處理器或CPU+IPU人工智慧處理器),甚至需要生態協作的能力,誰的生態能力越強誰就有優勢。

為什麼要搞異構計算?原來人們不對計算工作做細分,都交給 CPU 去幹,但 CPU 是通用計算單元,雖然什麼都能幹,但在很多專業能力上不如他的異構單元GPU。

現在大家發現,其實只要把工作先做個分工,分成複雜不繁重的,和繁重不復雜的,計算能力就能得到提升:

複雜不繁重的需要有靈活的計算能力,正是 CPU 的強項;繁重不復雜的,就是大家每天都需要乾的苦活累活,像影象處理、影片處理,人們就開發出專門的晶片來處理,因為專門處理這一個業務,可以針對性地最佳化演算法,從而大大提升了效率。

而且當人們把任務分解後,絕大多數情況下不需要那麼強大的 CPU 就可以應對,因為日常工作中,大多是那些繁重而不復雜的重複性工作,很小一部分才是複雜不繁重的工作。

這樣一來,晶片產業的重心就變了,從比較單一晶片的效能,變成了比較系統晶片的整體效能。

英偉達推出ARM架構CPU,意圖何在?

這一轉變甚至使得被喊了很多年的“摩爾定律失效”的聲音都消失了,因為大家發現,只要簡單地重新安排一下工作分工,晶片的效率立刻大大提升。

在單一晶片摩爾定律即將走到極限、晶片主戰場轉向AI領域的背景下,英偉達的CEO黃仁勳提出了黃氏定律:透過對GPU技術的改進,每年將使AI推理效能提升一倍。

可以說,在系統晶片的能力中,通用計算因為工作量不大,不是能力瓶頸,價值大大下降,而專用計算成了效能比拼的核心,這也是為什麼英偉達成了晶片產業新霸主的原因。

當異構計算成為核心,就意味著根本不需要在CPU上超越Intel,因為CPU不再重要了,晶片企業就有機會用自己更能掌控的ARM架構的CPU,去替代專利被Intel攥得死死的、自己無法掌控的x86架構的CPU。

自己的CPU和自己的GPU,在整合起來做系統晶片的時候,一定會更順手,這就是為什麼我們當年力挺AMD的根本原因。

另外,這也是為什麼蘋果公司敢於用自研ARM架構CPU取代了Intel的X86架構的CPU的原因,因為看似犧牲了一部分CPU的效能,但透過提升異構部分的效能和整體的配合,最終可以達到整體效能更優的結果。

所以英偉達推出自己的ARM架構CPU,根本原因不是為了針對Intel,而是為了加速擁抱異構計算,不希望Intel的CPU成為系統晶片整體效能提升的障礙。

英偉達推出ARM架構CPU,意圖何在?

說得殘酷點兒,在科技領域,先進企業不是要在競爭中幹掉落後企業,而是要加速奔跑,甩開競爭對手,並且和落後企業撇清關係,避免被後者拖累。

所以,從這個角度來看,Intel的CEO雖然宣佈要開放晶片代工,但其實變革還遠遠不夠,因為這是治標不治本的,如果不能把重心堅決地調整到異構計算上,也就是大力開發各個專用領域的計算單元,並且強調系統晶片的整體設計,Intel長期看必然衰落。

我們認為,未來ARM架構的CPU會越來越普及,相應的異構部分也會有大量專用晶片崛起。從長期看,未來的晶片雙雄很可能不再是Intel和AMD,而是變為英偉達和AMD,這是技術更替帶來的結果,也說明了企業前沿技術佈局的重要性。