Arm CEO:AI基礎設施市場供給嚴重不足 AGI CPU是應客戶需求而生

3月24日,Arm在美國舉行的“Arm Everywhere”活動上,正式發布了首款自研芯片,面向數據中心的服務器處理器Arm AGI CPU。
在會后的媒體采訪中,Arm首席執行官Rene Haas與執行副總裁Mohamed Awad就新發布的Arm AGI CPU、AI基礎設施市場策略等核心議題,回答了媒體的提問。
談市場競爭:中國市場巨大,不擔心與客戶競爭
Q:過去Arm只做IP,而現在在做芯片產品,怎么看待與原有客戶的競爭?能否對中國市場進行預測?
Rene Haas:我們認為有空間容納很多不同的參與者,所以我們并不太擔心這個問題。亞馬遜、谷歌、微軟,都有自研項目,所以我們只是認為這個市場機會非常非常大,而且目前供給和服務都嚴重不足。中國是一個巨大的市場,對我們來說是將會是一個非常好的市場。
談商業模式:自研芯片是業務自然延伸
Q:Arm 推出首款自研芯片,是對計算基礎設施商業模式的顛覆,還是垂直領域的創新延伸?
Mohamed:這是 Arm 既有商業模式的自然延伸,我們始終堅持貼近客戶需求,通過技術研發讓成果在眾多客戶間實現價值分攤,此次推出自研芯片,正是響應了多個客戶的深度需求。
Rene:參考 CSS 技術的落地歷程,兩年半前我們將 CSS 從 Neoverse 拓展至汽車、移動領域時,也曾被質疑與客戶競爭,但如今各領域均有大量 CSS 客戶,核心原因是產品能為客戶創造更大價值。AGI CPU 并非要求所有客戶購買,客戶可自主選擇 IP、CSS 或 AGI CPU,這只是我們產品體系的補充。
談產品策略:AGI CPU是應客戶需求而生,命名寓意AI無處不在
Q:Arm AGI CPU項目開發了多長時間,是如何提出這個方案的?
Rene Haas: CSS對我們來說有點像魔法,因為CSS所做的就是大大加快了制造這些復雜芯片的能力。所以我們一直在與客戶進行大量關于CSS的討論,而且這很快就轉變成了,“嘿,你們能不能拿一個CSS為我們做點什么?”所以我認為首先要說的是,我們是被要求做這件事的。這算是第零步。但現在我們看到的,基于巨大的客戶吸引力,我們認為這個機會相當大。
品牌和命名顯然是一個非常令人有激情的話題,對此有很多不同的意見。當我們思考技術發展的軌跡時,有兩件事浮現在腦海中,第一是CPU將無處不在,無論是非常小的用例還是非常大的、高功率的用例;第二,它將會有一個AI的組成部分。所以我們覺得AI無處不在和CPU作為基本標配的這個交叉點,在命名方面感覺恰到好處。
談客戶合作:提供全系列選擇,增強Arm生態系統
Q:能否談談這將如何與你們的客戶合作?能否再多解釋一下這種互動關系?
Mohamed Awad: 這實際上算是Arm的一種獨特優勢,即我們可以走進這些客戶的公司然后說,“嘿,這里有一個產品組合。我們可以給你IP,給你CSS,給你AGI CPU,提供全系列的選擇。”所以這些客戶中的某一個可能會決定在某些用例中使用IP,在其他情況下想要一個CSS,或者直接拿一個AGI CPU成品芯片。歸根結底,這給了他們的是選擇權。我們認為這是一種優勢,它增強了整個Arm生態系統,從長遠來看增強了我們在這些客戶中的地位。
Rene Haas: 該模式實際會擴大市場機會,例如 SAP 基于 AGI CPU 構建系統后,若本地部署無法承載全部工作負載,會轉向 AWS 等云平臺,這將為云服務商創造新的業務機會。核心在于Arm軟件生態的豐富度,生態越完善,對所有基于Arm架構的參與者越有利。
談技術細節:NVLink是未來選項 未采用SMT有原因
Q:Arm此次瞄準了AI應用和加速器,你們能談談你們選擇PCIe Gen 6的決定嗎,你們是否考慮過授權NVLink?
Mohamed Awad: 兩件事,我們選擇PCI Gen 6是因為就標準IP實現而言,它在速度等方面是最先進的。關于NVLink以及我們展望未來,我們絕對在關注的一件事是整個系統的性能以及如何優化它在系統中的運作方式。所以NVLink顯然是選項之一,NVIDIA對我們來說是一個很好的合作伙伴,所以我們肯定在為未來的版本考慮這個。事實上,我們已經宣布我們將在CSS的未來版本中支持NVLink。正如我之前所說,AGI CPU是基于CSS的,所以如果我們決定要往那個方向發展,這是一個自然的延伸。
Q:AGI CPU 機架與 GPU 機架如何協同工作,在 AI 數據中心中承擔哪些角色?
Mohamed:二者有三大核心協同場景:一是 AGI CPU 作為頭節點,與加速器部署在同一服務器,SK 電訊與 Rebellions 的合作就是典型案例;二是高密度 AGI CPU 機架緊鄰 GPU 機架部署,負責編排和管理 agentic 計算流程,快速分發任務,實現低延遲協同;三是 AGI CPU 承擔數據中心控制平面角色,agentic 計算的 7×24 小時運行會產生大量流量,AGI CPU 可高效處理流量調度帶來的算力需求,提升數據中心整體運營效率。
Q:AGI CPU為何未采用 SMT(同步多線程)技術,設計過程中如何權衡其利弊?
Mohamed:SMT 的優勢在于低帶寬場景下,可通過資源共享提升CPU利用率,讓等待的進程將資源讓渡給其他進程。但AGI CPU面向的智能體計算場景需要支持大量線程,且配套的加速器、基礎設施成本高昂,最核心的需求是保障 IO 和內存帶寬的專屬化,4-6GB/s 是該場景下的帶寬最優區間,采用SMT會分割帶寬,降低整體效率,因此目前暫無加入 SMT 技術的計劃。
談市場落地:外界對Arm存誤解
Q:Arm 在機架層面有何布局,AGI CPU 的市場落地策略是什么?
Mohamed:Arm 并不直接銷售機架,而是與廣達、聯想、超微等生態伙伴合作,由合作伙伴打造基于 AGI CPU 的機架產品。看待 AGI CPU 不能孤立聚焦芯片本身,需置于 AI 數據中心的大規模系統中,性能、規模、效率是核心評價指標,客戶最終關注的是芯片在數據中心的實際價值。目前基于 OCP 標準機架的測試已實現突破性的性能與效率,液冷機架等優化方案還能進一步釋放潛力,當前僅為技術落地的起點。
Rene:外界對Arm存在誤解,認為我們僅做IP授權后便與客戶脫節,實際上我們與芯片、系統、參考板廠商深度合作,對算力產品的市場落地全鏈路有清晰認知。AGI CPU的落地離不開ODM生態,雖然我們可提供專業的設計服務,但目前暫不對外披露相關規劃,仍會與ODM伙伴緊密協同。
談市場機遇:萬億美元市場,Arm有機會去爭取
Q:Arm談到了一個萬億美元的市場機會,如何開拓這個市場?
Rene Haas: 半導體市場到2030年,1萬億美元不是什么夸張的說法,我們認為我們有去爭取的機會。