阿里平頭哥高端AI芯片“真武810E”來了
阿里巴巴旗下半導體公司平頭哥(T-Head)在其官網正式發布了高端AI芯片“真武810E”(Zhenwu 810E)。這款芯片的亮相并非簡單的產品更新,它標志著阿里巴巴內部醞釀已久的AI“黃金三角”——由通義實驗室(大模型)、阿里云(云基礎設施)和平頭哥(芯片)組成的“通云哥”戰略體系首次完整浮出水面。借此,阿里巴巴已初步構筑起“芯片+大模型+云計算”的全棧自研能力,被業界稱為“中國版谷歌”。

從“新聞聯播”曝光到正式亮相
“真武810E”對于行業而言并非完全陌生的面孔。早在2025年9月,央視《新聞聯播》在報道中國聯通三江源綠電智算中心項目時,其畫面中就曾短暫曝光過一款代號為“PPU”的芯片及其關鍵參數,引發了業界對阿里自研AI芯片進展的廣泛猜測。
如今,這款神秘的芯片終于以“真武810E”的正式身份登場,證實了阿里巴巴在高端AI芯片領域長達數年的潛心研發已進入商業化應用階段。
平頭哥官網指出,“真武810E”是一款實現了從硬件架構到配套軟件棧全棧自研的AI芯片?!捌筋^哥自主研發的AI產品軟件棧,擁有獨立知識產權,具備統一的編程接口,可端到端支持用戶自主業務落地和擴展?!?/span>
高效性:通過軟件棧提供的API,用戶可以基于SDK直接開發真武應用程序,支持自研生態
高兼容性:沿用當今主流編程環境,開發者可調用軟件棧中統一的API,支持主流AI生態,無需修改應用代碼平頭哥AI產品軟件棧具備完備的軟件生態及工具鏈,向上支持開發者和業務快速展開,向下兼容底層硬件和優化性能,實現軟硬件高效協同。
關鍵參數曝光:已實現萬卡集群部署
根據官方信息及此前曝光的數據,“真武810E”在多項關鍵性能指標上瞄準了國際主流產品。該芯片采用自研的并行計算架構和名為ICN(Inter-Chip-Network)的片間互聯技術。在硬件配置上,單卡配備了高達96GB的HBM2e高帶寬內存,支持PCIe 5.0 ×16主機接口,功耗控制在400W以內。

尤為引人注目的是其互聯能力。每顆“真武810E”芯片集成了7個獨立的ICN鏈路,片間互聯帶寬最高可達700GB/s。極高的互聯帶寬是實現多卡、多機協同計算,支撐千億乃至萬億參數大模型訓練的關鍵。平頭哥官方表示,憑借這一特性,芯片可以靈活配置多卡組合,在集群中實現優異的線性加速比。
在性能對標上,多方報道指出,“真武810E”的綜合性能已超過英偉達此前為中國市場推出的“特供版”產品A800,部分關鍵參數與英偉達另一款產品H20相當。例如,其96GB的顯存容量與H20持平,但采用的HBM2e內存規格略低于H20的HBM3;其700GB/s的片間帶寬則介于A800和H20之間。
“真武810E”并非停留在紙面發布。它已經歷了大規模實際應用的驗證。該芯片目前已在阿里云上實現了多個萬卡集群的規?;渴?,系統穩定運行,服務于超400家頭部企業客戶。這些客戶涵蓋國家電網、中國科學院、小鵬汽車、新浪微博等行業巨頭,芯片支撐著包括大規模深度學習訓練與推理在內的復雜AI任務。阿里巴巴自家的千問(Qwen)大模型的訓練與推理任務,也已在“真武810E”上運行。

?“通云哥”閉環成形,阿里的AI超級計算機愿景
“真武810E”的發布,其意義遠超單一芯片產品。它被認為是阿里巴巴“通云哥”AI戰略閉環的最后一塊拼圖。通義實驗室負責前沿大模型研發(“通”),阿里云提供強大的算力輸出與平臺服務(“云”),平頭哥則打造最底層的算力硬件基石(“哥”)。三者協同,旨在實現從底層芯片、中間層云平臺到頂層模型架構的垂直整合與協同創新。
這種全棧自研的模式,使阿里巴巴能夠更高效地進行軟硬件協同優化,針對自身的大模型和云業務需求定制算力, potentially 提升能效比并降低成本。有分析指出,阿里巴巴正意圖將“通云哥”打造為一臺統一的AI超級計算機,以更系統化的方式參與全球AI競賽。
長期以來,平頭哥的芯片首要任務是滿足阿里巴巴集團內部的算力需求。然而,“真武810E”的成熟與大規模外部客戶驗證,標志著平頭哥正從集團的“成本中心”向具有市場競爭力的獨立業務實體邁進。報道顯示,平頭哥正在積極推動芯片業務走向更廣闊的市場,并已有獨立的資本運作和上市計劃。
回顧平頭哥的發展歷程,自2018年成立以來,其產品線已從早期的AI推理芯片含光800,擴展到Arm服務器CPU倚天710、高性能SSD主控芯片鎮岳510,以及如今的訓推一體AI加速芯片“真武810E”,形成了覆蓋數據中心、IoT等場景的端云一體產品體系。