時隔多年,AI芯片又是華為發(fā)布會主角了
發(fā)布全球最強超節(jié)點
明敏 發(fā)自 HC大會
量子位 | 公眾號 QbitAI
華為的芯片節(jié)奏,全面走上了新軌道。
繼余承東三折疊手機發(fā)布會上亮相麒麟芯片后,AI算力芯片也有了最新進展。
就在華為全聯(lián)接大會上,輪值董事長徐直軍,帶來了全球最強算力超節(jié)點和集群!
Atlas 950 SuperPoD和Atlas 960 SuperPoD超節(jié)點,分別支持8192及15488張昇騰卡。
Atlas 950 SuperPoD預(yù)計在2026年第四季度上市,完全超越英偉達預(yù)計在2027年上市的NVL576,在未來2年內(nèi)保持全球算力第一。
同時還發(fā)布了全球最強超節(jié)點集群,分別是Atlas 950 SuperCluster和Atlas 960 SuperCluster,算力規(guī)模分別超過50萬卡和達到百萬卡,同樣坐穩(wěn)全球最強集群寶座。
此外,華為還公布了昇騰芯片、鯤鵬芯片未來2年的演進規(guī)劃。包括昇騰950系列/960系列,鯤鵬950/960等。
華為輪值董事長也坦承,由于制程和流片方面的原因,“短期在單芯片性能上和英偉達有差距”……
但是,可以通過極致的系統(tǒng)架構(gòu)和互聯(lián)技術(shù),將大量芯片整合成一個“超級計算機”,在集群級別實現(xiàn)全面超越。

明年Q1推出昇騰950PR,采用華為自研HBM
芯片方面,華為將堅持“一年一代,算力翻倍”的節(jié)奏,持續(xù)演進數(shù)據(jù)格式和帶寬技術(shù),以滿足AI算力增長的無限需求。
由此公布了昇騰950系列、昇騰960系列和昇騰970系列的演進路線。

昇騰950系列
昇騰950芯片架構(gòu)亮點如下:
- 新增支持低精度數(shù)據(jù)格式
- 提升向量算力
- 提升互聯(lián)帶寬2.5倍
- 支持華為自研HBM

具體芯片如下:
昇騰950PR
定位:面向推薦(Recommendation)和偏好(Prefill)場景的推理(Inference)優(yōu)化芯片。
推出這款芯片是因為隨著AIGC發(fā)展,輸入上下文越來越長,計算資源消耗增大。在電商、內(nèi)容平臺和社交媒體中,推薦算法需要更高的準確度和更低的時延。
技術(shù)創(chuàng)新:采用華為自研HBM內(nèi)存方案,可顯著降低成本。
產(chǎn)品形態(tài):標準卡和超節(jié)點服務(wù)器。
上市時間:2026年第一季度。

昇騰950DT
定位:面向訓練(Training)和深度學習(Deep Learning)場景。
技術(shù)創(chuàng)新:
- 采用自研HBM:HiZQ 2.0
- 內(nèi)存容量高達144GB,訪問帶寬達4TB/s。
- 互聯(lián)帶寬提升至2TB/s。
- 支持FP8、MXFP8、MXFP4、HF8等多種數(shù)據(jù)格式,提升訓練效率。
上市時間:2026年第四季度。
昇騰960(規(guī)劃中)
定位:旗艦訓練芯片,各項規(guī)格相比昇騰950實現(xiàn)翻倍提升。
技術(shù)創(chuàng)新:
- 算力、內(nèi)存容量、訪問速度、互聯(lián)端口數(shù)全面翻倍。
- 支持華為自研的Hi-F4數(shù)據(jù)格式,它是目前業(yè)界最優(yōu)的4bit精度實現(xiàn),能進一步提升推理吞吐,并且比業(yè)界FP4方案的推理精度更優(yōu)。
上市時間:2027年第四季度。

昇騰970(規(guī)劃中)
定位:全面升級的訓練芯片,各項指標大幅提升。
初步規(guī)格:相比昇騰960,F(xiàn)P4、FP8算力全面翻倍,內(nèi)存訪問帶寬提升至少1.5倍。
上市時間:2028年第四季度。

Atlas 950:預(yù)計未來2年保持全球第一
華為副董事長、輪值董事長徐直軍坦言,華為在單芯片制造上受到限制,但是通過過去30年在基礎(chǔ)軟件和系統(tǒng)架構(gòu)上的積累,可以通過極致的算力架構(gòu)和互聯(lián)技術(shù),將大量芯片整合成一個“超級計算機”,從而在集群層面實現(xiàn)超越。
超節(jié)點(SuperNode)是將大量計算單元(如芯片、服務(wù)器)通過高速互聯(lián)技術(shù)整合成一臺邏輯上統(tǒng)一的、能像單臺計算機一樣學習、思考和推理的巨型AI計算機。它正成為AI基礎(chǔ)設(shè)施建設(shè)的新范式。
目前華為現(xiàn)有Atlas 900 A3超節(jié)點,支持384顆昇騰910C芯片。最大算力達300PFlops,至今仍是全球算力最強的AI超節(jié)點。自上市以來,已交付超300套,服務(wù)20多家客戶。

Atlas 950超節(jié)點
此次最新發(fā)布Atlas 950超節(jié)點。
支持8,192張昇騰950DT芯片,規(guī)模是Atlas 900的20多倍。
它由128個計算柜和32個互聯(lián)柜組成,占地約1000平方米,采用全光連接。
關(guān)鍵指標如下:
- FP8算力:8 EFlops
- FP4算力:16 EFlops
- 互聯(lián)帶寬:16.3 PB/s(超過全球互聯(lián)網(wǎng)總帶寬的10倍)
- 內(nèi)存容量:1152 TB
- 訓練總吞吐:4.91mn TPS(較Atlas 900提升17倍)
- 推理總吞吐:19.6mn TPS(較Atlas 900提升26.5倍)
相比英偉達2025年將上市的NVL144,卡規(guī)模是其56.8倍,總算力是其6.7倍,內(nèi)存容量是其15倍,互聯(lián)帶寬是其72倍。
Atlas 950 超節(jié)點上市時間為2026年第四季度。預(yù)計在未來兩年內(nèi)保持全球算力第一。
Atlas 960超節(jié)點
一同發(fā)布的還有Atlas 960 超節(jié)點 。
它基于昇騰960/昇騰950DT芯片,最大支持15,488卡。使用跨柜全光互聯(lián)。
關(guān)鍵指標在Atlas 950基礎(chǔ)上再度翻番:
- FP8算力:30 EFlops
- FP4算力:60 EFlops
- 內(nèi)存容量:4460 TB
- 互聯(lián)帶寬:34 PB/s
- 大模型訓練和推理性能相比Atlas 950提升3-4倍。
預(yù)計在2027年第四季度上市。
開創(chuàng)面向超節(jié)點的互聯(lián)協(xié)議靈衢
超節(jié)點技術(shù)不僅用于AI,同樣重塑通用計算。
華為發(fā)布鯤鵬950、鯤鵬960芯片以及對應(yīng)超節(jié)點。
鯤鵬950處理器:
- 版本:96核/192線程;192核/384線程
- 特性:支持機密計算,新增四層安全隔離。
- 上市時間:2026年第一季度。
基于鯤鵬950,組成泰山950超節(jié)點。
這將是全球首個通用計算超節(jié)點。最大支持16節(jié)點,32個處理器,最大內(nèi)存48TB。同時支持內(nèi)存、SSD、DPU池化。
基于TaiShan 950超節(jié)點打造的GaussDB讀寫架構(gòu)無需對數(shù)據(jù)庫進行分布式改造,性能提升2.9倍。
最終可平滑替代大型機、小型機上的傳統(tǒng)數(shù)據(jù)庫。TaiShan 950加上分布式GaussDB將成為各類大型機、小型機的終結(jié)者,徹底取代各種應(yīng)用場景的大型機和小型機以及Oracle的Exadata數(shù)據(jù)庫服務(wù)器。
除了核心數(shù)據(jù)庫場景,TaiShan 950超節(jié)點在更廣泛的場景里,表現(xiàn)也很亮眼:比如虛擬化環(huán)境的內(nèi)存利用率提升20%,在Spark大數(shù)據(jù)場景,實時數(shù)據(jù)處理時間縮短30%。
上市時間為2026年第一季度。
構(gòu)建萬卡超節(jié)點的最大挑戰(zhàn)在于互聯(lián)技術(shù)。華為通過系統(tǒng)性創(chuàng)新攻克了兩大難題:
第一是如何做到長距離而且高可靠。大規(guī)模超節(jié)點機柜多,柜間聯(lián)接距離長,當前電互聯(lián)和光互聯(lián)技術(shù)都不能滿足需求。其中,當前的電互聯(lián)技術(shù)在高速時聯(lián)接距離短,最多只能支持兩柜互聯(lián),而當前的光互聯(lián)技術(shù)雖然可以把長距離的多機柜聯(lián)接在一起,但無法滿足可靠性需求。
第二是如何做到大帶寬而且低時延。當前跨柜卡間互聯(lián)帶寬低,和超節(jié)點的需求差距達5倍;跨柜的卡間時延大,當前互聯(lián)技術(shù)最好只能做到3微秒左右,和Atlas 950/960設(shè)計需求仍然有24%的差距,當時延已經(jīng)低至2~3個微秒時,已經(jīng)逼近物理極限,哪怕0.1微秒的提升,挑戰(zhàn)都很大。
基于此,華為開創(chuàng)了靈衢(UnifiedBus) 互聯(lián)協(xié)議,并正式開放云衢2.0技術(shù)規(guī)范,邀請產(chǎn)業(yè)伙伴共建生態(tài),推動超節(jié)點產(chǎn)業(yè)發(fā)展。
最后,華為還有大招放出,發(fā)布超級集群:Atlas 950 SuperPlus集群。
它由64個Atlas 950超節(jié)點并聯(lián)組成,整合52萬顆昇騰950T芯片。
總算力達524 EFlops。支持UBOE和RoCE兩種組網(wǎng)協(xié)議,UBOE在時延、可靠性和成本上更具優(yōu)勢。
上市時間為2026年第四季度。
另外Atlas 960 SuperPlus集群也在規(guī)劃中。
規(guī)模將達百萬卡級,F(xiàn)P8總算力達2 ZFlops,F(xiàn)P4達4 ZFlops。上市時間為2027年第四季度。
最后,徐直軍強調(diào),華為將以基于靈衢的超節(jié)點和集群持續(xù)滿足算力快速增長的需求,推動人工智能持續(xù)發(fā)展,創(chuàng)造更大的價值。
- DeepSeek-V3.2-Exp第一時間上線華為云2025-09-29
- 你的AI助手更萬能了!天禧合作字節(jié)扣子,解鎖無限新功能2025-09-26
- 你的最快安卓芯片發(fā)布了!全面為Agent鋪路2025-09-26
- 任少卿在中科大招生了!碩博都可,推免學生下周一緊急面試2025-09-20



