單張消費級顯卡也能參與大模型訓練!無問芯穹用「三個盒子」打通十萬卡到一張卡AI效能躍升路徑
資源有限,但智能無限
衡宇 發自 WAIC
量子位 | 公眾號 QbitAI
智能時代的尺度,在計算資源與智能效率的雙重牽引下正在極速壓縮、迅速蔓延。
兩年前,我們驚艷于幾千卡集群訓練而成的GPT3.5;但今天,一部手機也可以裝下與它同等性能的小型AI了。
2025年WAIC上,無問芯穹聯合創始人、CEO夏立雪如此說道。
他還代表無問芯穹,帶來了AI落地這道難題的最新回答——
三個盒子,打通從十萬卡到一張卡的AI效能躍升路徑。

是的,僅僅是三個盒子。
在無問芯穹看來,這三個盒子背后,是一整套面向未來的智能基礎設施設計。
什么是三個盒子?
“三個盒子”其實是無問芯穹全規模AI效能躍升方案的三大核心產品:
- 大盒子:無穹AI云
- 中盒子:無界智算平臺
- 小盒子:無垠終端智能
這是一整套軟硬件協同系統,專為未來智能基礎設施設計,能覆蓋從云到端的各種規模場景,支持多種異構算力,同時打通模型調度、性能優化到應用部署的全流程。

我們一個一個來看——
大盒子:無穹AI云
大盒子,即無問芯穹推出的無穹AI云,是面向萬卡至十萬卡級別的智算網絡,為超大規模算力集群的利用提供了一個系統性的解決方案。
無穹AI云的底層是一張深度覆蓋全國的廣域算力網,基于無問芯穹“一網三異”調度架構,目前已成功覆蓋“東數西算”國家戰略布局的關鍵節點,匯聚了來自 26個省市、53個核心數據中心的龐大算力資源,整合超15種主流芯片架構的異構算力池,總算力規模超25000P。

夏立雪表示:
無穹AI云不僅可以讓寶貴的算力資源實現最高效的流轉與利用,還能有效激活處于非理想狀態的算力資源,將其轉化為具備高穩定性、高吞吐量與超低延遲的優質AI服務能力。
目前,無穹AI云提供高度標準化和開放化的接口,支持獨特的“平臺+自營”運營模式——不僅向獨立智算中心敞開大門,實現無縫集成;也支持企業構建自有運營平臺站點,并融入底層算力供給網絡。
過去半年里,無穹AI已經在上海市、杭州市、北京市等地接連落地。
此外,無問芯穹服務的全球最大人工智能孵化器上海模速空間,日均Token調用量已突破100億大關。

中盒子:無界智算平臺
中盒子,即無問芯穹推出的無界智算平臺,專門面向百卡至千卡級的大型集群,解決高校、科研機構、中小AIDC中心的模型訓練與推理難題。
無界智算平臺的能力建立在無穹AI云的基礎之上。
夏立雪在現場透露,無界智算平臺已在超過100個大型研發場景中多次成功保障了大規模模型訓練與推理任務的關鍵需求,并幫助國產計算集群實現了實實在在的正向收益。
從3000卡的沐曦GPU集群穩定支撐百億模型600小時訓練,到云南移動依托2000張昇騰卡實現千億模型商用推理,無界平臺不僅能算優算穩,還能真正帶來正向收益。
更重要的是,面向未來,夏立雪還宣布了無問芯穹在大盒子和中盒子協同的重要產品化進展:
全球首個跨地域全分布式聯合強化學習服務。
這個服務支持將各地AIDC中零散的算力資源,與一個中等體量的算力集群結合起來,完成跨地域的聯合強化學習。
最小支持單張消費級顯卡接入,哪怕只有一張消費級GPU,也能參與大模型的聯合訓練。

小盒子:無垠終端智能
小盒子,即無問芯穹推出的無垠終端智能,專門面向智能終端。
在小盒子里,無垠終端智能致力于以軟硬協同核心技術優勢,打造“端模型+端引擎+端硬件”智能終端一體化解決方案。
基于此,無問芯穹與上海創智院共同打造了全球首款端側本征模型無穹天權Infini-Megrez2.0,在實現云級21B參數智能水平的同時,將內存占用控制在7B規模、實際計算量控制在3B規模。

此外,Infini-Megrez2.0通過巧妙的工程設計,賦予了終端設備更強的能動性,即使在用戶無感知的“休眠時段”里,也能持續運行大模型。
換句話說,哪怕AI PC在休眠狀態、完全離線的情況下,大模型依然能自主運行,穩定完成任務。
算下來,一臺設備在一年中,能多釋放出1000多個小時的有效工作時間。
為什么要做三個盒子?
為什么無問芯穹要發布這三個盒子?
其實答案只有一個:智能時代的資源拐點已經到了。
從傳統算法,到AI1.0、AI2.0階段,在Scaling Law的推動下,計算資源持續驅動著智能邊界的拓展,逼近AGI的臨界點。

然而,資源的有限性,成為了“人類文明的終極邊界始終橫亙在AGI之路”上的天塹。
它橫臥在面前,成為人們真正觸碰到AGI之前可能會先觸碰到的紅線。

為了解決這個有限資源與無限需求之間的矛盾,無問芯穹提出加速抵達AGI臨界點的兩條進路:
一條是提高智能效率,另一條是擴充計算資源。
一方面突破從計算資源到智能性的轉化效率,用更少的計算資源獲取更強的智能;另一方面,不段挖掘和喚醒更多的可用計算資源。
夏立雪表示,這兩條路徑的交匯之處,即是新的AGI臨界點所在。
他繪制了一個AI應用落地的價值空間:
人工智能應用落地價值空間=場景尺度×計算資源×智能效率。

這套邏輯底層其實指向的是效能躍升這四個字。
不是更大的模型,而是更高的效率;不是無限擴張的卡數,而是有限資源下的最優解法。
而三個盒子,正是這個效能躍升公式的具體化身。
- 誤入人均10個頂級offer的技術天團活動,頂尖AI人才的選擇邏輯我悟了2025-12-04
- DeepSeek-V3.2系列開源,性能直接對標Gemini-3.0-Pro2025-12-01
- 字節“豆包手機”剛開賣,吉利系進展也曝光了:首月速成200人團隊,挖遍華為小米榮耀2025-12-01
- 居然有21%的ICLR 2026評審純用AI生成…2025-11-30



