雙重突破：全球首個零售VLA大模型來了！開源OpenWBT讓機器人遙操門檻暴降！

衡宇 2025-06-09 14:14:53 來源：量子位

Galbot現場直播，全程無遙操、無需場景數據預采集

允中發自凹非寺

量子位 | 公眾號 QbitAI

6月6日-7日，2025 北京智源大會召開。作為全球具身智能領域最具影響力的學術與產業雙棲盛會，本次大會匯聚了頂尖科研機構、技術領軍企業和開源社群。

北京大學助理教授、銀河通用機器人創始人及CTO、智源學者王鶴博士受邀出席開幕式圓桌論壇。

銀河通用具身大模型機器人Galbot一同登上主論壇舞臺，面向全球觀眾直播展示最新技術成果。這是Galbot的全球直播首秀，全程無遙操，無需場景數據預采集。

此次主論壇直播，零距離展現了銀河通用具身大模型驅動機器人產業落地的硬實力。

雙重突破：全球首個零售VLA大模型來了！開源OpenWBT讓機器人遙操門檻暴降！

以下是此次發布的核心成果：

端到端具身大模型GroceryVLA亮相主論壇

開幕式現場，銀河通用機器人Galbot G1登上主論壇舞臺，面向全球觀眾直播展示最新技術成果，零距離展現了銀河通用具身大模型驅動機器人產業落地的硬實力。

機器人在王鶴博士的語音指令下自主、精確的移動到準確位置并將飲料從貨架取出，全程無遙操、自主推理、并且無事先采集場景數據。

此次Galbot G1展示的貨架精準取貨，背后的技術正是銀河通用團隊最新研發的端到端具身大模型GroceryVLA。

可在現場搭建的1:1還原的真實商超場景中，實現復雜貨架抓取與交付的全流程自主執行。

它所展現的，并非一次臨時編排的演示流程，而是一次面向真實商業場景的能力展示：

從感知到動作、從語言指令到精準操作，全部依靠模型自主完成。其穩定、高效的表現，迅速引發現場學術專家、行業人士與媒體的圍觀與熱議。

也正因其在真實復雜環境中的卓越表現，這臺Galbot作為代表獲智源大會主辦方直接邀請，成為本屆大會唯一登上主論壇主舞臺，面向產業應用的具身大模型系統，在全場矚目下完成全球直播發布。

在智源大會主展區，銀河通用展示了兩臺“性格”迥異的具身大模型Galbot“迎賓機器人”和“售貨機器人”，憑借鮮明互動風格與真實應用能力，吸引了大量觀眾駐足圍觀，成為全場最受關注的技術展區之一。

據王鶴博士介紹，銀河通用機器人正通過與零售業態合作伙伴廣泛合作，年內計劃開設100家店。

作為全球首個面向零售行業的端到端具身VLA大模型，GroceryVLA標志著銀河通用在具身智能領域的重大技術突破。

以下是GroceryVLA五大核心能力的詳解，揭示其為何能夠穩定適配商超復雜環境、實現高度通用的自主操作。

（一）強適用性

GroceryVLA采用端到端模型架構，突破傳統“視覺+軌跡規劃”方案，在緊密排布、涵蓋數十種SKU的真實貨架環境中，自主識別并完成商品抓取。

無需路徑規劃，即可在幾乎無空隙的貨架上穩定作業，展現出卓越的操作效率與靈活性，標志著端到端大模型驅動的閉環控制已具備商用能力。

（二）高度通用性

模型無需針對每種商品包裝單獨調參，支持軟包裝（如袋裝面包、鹵蛋）、硬盒、塑料瓶、透明果凍杯等多樣形態商品的精準抓取，實現了跨品類的統一抓取策略。

無論是剛性包裝還是柔性物體，都能精準取放，滿足全品類零售場景需求。

（三）跨場景泛化能力

基于大規模仿真數據和多場景訓練，模型可直接泛化至全新環境。

此次展會為其首次異地實戰部署，面對光照變化、貨物隨機擺放等復雜條件依然表現穩定。

主論壇全球直播首秀更實現全程無遙控、無場地預采，全面展現其卓越的零樣本泛化能力。

（四）自主決策能力

面對貨架上多個相似商品，GroceryVLA能夠基于任務需求動態判斷最優抓取目標，區別于傳統靜態“指定抓”策略。

系統按照指定順序精準執行，展現出高級任務理解與靈活調度能力，確保多樣化操作流程有條不紊。

（五）強抗干擾性

在抓取過程中，模型具備實時閉環策略調整能力，能夠快速響應現場人為干擾，如貨物被移走、增加或推擠，甚至抓取動作中瓶子被碰倒后重新扶正，保障任務連續高效完成，展現出真正具備商業落地價值的魯棒性和實用性。

無論是面對主論壇舞臺高強度燈光和復雜場地條件干擾，還是在展區人流密集穿梭環境中，GroceryVLA所驅動的Galbot始終穩定完成了從視覺感知、目標識別到自主抓取交付的全流程閉環操作，全面展現出模型的工程穩定性與實際可用性。

這一表現，不僅是銀河通用技術自信的體現，更意味著其具身智能產品已具備真正面向商業落地的能力。

OpenWBT開源系統正式發布，推動人形機器人真正“工作起來”

除了推動Galbot在更廣泛的零售場景的穩定商業落地外，銀河通用也在持續關注人形機器人的技術進展。

在人形機器人領域，穩定易用且支持全身動作的遙操作系統長期缺失，成為制約數據采集、高質量大模型訓練及商業應用落地的關鍵瓶頸。

傳統系統部署繁瑣、兼容性差，且多局限于上半身動作，難以覆蓋真實工作場景所需的完整人類工作空間。

基于此，銀河通用聯合清華大學弋力助理教授團隊正式發布OpenWBT ——全球首款全開源、多機型、跨虛實人形機器人全身遙操作系統。

OpenWBT創新實現了小時級快速部署，用戶僅憑一副VR眼鏡與一臺普通電腦，便可從零完成系統搭建與調試，迅速解鎖人類級操作自由度。

OpenWBT在技術上的具備三大核心突破詳解如下：

快速部署能力

系統設計注重易用性，初學者僅需一副VR眼鏡和一臺普通電腦，最多僅需數小時內即可完成系統搭建與調試，顯著降低部署門檻，同時可以輕松適配室內外各種環境。

多機型兼容性

現已支持Unitree G1、H1兩多款機器人，涵蓋不同自由度與身高規格，實現對完整人類工作空間的高效覆蓋，滿足多樣化機器人硬件需求。

對虛實遙操的靈活支持

不僅支持對真實物理機器人的實時遙控，還兼容虛擬仿真環境遙操作，方便大規模數據采集和基于仿真數據的泛化訓練，促進模型高效迭代。

在動作控制方面，OpenWBT將機器人運動拆分為“走路、蹲下、彎腰、觸達”等基礎“原子技能”，每項技能均在真實環境中經過穩定訓練與驗證。

通過先進的技能融合算法，系統能夠自動組合原子動作，形成連貫復雜的任務序列，實現機器人“碰天觸地”的全身動作協調能力。

OpenWBT的全面開源發布，是銀河通用致力于構建開放共享具身智能生態的重要成果。

作為全球首個標準化、模塊化的人形機器人全身遙操作框架，OpenWBT極大降低了行業技術門檻，為科研機構和產業界提供了穩定高效的訓練與測試平臺。

該項目推動了開放共享的社區生態建設，促進更多研究機構和企業的協同參與，加速具身智能技術的積累與迭代，助力人形機器人從實驗室走向實際應用，實現產業創新與共贏發展。

展望未來，銀河通用將繼續秉持技術創新與開放合作并重的發展理念，引領人形機器人從“實驗室探索”邁向“廣泛應用”，實現機器人真正“工作起來”，深化具身大模型技術與產業協作的融合應用，推動更多行業場景智能化升級，助力構建更加智能、高效、可持續的未來社會。

同時，銀河通用期待與更多合作伙伴攜手共進，共同譜寫具身智能新時代的輝煌篇章。

立即體驗OpenWBT：

https://github.com/GalaxyGeneralRobotics/OpenWBT

具身智能端到端大模型銀河通用

衡宇

雙重突破：全球首個零售VLA大模型來了！開源OpenWBT讓機器人遙操門檻暴降！

端到端具身大模型GroceryVLA亮相主論壇

（一）強適用性

（二）高度通用性

（三）跨場景泛化能力

（四）自主決策能力

（五）強抗干擾性

OpenWBT開源系統正式發布，推動人形機器人真正“工作起來”

快速部署能力

多機型兼容性

對虛實遙操的靈活支持

相關閱讀

具身前沿，智領未來！第二屆中國具身智能大會成功舉辦

9月6日，和量子位聊聊仿生機器人最新趨勢

具身智能落地茶顏悅色，“新店員”刷屏了

10家機構共筑具身智能真機評測基石：RoboChallenge組委會正式啟航

螞蟻投了一家具身智能公司，做手的

自研大模型上車雙足機器人，西湖大學系具身智能曝光

熱門文章

DeepSeek-V3.2系列開源，性能直接對標Gemini-3.0-Pro

階躍開源4B Agent模型，跑通所有安卓設備，手搓黨一鍵部署

Transformer作者爆料GPT-5.1內幕！OpenAI內部命名規則變亂了

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

雙重突破：全球首個零售VLA大模型來了！開源OpenWBT讓機器人遙操門檻暴降！

端到端具身大模型GroceryVLA亮相主論壇

（一）強適用性

（二）高度通用性

（三）跨場景泛化能力

（四）自主決策能力

（五）強抗干擾性

OpenWBT開源系統正式發布，推動人形機器人真正“工作起來”

快速部署能力

多機型兼容性

對虛實遙操的靈活支持

相關閱讀

具身前沿，智領未來！第二屆中國具身智能大會成功舉辦

9月6日，和量子位聊聊仿生機器人最新趨勢

具身智能落地茶顏悅色，“新店員”刷屏了

10家機構共筑具身智能真機評測基石：RoboChallenge組委會正式啟航

螞蟻投了一家具身智能公司，做手的

自研大模型上車雙足機器人，西湖大學系具身智能曝光

熱門文章

DeepSeek-V3.2系列開源，性能直接對標Gemini-3.0-Pro

階躍開源4B Agent模型，跑通所有安卓設備，手搓黨一鍵部署

Transformer作者爆料GPT-5.1內幕！OpenAI內部命名規則變亂了

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創 語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式