“智元機器人收購A股上市公司是創新需要…現金流能撐三年”
CEO鄧泰華首次公開亮相
衡宇 發自 上海
量子位 | 公眾號 QbitAI
智元機器人實現對A股科創板公司上緯新材63.62%的控股權后,終于來了次公開、正式的亮相。
今年3月宣布“智元機器人董事長兼CEO”身份的鄧泰華,也在這場智元機器人首屆合作伙伴大會上首次公開亮相。
倒也沒講虛的,一股腦吐出許多外界一直想知道又不知道的東西:
- 融資這事兒智元想融就能融,年底將啟動C輪,引入更多國際產業方;
- 無營收前提下,現金流能撐三年;
- 今年計劃出貨幾千臺,明年出貨數萬臺,未來每年出貨幾十萬臺;
- 商業落地節奏,先ToB再ToC;
- 落地場景選擇路徑,簡單環境+簡單任務→簡單環境+復雜任務→復雜環境;
- 當前主要在打基礎(能力、產品、團隊),今年起產品成熟度提高,市場與團隊具備基礎,開始“逐步踩油門”;
- 智元團隊超1000人,平均年齡31歲;
- 團隊成員75%是研發,其中2/3投入AI,1/3投入本體。
- 未來三年,投入數十億資金,孵化50個早期項目;
- 已投15個早期項目(70%孵化、30%種子/天使),年化收益8倍;
- 啟動“智元A計劃”,三年內打造千億級產業生態;
- 過去銷售以直銷為主,渠道為零;今起以伙伴優先,年內渠道占比30%,2026年70%以上。

慷慨而談的不只有鄧泰華。
會前交流時,智元機器人通用業務部總裁王闖、智元機器人合伙人&具身業務部總裁姚卯青也出面回答了許多疑問。
我們整理其中精華,分成“吃瓜”“技術”“合作”三個板塊,與大家分享。
吃瓜部分
前段時間收購A股上緯新材帶來一些輿論,對此有什么回應?
姚卯青:外界有外界的解讀,我們也控制不了;其次這是一個新賽道,新生的事物是全方位需要創新的。
無論是你技術創新、應用創新、合作模式生態的創新還是資本層面的創新,而且這個是目前國家也支持的方向,A股上市公司也有很多舊產能,或者說一些落后的產能需要被更好的標的去取代,這也是為什么新國六條支撐的方向。
我們也是順應國家的引導能夠去更快利用資金和市場支持,能夠讓我們的產品,讓我們的研發走得更快。
我核心想給大家傳遞一個理念——經常有人會問到我你怎么看智元智能將來什么節奏——我最想回答的就一句話:
你不用問我這個行業怎么看,智元決定這個行業將來發展的速度和是不是泡沫,我們做得好,這個行業就好。
外界知道智元很強,但好像沒有特別令人印象深刻的點?
姚卯青:這個我來解釋一下,我們公司因為融資也非常順利,基本上不需要PR,創業公司但凡PR比較多可能都是為了配合自己一些融資的節奏,這個也可以理解。
我們比較專注于真正做產品研發落地,外部不必要的一些發聲,我們比較少去炒作也是希望這個行業大家稍微冷靜、理性一些,不要過度的膨脹,過度的去接受不應有的熱度。
其實每個月現在大家看到各種什么運動會、展會,無論對智元還是對其他一些友商都是巨大的資源消耗,投人、投設備,對正常一些研發主線的打斷,我覺得影響蠻大的,你為了展會你要做一個臨時方案,但也許不是你真正長線的方案。
另一方面您剛才提到宇樹有很多運動控制的展示,這個確實是宇樹的強項,我們公司認為核心將來更大價值在于上肢的作業能力而不是簡單的運控,運控很重要。
你需要穩定的運動、移動才能配合高效作用,但我們覺得僅僅有這個是不夠的,我們需要真正把更難問題作業操作的問題去解決。
這個操作問題就是一個比運動控制難兩個數量級,難100倍以上的問題,你需要去沉下心來花很長時間從你的硬件到算法到數據真正去持續打磨。
不太可能說我每個月,每幾天就能發各種Demo,或者說買了你機器的客戶隨便倒騰倒騰就能發很多Demo,一定是我們要以從基礎設施、工程、算法、前沿能力,非常完整的團隊沉下心來花一年,甚至兩年時間,而且要跟我們的行業合作伙伴真正懂行業的伙伴在一起去埋頭打磨的事情。
大家也不用擔心下半年我們會陸陸續續發布很多行業應用震撼的展示,真正讓大家看到機器人不僅僅能夠提供情緒價值、文娛價值,它也最終會解決生產力問題。
為什么沒參加世界機器人大會和世界人形機器人運動會?
姚卯青:機器人行走是為了展示我們產品的穩定性和成熟度,因為現在大家也知道包括之前馬拉松比賽,或者是一些運動會很容易出現一些機器人短時間運動之后過溫需要歇息,甚至換機器的情況。
我們是展示24小時又是在極端“秋老虎”非常熱的情況下能夠進行持續行走,這充分證明我們是通過量產的積累已經達到產品相對成熟穩定,可以在真實場景去持續作業的效果。
至于機器人運動會這塊兒:
一方面是我們也在準備我們的伙伴大會,所有的設備、人員可能都集中在準備活動中;另一方面,我們也是認為應該更多展示一些真正在客戶場景可能會使用到的工況,比如說持續行走等很多。
其實人形機器人在客戶現場也做不了跳高,或者說去做百米沖刺,這個也不安全,我們也是更務實一些的做法。
技術部分
遠征A2 24小時高溫行走意味著什么?
王闖:技術層面有幾點突破——
第一,目前我們看到機器人還是遙控為主,但我們希望機器人變成無限的生產力。
變成無限生產力第一步就是它能夠完全自主,移動這方面應該能自主,自主移動我們已經開發了半年多,這次直播24小時覆蓋了從白天到黑夜再到白天一個完整的循環,它有強光環境、逆光環境,好多時候傳感器會出各種各樣的問題,必須把這些問題都解決的比較好,機器人才能在各種不同光線環境變化下穩定的工作。所以自主移動帶導航避障是第一點比較有突破的。
第二,我們直播那天室外最高溫度達到了37℃,地面到61℃。
在這么高的溫度下攝影師還有現場的工作人員都非常難以承受。大家開玩笑說如果在室外有個交警站崗的話可能過不了多久就得輪班,因為那天實在太熱了。
包括今天也是天氣差不多,機器人全程24小時自己獨立完成的,它沒有任何休息,中間不停的給它換電,攝影師總共輪換了73人次,每走一會攝影師已經熱的受不了就換人下去休息。我們可以想見一下這個突破,機器人在某些極端環境下的適應能力某種意義上超越人了,在這種暴曬高溫下。
酷熱環境這種極端環境下,可以在交通崗亭布一些機器人做交通的指揮。這些應用可以逐漸做起來,在這種嚴苛的環境下工作的突破也是其中一個,也是目前大家還沒有做到的。
第三,我們展示了機器人的可靠性。
大家也知道人形機器人要持續保持穩定是非常難的,我們自己在實驗室已經測了連續行走3千小時,上次批量的測我們定了一個標準360小時沒有任何摔倒的異常,目前已經完成了,現在正在做720小時,這是很多臺一起做。
今天這個展示是研發過程很小的縮影,我們研發過程已經跑了360現在正在測720,24小時只是它很小的,我們只是拎出了其中兩臺,剪了其中24小時的縮影給大家看,但敢直播我認為這就是一個突破,因為你連續走24個小時不知道會出什么各種各樣的異常,過程中也有很多小孩干擾它,過程中晚上還有些貓出現,機器人都能夠運行的比較好。
第四,大家都沒有注意到的,機器人在走的過程中有很多講解的任務,機器人任務部署特別方便,大概5分鐘可以完成一個新任務的部署,而且機器人講解的臺詞5分鐘可以隨便改知識庫讓機器人講不同的東西。
這是我們做展廳講解接待對客戶特別重要的東西,因為他講的內容還有走的動線會經常變,如果這個門檻很高很難推廣。
世界模型可以多大程度替代真機訓練?
(注:7月27日,智元發布首個動作驅動世界模型開源平臺Genie Envisioner)
姚卯青:首先Google的世界模型Genie3,它其實是現在在一些類似游戲、影視這樣一些行業應用場景里面能夠交互式的生成。
我們的世界模型其實從打的理念上來講是差不多的,能夠在用戶指定的提示下去生成一個非常自洽的符合物理規律的對未來的預測。
區別在于可能大家面向的一些應用不大一樣,我們更多是面向機器人的一些作業的場景,所以它會生成很多機器人自己第一人稱視角的一些畫面,同時它的畫面里面的一些內容是一些機器人的手部和物體強交互這種操作的過程。
我們這個世界模型其實它是在一些現有的視頻生成類的模型的基礎上,應用3000多小時真實機器人作業數據去進行二次訓練才得到的,所以其實它也可以從某種程度上理解為就是一個真機訓練。
它提供和帶來的能力跟VLA模型里面預訓練是比較相似的,真正我們要做一些特定問題和特定任務的時候,其實也要在這個基礎之上再去采集一定量的后訓練的數據對它進行最終落地前的第三階段訓練。
數據,現在對于行業是什么情況?
姚卯青:行業現在確實是在數據非常早期的階段,這也是我們當時和杭州灣具身智能創新中心合作非常重要的出發點,希望能夠不僅僅是在智元自己內部,而且能夠在全國各地聯合很多行業和地方的合作伙伴,大家把數據的規模、采集、生產、檢驗一些標準化動作能夠做出來形成一套非常能夠大規模復制產業化的效應。
現階段來講,我們也確實看到隨著我們去年年底AgiBot World數據集的發布,大家對數據已經看到它的重要性,特別是高質量數據的重要性。
所以陸陸續續在過去的半年中很多一些場景的客戶,一些特定行業的客戶,他們都在快速的向我們提一些面向真實場景數據的需求。這些需求我覺得都是代表真實應用案例也非常好能夠幫我們去慢慢的積累,我們的數據集不斷的擴充。
現在像這類數據大規模的標準化生產和檢驗標注的環節也是已經充分和創新中心的伙伴一起聯合往前推進。
從這個角度來講,我還是比較樂觀的,我們應該是能夠在未來1-2年時間之內為整個具身智能產業去快速積累大量的真實數據,在2年內我覺得有希望能夠達到現在大語言模型他們所應用的規模,真正給我們帶來具身智能GPT這種涌現時刻,它需要有這樣一個數據來做其背后重要的保證。
至于真機數據和仿真數據,首先我們認為對于機器人的作業來講真實數據一定是價值最高也是最重要的,因為物理世界是一個復雜的系統,跟不同機器人本體以及不同物體、資產去交互的話,背后所蘊含的物理規律、物理約束限制是非常豐富,這樣一個復雜系統來講很難被抽象的建模東西去完美的替代。
我們同時也非常認可仿真和生成式AI等等一些能力,能夠把我們有限真實數據去發揮更大的作用,能夠通過一些數據增廣的手段,從背景、環境、數字資產等等,包括光照等維度去做最大限度的泛化。
因為機器人泛化性是很重要的能力,是區別于原來工業自動化的能力,能夠適應動態的變化環境,仿真還有像AIGC的一些能夠把我們真機采集到的數據去做很多維度的增廣。
同時像仿真的環境也能原生的讓我們在里面去采集很多能夠被進行模擬,進行抽象的動作類型,比如說一些固體簡單的抓放、擺放,其實在很大程度上確實是可以被模擬的。
但是也有很多作業過程,柔性物體,流體,強需要摩擦力、觸覺、力覺的反饋,這些相對來講現在是很難在仿真引擎里面去精確建模的,這也是當今一個比較前沿,可能還沒有到完全產業應用,但還是一個從行業、從國家都比較關注的前沿學科。
如何做高性能物理仿真器,這也可能是從自主可控角度來講不會完全依賴國外一些技術。
從技術的角度來講異構數據是可以被共同利用起來的,而且我們在近期學術論文上也已經充分驗證這樣一種可能性。
但現在階段從我們視角來看數據的質量問題可能是更需要被先解決的。
在大模型技術背景下面,大家拼的就是數據質量、數據配方、數據工程能力,好的數據決定模型上限,差的數據決定模型會有比較差的表現。
有個概念叫數據金字塔。
數據從它的量、它的質量、它的可用性、對模型的最終價值來講,都是存在這樣一個金字塔效應。
底座我們可以定義為是可以大量獲取的低成本的一些數據,塔尖就是一些高成本獲取的,數據量相對來講最少的數據,不同的金字塔的部分對整個具身模型的作用也是不同的。
互聯網的視頻數據,其實我們整體來看是在偏金字塔的中下基座的位置,通過這些海量的低成本的數據,確實可以在第一階段或者是預訓練的階段,確實可以給視覺編碼器或者是視覺語言基礎模型,以及我們一些影視的動作理解提供一個很好的基礎。
這個也是我們今年3月份發布的基座模型GO1里提到的一個概念,我們在一階段的自監督生成式預訓練階段用到了互聯網的數據,用到了人的第一視角操作數據,在這些數據基礎上我們其實可以學成一種通用的對動作的理解和表達,它是一種無關人或者機器人,或者是哪一個機器人,對動作的一種通用的描述。
在這個基礎之上,我們也需要繼續往塔尖,無論是仿真里特定機器人的操作數據,還是我們在塔尖的真機的在真實物理世界里面采集到的機器人數據,對特定場景進行最終的微調,走完所謂的最后一公里。
會不會摒棄激光雷達路線,用純視覺解決所有問題?
王闖:不用激光雷達的原因可能因為它成本比較高,但在中國激光雷達現在越做越便宜,它在機器人里并不算很貴的零部件。
你可以想象一個東西,有的汽車裝的安全氣囊更多,有的汽車少一點,為什么有的裝更多,可能一輩子都不一定用的到,但它是一個冗余的安全器件,我覺得激光雷達就是這樣一個冗余的安全器件。
視覺這個東西本身沒有距離的幀值,可能用在汽車上,汽車的任務就是盡可能不與周圍的東西發生碰撞,所以距離的誤差大一點也不是什么太大的問題,不發生碰撞就可以了。
但機器人必須要跟物體發生接觸,因為人類對機器人的需求要做各種各樣的操作,要跟人貼著相處,跟人貼身相處。
這樣的東西我們希望它本身的感知能力越強越好,尤其對距離精準的把握越強越好,激光雷達畢竟是利用光TOF的原理精確測量距離,它的距離是一手的信息不是通過視覺反算的間接信息。
我們覺得激光雷達我現在能看到的不需要把它去掉,從成本上不需要,從安全上有更高的安全維度,所以我們目前不希望把它去掉。
視覺我們也投入挺大,最開始用激光SLAM,后來發現激光SLAM有很多它的劣勢場景,比如像人遮擋很多的時候,我們現在有V-SLAM作為補充,這個月的版本上就上了一些視覺的SLAM做補充,讓它的定位更穩定。
并不是說我們用激光雷達我們在視覺上就不投入,相反我們視覺和激光雷達覆蓋得更全。
硬件是不是人形機器人當前的Challenge?
王闖:我不同意說硬件不是瓶頸。
我們如果把目標定成機器人要像人一樣有人的能力,那機器人跟人硬件瓶頸差距太大了。
比如人有全身的觸覺,這是特別有用又非常難的;現在機器人連手上的觸覺都沒有做的非常好,像我們剛剛發布的剛剛才開始用起來,還沒有到大規模應用的程度。
比如機器人各方面硬件的性能我認為現在也還是不夠的,比如每個關節都要帶非常靈敏的力的感知,長時間使用都是很可靠的,這些方面硬件也都有很多問題。
另外像機器人硬件的安全性,我認為很多安全的冗余還有對周圍環境、人的防護硬件上的東西也都還不夠,所以我覺得硬件上的瓶頸也很多,當然軟件算法上的瓶頸也是非常大的。
所以具身智能是你必須把全棧能力建起立,硬件和軟件算法協同的進化而不是某個方面已經夠用了,我們實際落地的時候肯定比較務實,今年它是個什么水平我們就選什么樣的場景。
我剛才說的送到外太空,這是個理想它還是非常遙遠的,比如到外太空可能動不動零下一兩百度,現在的硬件肯定是很大的瓶頸。
現在機器人能使用的溫度范圍跟汽車比差很大,汽車一般負40到85度,機器人全身的零部件大部分都到不了這個水平,我認為硬件上還有很多問題。
內外部合作
智元內部三大業務線,彼此獨立還是存在密切合作和共享?
王闖:我們公司有個平臺管理部,平臺研發部門對外露出的比較少,平臺研發部像硬件、ID設計、關節這些東西都放在平臺做,所以有很多這些能力在復用,包括后面我們希望更多的東西逐漸能夠復用性變的非常強。
通用產品線和靈犀產品線都在做人形,一個大人形一個小人形,現在復用率相對來說更高一點,包括內部有已經開源了的AMRT,還有嵌入式底層搞了一AimIO,可以隨便換一個芯片都能很快接入進來,這些我們都復用。
復用的還有任務編排、客戶端界面、靈巧手。
后面會讓平臺化做得越來越好,提高整體研發效率。
現在分成各個業務部門因為我們有不同產品的形態,不同的產品形態總要有人把它設計出來,把各種可靠性驗證的比較好,同時也要考慮它的商業化,它的特點還是不太一樣。
比如大人形和小人形有些場景是一樣的,但也有些場景是不同的,希望這一個業務部門可以從研發到生產、銷售,到商業的閉環整個業務負責起來。
為什么和上市公司密集合作?
(注:杭州灣具身智能創新中心總經理殷哲現場回答媒體提問時也談到,智元當初選擇和上虞區作為合作伙伴,原因之一就是因為這個地區有21家A股上市的公司)
姚卯青:其實跟上市公司合作也非常的簡單,因為我們智元還是一家初創企業,我們自己從公司的定位來講也是在做通用機器人平臺,無論是標準的硬件產品,還是通用的應用開發、軟件平臺、算法基座,這樣一個定位和公司發展階段來講也決定我們不可能自己下場去干所有的行業。
從頭到尾端到端一條龍自己全部干完,但凡做過工業,做過一些行業應用的朋友應該深有體會,做項目是一個非常吃資源、吃人的事情,你一個項目就有很多人要投進去做開發、集成、交付、售后,這也是為什么我們需要去聯合伙伴一起做。
上市公司在這里面無論是本身資金和人才儲備,對行業多年的積累,對行業的理解,以及很多上市公司希望能夠在人工智能和具身智能時代做二次曲線去擁抱新質生產力的角度來講,大家是有一個很好的互補作用。
我覺得更多是智元能夠把自己標準化產品、硬件打造好,做到能夠在行業應用的穩定性、耐久性、一致性。
同時能夠把我們全球領先的人工智能基座能夠封裝好提供出來,在行業伙伴應用的時候能夠以一種低門檻、低代碼,很友好的方式。
比如說通過一些行業數據能夠增量去模型進行訓練,快速的用我們的工具鏈SDK去部署,這樣的方式去行業落地。
今年出海規劃?
王闖:我們今年出海主要是兩方面。
一是,以科研教育為主。
科研教育跟北美的合作比較多,前面也發布了跟英偉達、Skill AI的一些合作,這主要在數據驅動方面,國外學術界的資源還是比較好的,這塊也能夠促進具身智能技術的發展。
二是,以商業為主。
商業我們目前有幾個重點想做的區域:東南亞、日韓、中東,現在進展比較好的東南亞會更快一點,今天來簽約的伙伴有個是馬來西亞的i-city,它之前是做主題樂園的,現在希望拿出一個比較大的廳布各種各樣機器人的體驗還有互動游戲。
我們覺得機器人今年比較大的機會在展廳的講解接待還有文娛表演,我們會傾向于選擇本來就有產業基礎的合作伙伴。
工業場景里把ROI控制在3以內需要多久?
王闖:在綿陽可能三年,在上海可能兩年就收回成本,到海外的話可能一年就收回成本。
我們為什么先在綿陽,因為鄧主任(富臨精工工程中心主任兼事業部總監鄧揚)那邊和我們關系是非常好的,大家的配合效率非常高。
剛開始去的時候我記得今年年初料箱轉運跑通搬一個箱子,完成一個循環是160秒;去鄧主任那邊是50、60秒,又調了一個多月,直播時40秒。鄧主任說工人通常要到30秒以內。
大家可以看到這逐步在優化,需要配合度很高的客戶和我們一起在現場做各種各樣的優化。
我們希望最終能優化到比人還要好,同時它的成本要快速下降,這個成本像鄧主任說的,他們自己生產電關節,機器人里最多的就是關節,一個機器人好幾十個關節,這個成本如果能用上富臨的本身成本就控制的比較好,這個機器人成本也能下降。
我相信它的發展速度在未來一年兩年會有突飛猛進的變化,過去幾個月大家可以想象下從160秒逐漸優化到40秒的節拍,而且成功率從最開始只有百分之六七十現在99.9%,希望大家能夠持續關注相信它未來的進步。
- DeepSeek-V3.2系列開源,性能直接對標Gemini-3.0-Pro2025-12-01
- 誤入人均10個頂級offer的技術天團活動,頂尖AI人才的選擇邏輯我悟了2025-12-04
- 字節“豆包手機”剛開賣,吉利系進展也曝光了:首月速成200人團隊,挖遍華為小米榮耀2025-12-01
- 居然有21%的ICLR 2026評審純用AI生成…2025-11-30




