仿生機器人大咖談現狀:說iPhone時刻有點早,諾基亞時刻剛剛好
精彩沙龍實錄來了
量子位智庫發自 凹非寺
量子位| 公眾號 QbitAI
都說仿生機器人在大模型趨勢帶動下,也來到了“iPhone時刻”。
但更加行業內的認知是:
現在只能說到了摩托羅拉/諾基亞時刻。
為什么?
因為單點技術還遠沒有走向成熟,行業內還不會出現如喬布斯般的技術整合者,底層技術仍需持續研究和突破。
在量子位智庫最新舉辦的仿生機器人沙龍上,云深處聯合創始人兼CTO李超、大象機器人產品副總裁林鴻林,一起給出了這樣新鮮獨到的業內見解。

除此之外,如今仿生機器人產業發展到哪一步?為什么會在此時此刻迎來爆發?未來趨勢走向如何?業內當下最關注什么?
這些行業內外最關注的問題,在沙龍中也都有討論。
量子位在不改變原意的基礎上,對分享內容及圓桌對話進行了編輯整理。希望能夠給你帶來更多的啟發與思考。
仿生機器人爆發為什么是現在?
今年是仿生機器人發展格外快的一年,為何如此?
大象機器人產品副總裁林鴻林表示,AI和大模型的成熟,推動了整個產業鏈和技術鏈的發展,并影響了仿生機器人的落地。
如果從技術層面拆解,可以從硬件和軟件控制兩個層面看起,能發現從工業商業機器人邁向未來的人形服務機器人,有兩個最明顯的區別。

第一個非常直觀的變化,是機器人關節數量上,有了10倍左右的提高。
比如特斯拉Optimus的人形機器人,具有64個關節。這使得其成本要求和輕量化要求,和過去的協作機器人、工業機器人完全不一樣。
并且服務機器人在應用場景上也發生了變化,從結構化轉變為非結構化,這對機器人的感知和決策也提出了不同要求。
所以過去在協作機器人、工業機器人中常用的諧波減速機、RV減速機,在仿生機器人中的應用有所下降。原因在于它自重更大、慣量更大,以及整體成本非常高,也就不符合要求。
傳感器方面,過去常用2D和3D單一的,一般不會二者融合。
但是人形機器人對傳感器的要求就多了,聲吶、各種雷達、SLAM都被放到了體積更小的人形機器人關節中,這對結構和硬件是一個非常大的挑戰。
第二個就是控制層面。
過去因為是單一的機構化場景,所以對于工業機器人的控制要求可以是單關節、或者多關節的一些簡單聯動。
但是到了人形機器人場景之后,很大的一個原因是場景不再結構化,機器人不能再簡單地控制自己的運動關節,而是需要對場景做出判斷。
大模型的出現就給控制層面提供了一個很好的助力和抓手。控制也要更多基于動力學的運動軌跡生成,考慮身體的平衡以及落點。

回看當下,仿生機器人的應用落地以四足機器人為主,常見場景是工業巡檢等。
想要做到這一步,需要具備哪些核心能力?
云深處聯合創始人兼CTO李超表示至少要涵蓋四方面:
- 通用能力
- 控制算法
- 搭載能力
- 通訊能力
第一要位是通用性能力,關節能力需要很好。
第二,要有很好的控制算法,使其具備基本運動能力。以云深處的絕影X20為例,在運動控制算法加持下,能夠爬上20cm的階梯,最高運動速度達4.95m/s,最大作業負載為85KG。
在此之上,四足機器人還要具備搭載各種組織的能力。比如搭載云臺、加上“眼睛”、機械臂或者其他傳感器等。
如雙光譜云臺,可以通過紅外線檢測溫度異常,跨域度感知補足人類的視覺能力。
以及通訊能力,是當下很多機器人的痛點。
現在很多機器人是在樓宇里工作,如果做巡檢任務,在陌生場景下,不能機械狗出去工作卻丟了,人類還是要知道它在什么地方。
尤其像管廊場景像隧道一樣、特別長,對于機器人來說很容易丟失,所以會用到一些專用技術解決狹長管道的定位問題。

除了以上分享之外,量子位還和兩位嘉賓進行了圓桌對話。
共同探討了關于仿生機器人行業當下、未來的諸多挑戰與機遇。對話亮點包括:
- 仿生機器人行業硬件等發展超過預期
- 大模型給仿生機器人交互帶來重大影響
- 服務機器人需要控制自重才能保證安全
- 機器人領域應該有公開的技術對比平臺
- 輪式方案能有效降低人形機器人落地成本
……
具體內容如下~
圓桌對話實錄
軟硬件電池發展均超過預期
量子位:近年來看到仿生機器人公司不斷增多,大家為什么這么看好這一賽道?從行業角度來看,背后的核心邏輯是?
云深處李超:云深處從2017年成立到現在6年時間,也是陪伴這個發展過程走過來的。
從我們從業者角度來說,第一方面,近幾年硬件發展是超出預期的。比如電機伴隨著工業機器人、電動汽車整個領域的快速發展。第二方面,電池也有很大的突破,支撐移動機器人發展。第三方面,各種算力平臺發展也給算力提供了很好的支持,比如英偉達或者國內各種GPU公司等。我們覺得這些因素都給行業更進一步的提供了支撐。再往上層看,算法的進展也超出預期、突飛猛進。
所以現在其實到了一個很好的爆發點,這些能力剛好能聚集在具身機器人上,或者說具身智能在機器人平臺上帶來了很好的呈現。
硬件和算法上的支持,以云深處為例,我們的機器人可以在很多工業場景下進行應用。我看到量子位《中國仿生機器人產業全景報告》上寫2023年開始會有工業化應用,其實要比預計更早一些,去年已經出現了。以上是我作為從業者來說的一些判斷。

人形機器人給硬件續航提出更高要求
量子位:現在仿生機器人中四足機器人和人形機器人有哪些差別,也是大家比較關心的問題,兩位機器人領域專家可否給出一定理解?
云深處李超:我從兩個維度來說一下,一個是業務本身,另一個是技術,其實兩者的差異不大。
在底層技術上,關節能力、控制、操作、交互和感知都是有共性的。但每個技術上遇到的難點不一樣。尤其是運動控制層面,四足機器人更加穩定,雙足機器相對差一些,所以它在平衡控制上有難度。
雙足機器人的關節更多。正常來說,雙足機器人有20多個關節,四足機器人就只有12個,即便加一個機械臂,也只有16個。這進一步影響算法也不太一樣。
從硬件本身來說,雙足機器人硬件要求會更高,它是兩條腿站在地上,要求它的力氣要比四足機器人的一條腿大。如果想要實現同樣的負載能力、行走能力,就給人形機器人提出了更高要求。
從應用方面,未來我們借助人形機器人的場景肯定比四足機器人要多很多,這是我感受很深的一個地方。現在城市中的基礎建設設施、所有工具都是為人而誕生的。如果我們做一個機器狗,首先它從高度或者其他能力上,天然就不具備更廣泛的應用場景。比如剛剛給大家看過的管道機器人,管道建設時是為人類巡查設計的,它的觀測高度比狗要高很多。
所以這就是為什么我們要加機械臂。因為更高的東西四足機器人看不到,加上機械臂后延伸了它的觸覺和視覺。
在工廠場景里也是這個邏輯。還有更多日常生活場景,比如倒咖啡等,人形機器人能以更相近的形態替代人類。

△絕影X20四足機器人
大象機器人林鴻林:我的理解是人形機器人不一定要是兩條腿,但是基本上現在沒有看到雙臂以外的其他選擇,這是目前全世界范圍內達成的一個共識。
所以它大概率是一個雙臂七軸結構,這是最接近人類手臂的。它在空間上沒有歧義點,所有位點都可到達——其實六軸已經能做到很好了——是工業上最常見的形態。但是人形機器人需要多一個關節,原因在于這樣可以讓它在更小的體積里做零空間運動——就是姿態不會變得非常詭異,但是可以在很小的軌跡路徑里去完成這個動作。所以現在看到雙臂七關節,基本上是一個確定的答案。至于中間需不需要一個腦袋,這就見仁見智了,因為這個主要看工業設計能不能把所有傳感器非常合理地布局在中間。

△大象機器人myBuddy
它甚至不需要一個類人的腦袋,因為我們覺得本質上人形機器人、四足機器人,都是工具就人身體的延伸。如果現在的目標是去洗衣服,最聰明的方式是做一個滾筒,而不是做兩個手去搓衣服,它的效率才是最高的。
如果從這個方面去思考的話,我覺得雙臂七軸應該是一個確定的答案,至于下面應該是兩條腿還是四足的機器狗,就看特定場景了。比如電力巡檢,或者有坡度障礙需要跨越的戶外場景,四足的通過性一定遠遠好于雙足和輪式。
我們現在了解到雙足機器人在算法控制的難度上,比四足高很多;在整個平衡性方面的掌握、續航能力,也會是一個很大的挑戰;更直觀的表現是它的成本也會更高。
所以可能短時間內,雙足機器人想要做到量產并落地應用,挑戰還是很多。我倒是覺得輪式機器人可能在效率、成本上,是當下節點的一個最優解。因為實際上殘疾人通過輪椅,可以到達世界上80-90%的空間,也就是雙足不會成為一個硬性的限制。
所以從技術上拆分來看,雙足的操作性、靈活性以及在結構仿生方面,是比較合理的一個方案。然后中間的感知層面,攝像頭、電子皮膚可能有很多方式。現在看到一些機器人,比如帕西尼的機器人有一個腰關節可以做90度的活動;像達闥在腰關節上實現可以上下移動30cm……這些我們都覺得是非常合理的方案。至于下半部分的移動功能,我覺得四足和輪式都比較成熟,短期內可以落地。雙足的方案,一方面我們對這個領域比較陌生,另一方面感覺在技術上,它的成本能夠達到量產的時間會更晚一些。

雙臂方案是確定方向,但更多臂不一定
量子位:您剛才提到雙臂比雙足更適合人形機器人,我們看到云深處的四足機器人上面會增加單獨的機械臂。那么雙臂是單臂之上,更好的一個改進嗎?
云深處李超:這個是肯定的。但是基于成本問題,單臂和雙臂是有一定差異的。剛剛有提到,如果基于任務去做開發,比如管廊場景里的任務,它是通過臂來增加攝像頭的活動范圍,所以一個機械臂就夠了。
如果未來有更加復雜的場景,其實機械狗是可以做成半人馬的感覺。在一些特種場景中已經有這樣的應用,給機械狗裝上雙臂去做排爆,因為雙臂的協同能實現更精細的操作。單臂和雙臂的選擇,目前還主要看要解決什么任務。
量子位:手臂越多會越好嗎?比如像螃蟹一樣裝八個,這樣可行嗎?
大象機器人林鴻林:從仿生學出發來看,現在三個手臂的例子,現在我能想到的就是自然界里蝎子是兩個鉗子加一條尾巴。如果做三臂機器人,我們沒有一個出發的立足點。
但是做雙臂的原因在于,工業場景里確實需要,這不是為了做而做。現在工業方面絕大部分產線,都是單臂已經做完了。現在很多工廠想用機器人,但其實都有一個顧慮,因為它的產線不是長期穩定做一個工件,現在有很多柔性需求。這種情況如果用單臂機器人成本會很高,在于機械臂固定的制距和工件部分需要不停地更換,機器人的調試也要不斷修改。
這種情況下,雙臂的優勢就體現出來了。因為兩個手可以靈活配合,一只手抓,另一只手做插件。這時候左邊固定的一只手臂就不需要去做一個固定的制距。如果整體用雙臂方案,成本也能控制在合理范圍內,所以雙臂方案在工業生產上就是可行的。
現在我們看到做的比較好的,像ABB的雙臂機器人“玉米”,它在工廠里做的其實就是雙臂靈活配合兩個組件插件來做這個事情。所以這是我認為雙臂存在的合理性。
但至于為什么沒有三個手臂、四個手臂,一個是效率方面的考量,每增加一條手臂它不是1+1的關系,是平方的關系,更加復雜。而且如果我們要去做二十幾個或者四十幾個自由度,并且每個都是在上面擁有六個自由度,這個復雜度就放大很多很多倍了。
所以這也可能是為什么自然界里沒有進化出來三條手臂的人,也可能出現過,但是被淘汰掉了。

△ABB雙臂機器人“玉米”
量子位:我們看到特斯拉人形機器人的宣傳片里出現了機器人幫機器人維修的畫面。它在單臂情況下抓取動作比較多,抬手臂、上下抓是雙臂參與比較多。請問這種是算法預先設定好的嗎?還是說可以根據物體形狀來預估?
云深處李超:這個是逐步來的。這就是為什么現在做人形機器人,2D和3D相機要同時有。過去在工廠場景,一般只用一顆三維相機就可以做到大多數姿態判斷和抓取了。2D和3D同時要有,就是因為存在剛剛您提到的場景。它需要判斷相對位置,一個是它在空間里面的姿態,然后去做雙臂姿態的調節。至于他抓取這個位置是否足夠準確,這個肯定是沒法一次到位的,哪怕人手去調一次,也沒有辦法調得很準確。
這種情況下,用的最多的是仿真模型。今年小米發布最新一代機器狗時有提到,他們建了一個模型,里面有幾百條模擬機器狗,讓它們每天在里面不停地跑、不停地摔倒、不停地站起來。這實際上就是在模擬這個過程。同一個麥克風,應該用幾只手抓?抓上面還是下面?讓它不斷地去做嘗試,然后自主學習,最后總能抓到一個合理的位置。這樣一個結果,實際上就是非結構場景中一個很典型的案例。
量子位:想問一下李超博士,在管道或工廠巡檢場景中,是如何訓練機械臂或者執行器識別環境的?
云深處李超:我來客觀說一下,剛剛林總提到的很多還處于仿真階段。那么我們目前在工廠應用,我怕給大家一個過高的期望。目前來說更多的還是預設點位去進行工作。因為在很多應用場景下,是不允許有失敗的,可靠性優先。
像我們剛剛說到的,為什么更多應用場景現在可以落地?因為它是在一個固定場景下做重復性的事情,替代人去完成枯燥的、危險的工作。我們認為這個商業模式是成立的,現在也在陸續往外做拓展。比如向消防領域發展,在半確定的環境下遙控機器狗探測,它具備一定的智能,可以繞障。但確實在實際應用中遇到的困難,比實驗室里多得多,這也是現在我們正在努力的方向。

△絕影X20管廊隧道巡檢
機器人領域應該有公開對比平臺
量子位:目前在行業里,仿生機器人需要自研的部分多嗎?或者說大家都會選擇自研嗎?
云深處李超:說到自研我怕大家有個誤解。因為目前不同場景對機器人的性能要求都有些差異,所以在差異化技術的供應鏈沒有形成以前,所以每個團隊都需要沉淀自己的技術。這些自研技術包括關節部分,比如機器狗和機械臂的關節肯定是不同的。還有自研除了本身能力外,還要滿足一些行業要求。比如電力領域要求它抗電磁干擾、消防領域要求耐高溫等。
現在網上提自研的很多,關于自研算法這一塊,我今天不做判斷。因為國內現在還是有點虛,都說自己是自研,但是也沒扒開看一看。
今天也借這個溝通的機會,各位同仁朋友都在。想說以后是否有有機會大家搭建一個公開的平臺,可以將各種技術做對比,比如圖像處理等等方面。
因為自研不是目的,最終都是為了解決一個問題、實現某方面能力。
現在還沒有這樣一個平臺。我覺得如果有機會,我們可以把產業做的更深入一點。正如剛剛有位老師說到一些行業標準的問題,我們來通過一個共同的平臺去驗證大家的能力差異。
機器人自重和安全性直接相關
量子位:現在很多機器人在發布產品時都會披露自重,這個數據在實際應用中會影響到哪些方面?
云深處李超:自重確實很關鍵。對于人形機器人、都市機器人,它的重量和安全性很多時候都是幾乎等價的。我們的絕影X20自重是50公斤左右,這個重量在特定環境下需要考慮安全性。
自重和負載有很大關系,如果沒有很大的自重,就無法具備很強的作業能力。所以基本上會以重量來劃定機器人的定位。多年積累下來,40-50公斤的級別,差不多就是行業機器人。再往下,就是面向科研教育的機器人,相當于未來的服務機器人,要在20公斤以下,這樣大家使用起來會更加安全。
因為現在好多功能不能保證絕對安全,如果是小機器人出現意外,很多事情能兜底。

△絕影X20產品參數
大模型改寫機器人交互方式
量子位:大象機器人之前是做機械臂的,在相對成熟的工業機器人技術上,有哪些仿生機器人是可以直接套用的?還有哪些是需要重新開發的?
大象機器人林鴻林:底層硬件部分很多是可以使用的。運動控制算法這一部分,無論是單臂獨立工作,還是放在人形機器人上雙臂協同配合,我們的底層機械臂運動控制算法經過這么多年考驗,還是非常可靠的。
但是從單臂到雙臂,會增加額外的新技術。比如雙臂協同算法、雙臂通信上的低延遲等,這也是我們最近在做的一些工作,是可以直接從工業機器人上面借鑒及應用的。
我們感受到比較大的不同是交互上面。工業領域可以接受更加底層的編譯、程序邏輯的編寫,但是在上升到雙臂之后,如果所有的動作是先寫左臂再寫右臂,效率其實非常低,是一個很笨的1+1工作,它沒有做到兩個臂融為一體。
所以怎樣同時給兩條機械臂編譯一個命令,然后再加上它的底層運動控制算法?
我們之前也做過像SLAM這種基于激光雷達建圖掃描的一些控制,如果將這些研發的精力放到一起,怎樣去融合一個更高效的交互,是現在一個比較大的考驗。

量子位:今年大火的大模型、GPT技術,是否有嘗試在機器人上使用?未來大模型能給機器人提供哪些動力?
云深處李超:大模型出來后,給我們蠻大震撼。它解決了以前機器人面面相更廣泛應用、從ToB到ToC的一個很重要問題。
現在很多交互都是通過后臺、通過手柄去操控。這對于一臺真正的機器人是非常不便利的。我覺得大模型能解決很多問題,比如理解能力、算法提升,在這些方面我們都有做一些嘗試。
大象機器人林鴻林:ChatGPT發布后,微軟發布了一個大模型在機器人上的綜合應用,其中一個和機械臂有關的案例,用的就是我們的機器人。現在大模型+機器人每天都在做嘗試,但我覺得現在還處在非常早期的階段。現在能使用的案例,比如教育套件里能夠用AI去識別顏色、形狀、堆疊排放等,就是一些比較簡單的空間意義和概念,然后讓機器人去完成對應色塊、形狀的抓取和堆疊。

到了仿生寵物上面使用,我覺得這會更加復雜。因為我們會希望它識別場景,而不是一個單一的形狀和色塊。現在反倒有一些比大模型更加簡單的方式去實現這件事。很多做3D智能相機的,它的人臉識別算法已經非常成熟。比起我們自己訓練,一個可以直接使用的供應商方案是更成熟的。
所以我們認為大模型+機器人肯定是一個很大的方向。我們現在也在做多方面嘗試,希望能夠實現自然語言到機器語言上的轉換,但我認為現在還處在非常早期的探索階段。
人形機器人不一定要有雙足
量子位:可否介紹一下大象機器人的人形機器人研發工作?最大特點是什么?
大象機器人林鴻林:我們過去做了很多單一場景,每一個單個產品完成了在定位上的要求。比如做產線上的六軸機械手臂,它的要求是高重復定位精度、可靠重復單一任務。我們也做了桌面級教育機器人,它是完全開源的,在這方面我們有很多底層算法,是有我們的創客用戶自己開發出來的,之后在開源平臺上共享。過去這些產品的定位和面向人群是非常不同的,在這些方面累計了一些能力。
這一次我們想要做一個完整人形機器人,其實就是將這些能力綜合,按照實際需求場景結合。所以我們現在看到的一個正在做的方向,是雙臂運動控制,底層硬件上面的可批量制造性、可批量交付性以及新的雙臂控制和交互方式。這都是我們比較有優勢的一個方面。
那么在底層移動上,現在還在做一些新的探索。我們可能大概率不會用一個雙足,現在很多同行都在做雙足,我們可能會用輪式方案,用一個更接近人形輪式的方式,來最后定義產品。
量子位:我們觀察到大象機器人的人形機器人最先在工廠場景中應用,為此有做什么不用的設計嗎?
大象機器人林鴻林:從場景出發,我們早先進行了很多實際調研。現在工廠里到底哪些場景是單臂機器人不能做、而需要一個雙臂的?答案如果是不需要雙臂機器人,那就不用做。但這個需求是實際存在的。
比如剛剛提到的雙手協同拼接。而且我們在行業里不斷積累,服務行業提出了一些場景。比如在日本,我們做了可以在便利店里煮關東煮的機器人。它需要做識別、完成抓取。還有很多各種各樣的想法被提出來,比如廚房機器人、帶雙臂的倉儲等。
綜上,現在其實有一些共性需求。工業機器人不能滿足外觀、噪聲、安全性等方面的要求。我們現在做的是協作機器人,它和工業機器人的區別在于,協作機器人在工廠里工作是不需要裝安全護欄的,它可以和工人們在同一個空間內,所以對于它的安全性要求就非常高,進一步也就不太可能做超過40公斤以上的協作機器人——40公斤以上就是工業機器人人標準了。
對于整體力矩的控制、末端人體感知等安全方面,會有很多新要求。所以這要求雙臂靈活、可以相互配合、可以協同并且足夠安全。同時在交互方面,我們也有一些應用層上的創新,比如結合VR等外部設備。

機器人應用還是太少了
量子位:我們注意到絕影Lite3已經開始面向非結構化場景使用了,適應不同場景最大的技術難點是什么?
云深處李超:我們感覺用的時候技術難點到處都是哈哈。以我們行業機器人為例,現在的問題還是機器人用得太少了。
有一些機器人在隧道里面使用,夏天的隧道會滲水,地面特別滑,我們已經解決了地面濕滑穩定行走的問題,可以保證它不倒。但是在很多狹窄的地方,還希望它既能不倒、又能很精確,這確實是目前遇到的一個問題。還比如在草坪上走,會出現螞蟻洞這種看不到的東西,這個問題現在也在被逐步解決。
云深處現在的優勢是不怕這些問題,我們會不斷進行迭代。其實今天很遺憾,沒有帶著機器人來到現場,如果能有一個實體機器人給大家展示,能夠更直觀感受。
量子位:云深處設計機器人過程中,模塊化設計是經常被提及的。這在非結構化場景機器人的應用上,有什么優勢?
云深處李超:模塊化是批量化的一個前置,這樣可以獨立去做開發。硬件、軟件模塊化對我們來說是有些困難的,它涉及到新技術引入、各個方面的協同。做模塊化是為了更好和行業做接口。
仿生機器人只是到了“摩托羅拉時刻”
量子位:現在都說仿生機器人到了“iPhone時刻”,作為業內人士如何看待這種說法?我們現在走到哪一步了?
大象機器人林鴻林:看待這個問題首先要明確定義下什么是“iPhone時刻”。我們理解這個概念,是指智能手機被廣泛接受,并且定義了智能手機應該是什么樣子。實際上遠遠在iPhone 3S出來之前,很多功能就已經有了,比如3G網絡通信、電容屏觸摸,這些東西不是iPhone帶來的。
所以對于喬布斯的定位,大家都認為他是一個整合者而不是一個創造者,因為他更多是把很多現有技術做結合。
站在這個意義上面,我覺得我們這個時刻還具有很大一段距離。原因在于底層硬件技術本身還非常不成熟,我們只是單點技術比較成熟、離那個時刻非常近。
那么反過來問,iPhone時刻為什么會被定義為這個時刻?
我覺得是因為它定義了很多底層交互。比如它明確了實際上不需要用鍵盤、鼠標來操作,而是直接用手指來點擊屏幕,這個更符合直覺交互,并且它定義了我們今天使用的GUI。
今天的桌面PC,無論是Windows還是macOS,他們做的這一整套定義基本上都是一樣的。無論是iOS還是安卓,這一整套視覺GUI和蘋果當時發布的那一套是一樣的。當我們接受了這一整套交互設定,所以我覺得這個是它能夠成為時刻點、定義下一代產品的一個原因,并且他成功把現有比較成熟的技術放到了一起。
放到今天來看,我覺得我們現在底層算法、硬件產業鏈發展,還沒有非常成熟、以至于可以很快出現一個像喬布斯一樣的整合者,還需要很多底層上面的持續研究和突破。

量子位:現在什么技術要素會成為通往通用人形機器人之路的鑰匙?
云深處李超:我接著剛剛林總的話說,我覺得現在不是iPhone時刻,是“摩托羅拉時刻”。
這是因為人形機器人很多功能是有的,怎么讓它成為一個適用范圍更大的工具?這是現在制約它發展的點。
機器人領域的五項技術,現在都有很多需要突破,從底層、硬件、感知、交互到觸覺,離我們的想象還是有一定差距。但之前最大的差距就是交互、理解方面,這也是今天為什么大家坐在這里來討論。大模型確實彌補了具身智能的最后一環,其他環節此前都有,但是能力還不夠,現在我們各個環節都補齊了。
行業需要更多耐心和時間
量子位:最后,想請問兩位有什么觀點和想法想和關注、熱愛仿生機器人的觀眾朋友分享?
大象機器人林鴻林:我想說我們現在確實在做一些比較新的東西,希望大家能夠對我們這個行業更加寬容。實際上,我們每天都是在看著機器人不斷在各種場合里翻車,它走不好一段路、抓不到一個東西,這個是日常工作中最常遇到的情況。最后能夠呈現在宣傳片里的,都是經過很長時間實驗后得出的結果。
所以一方面,我們對未來有樂觀的判斷,有理想的追求。同時我們也要接受這不會是一個非常簡單并且能快速實現的路徑。
我一方面希望更多人可以關注到這個行業,但同時也希望大家能對任何新興行業都更加寬容,給予它一些耐心和時間。

云深處李超:我們確實在很多場景下實實在在解決一些問題,但是這些問題是媒體或者投資圈很少被關注到的。
在2015年,仿生機器人出現過一波熱潮。當時谷歌收購了兩家機器人公司,波士頓動力和Schaft,他們的技術水平都比國內任何一家機器人公司高非常多。但是在那三年之后,波士頓動力被賣掉,另一家Schaft直接關閉了。
這中間有一個原因,可能是當時技術水平還不夠,或者說還是大家給出了一個過高的期望?
從我們成立云深處這家公司開始,就抱著一個解決問題的目標。
但是剛剛也說到,今年具身智能的發展,實現了技術閉環。我其實蠻感謝這個時代,從2017年創業開始,每年的技術進步都遠超我預期。我們剛成立時,都不能確定我們做到死,機器人能不能用得上。但實際上真實情況比預期好。
所以我最后希望整個行業大家能腳踏實地一點,把這件事當成像汽車產業或者其他技術產業慢慢向前去推進,即便沒有到iPhone時刻,現在也是摩托羅拉時刻/諾基亞時刻,也是會被每個人去用到的。
關于量子位智庫沙龍
量子位智庫主題活動,圍繞AI和前沿科技相關的最新進展和熱門話題,邀請一線行業專家,系統性分享認知。
- DeepSeek-V3.2系列開源,性能直接對標Gemini-3.0-Pro2025-12-01
- 誤入人均10個頂級offer的技術天團活動,頂尖AI人才的選擇邏輯我悟了2025-12-04
- 字節“豆包手機”剛開賣,吉利系進展也曝光了:首月速成200人團隊,挖遍華為小米榮耀2025-12-01
- 居然有21%的ICLR 2026評審純用AI生成…2025-11-30




