沈向洋解讀AI演進五大維度!IDEA研究院發布“萬物可抓取”模型,GPU渲染器打破國外壟斷
機會不止來自技術本身
衡宇 發自 深圳
量子位 | 公眾號 QbitAI
“機會不只來自技術本身。”
帶領IDEA研究院(粵港澳大灣區數字經濟研究院)走過第五個年頭的沈向洋,新鮮分享了他用來梳理智能演進的五個維度——
- 算法范式
- 智能載體
- 交互范式
- 計算架構
- 數據
作為IDEA研究院創院理事長,相比給出一個技術路徑路線圖,他更希望提出一個識別機會的思考框架,幫助創新者在智能演進中找到技術、產品與商業的切口。

從算法范式維度出發,AI算法已經從構筑表達與生成能力的監督學習階段,演進到引入因果與執行的強化學習階段。
后面,將繼續朝邁向高層認知的自主學習階段探索。

從智能載體維度出發,當下的關注點已從語言和多模態模型,轉向世界模型與具身模型。
這個變化反映出智能載體正從抽象符號空間邁向物理空間。

在人機交互維度上,沈向洋強調交互創新的重要性。
過去70年,人機交互經歷了命令行、圖形界面、搜索、推薦到自然交互的多次范式遷移,每一次遷移背后都對應著底層技術浪潮的變化。
“今天的產品開發者必須看懂智能特性帶來的交互機會。”他同時提到,自然交互內部也在分層:
被動響應——交互式執行——具備提議能力的主動模式,交互方式從文本擴展到語音、手勢乃至未來的腦機接口。

而計算架構維度已經出現從通用走向專用、從單一走向多元的趨勢。GPU刺激了深度學習的第一波爆發,但能耗與成本也不斷攀升。
于是,性能、成本與能效成了大家追逐的新的平衡點,推理、端側、強化學習等匹配不同應用任務的專用芯片紛紛涌現。

最后關于數據——在模擬世界階段,數據是靜態教材;在探索世界階段,數據是動態反饋;在歸納世界階段,數據是驗證假設的證據。
從人類數據枯竭到合成數據興起,再到AI主動探索并獲取實驗數據,這背后體現出數據從限制模型能力的約束,逐步轉變為推動AI主動學習的工具。

綜上,不難得出沈向洋的insight:
機會并不僅僅來自技術本身,也來自理解技術如何改變載體、交互、計算與數據的方式,如何重新分布能力、資源與價值。
此外,沈向洋特別提到對未來個體和未來公司的思考。
當個體的能力被AI放大,許多原本需要多環節協作的任務,可以由單個個體端到端完成。
組織的重心,在某些領域中,會從管控變成定義問題、融合個體之間的協作。
他打趣地說道:
我想未來的CEO應該怎么定義呢?
可能不是Chief Executive Officer,而是Chief Entertaining Officer(首席氛圍官)。
還發布了啥?一攬子創新項目
此次大會上,IDEA研究院還宣布了國際先進技術應用推進中心(深圳)與深港高等研究交流中心(SHARE)兩個創新平臺,以及一系列創新項目。
量子位選取了與具身、AI-Native編程語言等項目與大家分享——
從視覺切入,發布“萬物可抓取”DINO-X Grasp模型
2025 IDEA大會上,IDEA研究院計算機視覺與機器人研究中心負責人張磊,首次系統介紹了研究院在具身智能方向的最新成果:
DINO-X Grasp。
過去兩年,具身智能異軍突起,不少團隊試圖通過VLA(視覺-語言-動作)大模型架構,讓機器人像人一樣“聽得懂人話,看得懂世界,動得起來”。
但這條路線背后的問題很快浮現出來:泛化能力不足。

與其從動作建模著手,不如先把“看清楚”這個問題解決得更徹底——這成為了IDEA研究院發力的突破口。
依托IDEA團隊過去在開集目標檢測和視覺感知的研究積淀,以強泛化的視覺檢測模型DINO-X為基礎,IDEA研究院發起了DINO-X Grasp項目。
這個模型不僅能夠精準識別物體、預測抓取點位,還可以結合深度信息,還原物體的三維結構,從而指導機械臂完成穩定、精確的操作。

更重要的是,它不挑設備也不挑場景。
- 在普通4090顯卡上,DINO-X Grasp可以實現10幀/秒的實時推理速度。
- 可兼容主流的英特爾深度相機與X-ARM機械臂,不依賴昂貴工業設備。
- 具備開箱即用的適配能力,支持在移動端或端側設備運行。
現場展示的視頻中,DINO-X Grasp驅動的機器人靈活應對各種形狀各異的物品,從食品包裝袋到異形障礙物,一抓一個準。
目前,這套方案已在招商局集團多個子公司應用,覆蓋港口集裝箱驗殘、橋梁螺釘檢測、夜間車輛識別等多個復雜場景。
此外,DINO-X Grasp已經與美團機器人研究院開展了合作。
張宏波團隊MoonBit:中國人寫的編程語言有了10萬用戶
寫過ReScript語言的張宏波,現在又帶領團隊在IDEA研究院開發MoonBit。
沈向洋特別提到,張宏波是他知道的唯一一個寫的編程語言全世界有以萬為計量單位的人數在用的人。
他所帶領的MoonBit團隊2022年底才成立,剛好趕上了ChatGPT橫空出世。張宏波在臺上分享時說:“作為新的編程語言,(趕上這個時間點),可以讓我們有機會重新思考在AI時代下怎么做開發者工具。”
MoonBit專門為AI時代設計。
它是所有編程語言史上第一個原生提供AI助手的語言,還為語言模型打造了基于語義分析的IDE。
更重要的是,MoonBit的性能表現出色。在數字計算等基準測試中,性能超越Java近10倍;WebAssembly后端代碼體積比Rust小30%,是TypeScript和Go的50%。

過去一年半,MoonBit從一門支持多后端的編程語言,逐步演進為完整的全棧工具鏈(包含專為AI設計的原生工具集),最終構建起集開發者工具鏈與智能體開發生態于一體的開發者平臺。
張宏波透露,MoonBit已經有了商業付費客戶,包括北美的云廠商用它來進行服務器開發。”大部分編程語言在前四年、前五年都是默默無聞的,而我們在這么早的階段就累積了這么多用戶。”
目前,MoonBit的用戶從去年的2.6萬到現在超過了10萬。張宏波預計到2026年底會有接近100萬用戶,“成為首個從中國走出去的有世界影響力的開源平臺”。
提前預告一下:
下個月,用MoonBit編程語言開發的、支持使用多種編程語言的智能體平臺MoonBit agent SDK將正式開源。

GPU渲染器Smaray:五年磨一劍,打破國外壟斷
王嘉平團隊的GPU渲染器Smaray是更為直觀的IDEA研究院新近成果。
“在電影工業中,一個鏡頭通常包含幾百個G的數據。”王嘉平在演示時介紹,電影工業的渲染和游戲完全不同。游戲要求毫秒級響應,而電影渲染一幀畫面可能需要幾小時甚至一天。
目前全球電影渲染市場被三家公司壟斷:
美國的Arnold占據半壁江山,皮克斯的Renderman和歐洲的V-Ray瓜分剩余市場。
此前,《流浪地球》等國產大片幾乎必須使用Arnold渲染。

花了整整5年時間,從基礎算法到工業標準集成,IDEA研究院終于推出了Smaray渲染器。
現場演示環節,王嘉平展示了Smaray的實時渲染能力——
原本需要幾分鐘才能看清的場景圖和雄獅形象,Smaray幾秒鐘就渲染完成,而且可以像玩FPS游戲一樣在場景中自由探索。
更讓人驚喜的是,Smaray不僅支持英偉達GPU,還支持AMD、國產GPU甚至蘋果芯片。
目前,《流浪地球》特效制作方MoreVFX、《哪吒》制作方光線動畫等頂級公司已經開始使用Smaray。

- 為Token付費是一件很愚蠢的事情,用戶應該為智能付費丨RockAI劉凡平@MEET20262025-12-14
- 太初元碁喬梁:AI算法已經跑到單芯片極限|MEET20262025-12-14
- MEET2026擠爆了,AI圈今年最該聽的20+場演講&對談都在這2025-12-11
- 交大高金朱寧:經濟學家視角下AI時代的范式思維轉變 | MEET20262025-12-13



