多模態大模型
CVPR2025視頻生成統一評估架構,上交x斯坦福聯合提出讓MLLM像人類一樣打分
能夠通過模擬人類的認知過程,建立起連接文本指令與視覺內容的智能評估體系。
上海AI實驗室造出首個「通才」機器人大腦:看懂世界+空間推理+精準操控全拿下
可實現多模態大模型(MLLM)對物理實體的直接操控,使機器人能像人類一樣“看到-思考-行動”
能夠通過模擬人類的認知過程,建立起連接文本指令與視覺內容的智能評估體系。
可實現多模態大模型(MLLM)對物理實體的直接操控,使機器人能像人類一樣“看到-思考-行動”