色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

開源模型

PhysVLM團隊 投稿

量子位 | 公眾號 QbitAI

融合物理知識的大型視頻語言模型PhysVLM,開源了!

它不僅在 PhysGame 基準上展現出最先進的性能,還在通用視頻理解基準上(Video-MME, VCG)表現出領先的性能。

在這項研究之前,想讓AI像人類兒童一樣,通過觀察世界理解基本的物理常識,是一個主要挑戰。

游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

對于現實世界的視頻來說,全面覆蓋和解釋所有正常的物理現象既困難又不必要。

相比之下,游戲視頻(gameplay videos)通常包含違反物理常識的“故障現象”(glitches),這有助于簡化物理常識理解的定義和評估,即專注于解釋物理常識的違反現象,而不是試圖列舉所有存在的正常物理現象。

為此,PhysVLM在專門整理的一套數據集上訓練,包括用于評估的PhysGame benchmark、用于監督微調的PhysInstruct數據集和用于偏好對齊的PhysDPO數據集。

PhysGame benchmark 設計

如圖所示, PhysGame包含880個含有故障現象的游戲視頻,每個視頻都配有一個高質量的多項選擇題,專門針對故障現象的性質進行標注。

游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

△PhysGame類別分布

PhysGame涵蓋了四個關鍵的物理領域(即力學、運動學、光學和材料屬性),并細分為12個具體類別(如重力和速度)。

  • 力學(Mechanics):該類別涉及力與力矩及其對運動的影響,提供了解釋和分析視頻中物體運動的基礎原理。典型案例包括重力、彈性和摩擦力。
  • 運動學(Kinematics):該領域研究不考慮力的情況下的運動,涉及精細分類,如隨時間變化的速度和加速度。
  • 光學(Optics):該領域關注光的行為與特性及其與物質的相互作用,包括反射、折射以及吸收與透射。
  • 材料屬性(Material properties):該領域指的是物質固有的特性,包括顏色、剛性、物體形狀以及人體姿態。

PhysGame benchmark構建

視頻收集和過濾:

PhysGame中的視頻主要從Reddit頁面抓取,該頁面包含帶有異常事件和故障現象的游戲視頻。為了平衡不同的類別,團隊還通過關鍵詞搜索從 YouTube增強視頻數據。團隊根據以下兩項標準進行人工篩查:

  • 重復檢查:Reddit論壇可能會多次引用同一視頻,導致重復下載。團隊手動檢查,確保PhysGame benchmark中的視頻不存在重復;
  • 內容檢查:下載的視頻可能包含非游戲元素,團隊對這些內容進行了嚴格篩選,確保它們不被納入PhysGame benchmark中。

選項生成:

本文以多項選擇題的形式創建問答對。具體來說,正確選項描述了視頻中違反物理常識原則的特定故障現象。為了增強干擾選項的可信度,本文要求干擾選項中的故障現象應與視頻中觀察到的個體或動作高度相關,這使視頻LLM理解故障內容,而不僅僅通過識別包含的物體或動作來選擇答案。

質量控制:

為了保證數據集的質量,本文進行了一項包括人工檢查和自動LLM輔助檢查在內的雙重質量控制過程:

  • 人工檢查:所有初步標注的問答對都經過不同人工標注人員的嚴格交叉檢查。對于正確選項,檢查人員必須評估它們是否全面準確地描述了所有存在的物理常識違反實例。對于干擾選項,檢查人員需評估它們是否足夠具有迷惑性;
  • LLM 輔助檢查: 團隊去除那些僅憑問題和選項,不需要查看視頻就能由GPT-4o正確回答的問答對。
游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

△PhysGame示例

PhysInstruct&PhysDPO數據集構建

PhysInstruct:

為了提升視頻LLM的物理常識理解能力,團隊開發了PhysInstruct數據集用于監督微調。視頻收集過程與PhysGame中的流程相同。為了防止數據泄漏,團隊嚴格排除任何已包含在PhysGame中的視頻。團隊遵循Self-instruct范式通過提示GPT-4o來構建PhysInstruct。

PhysDPO:

團隊構建了偏好對齊數據集PhysDPO,以提供更可信和可靠的回答。如圖3所示,團隊將PhysInstruct 數據集中生成的答案視為preferred回答,而dis-preferred回答則通過元信息篡改(meta-information hacking)、時間篡改(temporal hacking)和空間篡改(spatial hacking)生成。團隊用誤導性的元信息以及減少幀數和降低幀分辨率的視頻幀來提示 GPT-4o。

以下是PhysDPO數據集構建流程圖:

游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

模型評估與分析

PhysGame benchmark 實驗結果:

  • 在所有專有模型中,GPT-4o和Gemini-1.5-pro表現最佳,分別達到了56.1%和55.2%的平均準確率。在所有細分領域中,GPT-4o在摩擦和加速度方面表現優越。相比之下,Gemini-1.5-pro在理解與重力、彈性、反射、吸收與透射、顏色和剛性相關的物理常識方面表現更強。
  • 現有的開源模型遠遠落后于專有模型。即便是表現最好的開源模型 LLaVA-OneVision,其平均準確率僅為47.7%。相比之下,本文提出的PhysVLM在所有專有和開源模型中都達到了最先進的性能。與開源方法相比,本文的PhysVLM在12個評估領域中的6個領域達到了最高性能。值得注意的是,PhysVLM-DPO在平均準確率這一指標上比最佳表現的專有模型GPT-4o超出了3.4%。
游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

△PhysGame benchmark實驗結果

Video-MME benchmark實驗結果:

本文的PhysVLM模型在所有7B模型中表現優越。令人驚訝的是,作為7B模型,PhysVLM-SFT和PhysVLM-DPO在整體表現上分別比 34B 模型 LLaVA-NeXT-Video提高了3.2%和3.8%的絕對值。通過比較PhysVLM-SFT和PhysVLM-DPO,團隊發現,使用所提出的PhysDPO數據進行 DPO訓練在短視頻和長視頻上的表現都有所提升,而在中等長度的視頻上的表現略有下降。

游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

△Video-MME benchmark實驗結果

VCG benchmark實驗結果:

在僅使用SFT的模型中,本文的PhysVLM-SFT在平均得分方面表現最佳。在四個子類別的評估中,PhysVLM-SFT在信息正確性和一致性類別上表現尤為出色。與使用DPO或PPO訓練的PPLLaVA和LLaVA-Next-Video相比,本文的PhysVLM-DPO也展現出卓越的性能,進一步驗證了所提出的PhysVLM模型在通用視頻理解中的出色能力。

游戲bug幫大模型學物理!準確率超GPT4o近4個百分點

△VCG benchmark實驗結果

PhysVLM相關論文、代碼、數據均已開源:

pre-prints: https://arxiv.org/abs/2412.01800
代碼鏈接: https://github.com/PhysGame/PhysGame
leaderboard: https://physgame.github.io/#leaderboard

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
亚洲av无码片一区二区三区| 欧美高清视频在线| 9色porny| 国产xxx精品视频大全| 午夜精品久久久久久久99热浪潮| 国产传媒第一页| 性做久久久久久免费观看欧美| 偷拍视频一区二区| 日韩精品一二三四| 国产成人精彩在线视频九色| 日韩久久精品视频| 精品亚洲男同gayvideo网站 | 情侣偷拍对白清晰饥渴难耐| 日本韩国精品在线| 亚洲精品怡红院| 亚洲欧洲一区二区在线播放| 亚洲在线不卡| 成人综合在线观看| 精品国产鲁一鲁一区二区张丽| 欧美精品久久久久| 天天干天天干天天| 久久影视电视剧免费网站| 青青草偷拍视频| 亚洲欧美中文日韩在线| 欧洲美女女同性互添| 精品少妇一区二区| 在线免费观看黄色小视频| 国产福利91精品一区| 国产精品偷伦一区二区| 美女福利视频网| 日韩欧美大尺度| 欧美色图一区二区三区| 婷婷丁香激情网| 一区二区免费视频| 少妇人妻互换不带套| 亚洲一线二线三线视频| www日韩在线观看| 一区二区三区av电影| 精品中文字幕av| 亚洲成年人影院| 三日本三级少妇三级99| 欧美三区在线视频| 国产精品一区二区入口九绯色| 欧美丰满一区二区免费视频| 在线 丝袜 欧美 日韩 制服| 精品国产一区二区亚洲人成毛片 | 91在线码无精品| 一区二区三区免费看| 国产一区二区三区免费观看| 亚洲 日韩 国产第一区| 国产色婷婷亚洲99精品小说| 国产91在线视频观看| 亚洲国产wwwccc36天堂| 中文字幕 欧美 日韩| 三上悠亚 电影| 岛国av一区二区三区| 日本女人性视频| 日韩美一区二区三区| 老熟妇高潮一区二区三区| 上原亚衣av一区二区三区| 亚洲永久精品一区| 国产精品亚洲视频在线观看| 美女久久久精品| 日本一区二区三区视频在线播放| 91丨porny丨首页| 亚洲 欧美 日韩 国产综合 在线| 国产精品区免费视频| 久久精品国产亚洲av高清色欲| 精品精品国产高清一毛片一天堂| 亚洲高清免费在线观看| 欧美电影免费提供在线观看| 色av一区二区| 欧美国产成人精品一区二区三区| 一区二区精品免费视频| 日韩在线欧美在线| 91精品国产高清一区二区三蜜臀| 日韩精品无码一区二区三区| 国产ts人妖一区二区三区| 欧美手机在线视频| 国产精品理伦片| 手机在线观看毛片| 中文字幕免费播放| 色诱av手机版| 久久大大胆人体| 狠狠色丁香久久婷婷综合_中| 久久精品无码一区二区三区毛片| 久久riav| 欧美激情在线视频二区| 日韩中文字幕在线精品| 欧美日韩国产成人在线| 欧美亚洲视频在线看网址| 美女少妇精品视频| 欧美精品在线一区二区三区| 国产午夜精品美女毛片视频| 波兰性xxxxx极品hd| 久久综合中文色婷婷| 97精品在线视频| 久久久蜜臀国产一区二区| 中文乱码人妻一区二区三区视频| 欧美少妇一区二区三区| 成人激情综合网| 精品国产成人在线影院| 欧美国产国产综合| 日韩网站在线免费观看| 好看的日韩精品| 欧美成人精品xxx| 一本大道久久加勒比香蕉| 日韩精品最新网址| 亚洲国产精品免费| 欧美日韩久久不卡| 中文无字幕一区二区三区 | 少妇被狂c下部羞羞漫画| 国产精品精品软件视频| 日韩av在线播放资源| 国产精品国产三级国产aⅴ中文| 粉嫩av性色av蜜臀av网站| 麻豆精品蜜桃一区二区三区| 欧美高跟鞋交xxxxxhd| 老牛嫩草一区二区三区日本| 午夜啪啪免费视频| 久久久999精品| 日韩在线免费高清视频| 北条麻妃高清一区| 苍井空浴缸大战猛男120分钟| 777一区二区| 天美传媒免费在线观看| 99精品999| 国产xxxxx视频| 日韩免费一区二区三区| 99久久免费国| 99国产超薄肉色丝袜交足的后果| 欧美另类极品videosbest最新版本| 激情综合色丁香一区二区| 中国黄色片一级| 国产伦精品一区二区三区精品视频| 亚洲第一在线综合网站| 成人av在线资源| 成人免费视频播放| 日韩一级中文字幕| 久久久精品毛片| 在线观看亚洲网站| 青青青国产在线| 天天鲁一鲁摸一摸爽一爽| 波多野结衣三级视频| 欧洲亚洲一区| 国产精品区免费视频| 国产精品第七影院| 日韩一区二区三区视频在线观看| 国产成人高清视频| 国产色一区二区| 欧美日韩在线精品一区二区三区激情| 日本精品在线观看视频| 欧美图片第一页| jizz中文字幕| 蜜桃网站成人| 免费观看成人高| 久久这里只有精品18| 日韩精品福利片午夜免费观看| 最新天堂在线视频| 91丝袜一区二区三区| 国产精品丝袜久久久久久app| 在线电影av不卡网址| 国产日本欧美一区二区三区| 亚洲淫片在线视频| 北条麻妃高清一区| 99久久精品久久久久久ai换脸| 91亚洲永久免费精品| 久久综合伊人77777麻豆| 超碰97在线播放| 国产亚洲人成a一在线v站| 香蕉成人啪国产精品视频综合网| 国产毛片一区二区| 欧美大片欧美激情性色a∨久久| 无码人妻av免费一区二区三区 | 性生活免费观看视频| 不卡av在线播放| 国产精品蜜臀在线观看| 视频一区视频二区中文| 国产欧美精品区一区二区三区| 玉足女爽爽91| 日韩精品一区二区三区在线播放| 国产福利一区二区三区| 久久先锋资源| 久久爱另类一区二区小说| 成人免费视频免费观看| 蜜臀av性久久久久蜜臀aⅴ四虎 | 911av视频| 蜜臀av一区二区三区有限公司| 尤物网站在线观看| 国产精品suv一区二区69| 日韩激情一区二区| 亚洲图片欧美日韩| 国产综合色产在线精品| 亚洲人成小说网站色在线 | 久久99精品一区二区三区三区| 91激情在线视频| 日韩精品一区二区三区四| 肉大捧一出免费观看网站在线播放 | 日韩三级高清在线| 亚洲一区二区三区中文字幕在线| 国产精品久久二区二区| 亚洲精品在线免费观看视频| 干日本少妇视频| 亚洲久久在线观看| 久久精品女人| 一区二区三区四区在线免费观看| 日韩精品中文字| 欧美大片在线观看| 91在线无精精品一区二区| a√天堂在线观看| 欧美日韩在线视频免费播放| 亚洲一区二区三区影院| 日韩久久久久久久| 最新国产中文字幕| 色老头久久综合| 99re在线播放| 午夜视频在线网站| 特黄一区二区三区| 日韩和欧美一区二区三区| 亚洲伊人色欲综合网| 久久久久久久影院| 日韩美女视频免费看| 亚洲精品无人区| 完美搭档在线观看| 中文字幕+乱码+中文字幕一区| 国产精品久久久久久久久免费看| www黄色av| 亚洲一级在线播放| 欧美日韩一区二区精品| 久久精品欧美一区二区三区不卡| 一区二区三区国产视频| 美女主播视频一区| 日韩在线精品一区| 国产自产女人91一区在线观看| 久久精品视频一区二区三区| 天天射天天操天天干| 日韩精品乱码久久久久久| 高清中文字幕mv的电影| 日韩视频免费播放| 精品乱色一区二区中文字幕| 欧美中在线观看| 色视频www在线播放国产成人| 欧美精品在线视频| 亚洲永久免费视频| 成人中文字幕+乱码+中文字幕| 中文字幕免费精品一区| 欧美日韩国产高清一区二区| 亚洲美女免费在线| 91日韩一区二区三区| 免费高清在线一区| www.国产三级| 中文字字幕在线中文| 日韩中文字幕视频| 成人精品在线播放| 免费毛片在线播放免费| 麻豆国产精品一区| 污视频网址在线观看| 欧日韩免费视频| 国产三级精品三级在线专区| 免费不卡在线观看| 高h震动喷水双性1v1| 亚洲天堂中文在线| 免费观看一区二区三区毛片| 欧美成人短视频| 伊人网伊人影院| 极品白嫩的小少妇| 国产精品久久久久野外| 国产成人av影视| 亚洲熟妇无码另类久久久| 在线播放 亚洲| 视频一区视频二区视频三区视频四区国产 | 国产精品色噜噜| 97久久超碰国产精品| 国产suv精品一区二区6| 久久99国产精品久久99果冻传媒| 熟妇人妻一区二区三区四区| av中文字幕免费| 国产精品久久久久久免费| 国产日韩在线免费观看| 高清乱码免费看污| 久久精品视频1| 成年免费在线观看| 91久久国产视频| 日韩高清精品免费观看| 日本学生初尝黑人巨免费视频| 欧美爱爱免费视频| 91香蕉视频污在线观看| 国产精品久久国产精麻豆96堂| 久久亚洲AV无码专区成人国产| 国产精品福利导航| 欧美丰满少妇人妻精品| 亚洲国产欧美视频| www.黄色在线| 91久久久久久久久久久久久久| 三级黄色录像视频| 一区二区视频免费看| 欧美日韩亚洲国产另类| 加勒比av在线播放| 欧美精品亚洲精品日韩精品| 国语对白永久免费| 中文字幕精品一区二| 国产三级漂亮女教师| 欧美视频一二区| 麻豆一区二区在线| 丁香五精品蜜臀久久久久99网站 | 99精品国产高清一区二区| 99在线免费观看视频| 欧美成ee人免费视频| 中文一区一区三区免费| 国产女主播自拍| 日韩免费高清在线| 国产伦精品一区二区三区妓女下载| 成熟妇人a片免费看网站| wwwww黄色| 久久露脸国语精品国产91| 最近中文字幕在线视频| 天天干天天爱天天操| 激情五月激情综合网| 久久人人爽人人爽| 有坂深雪av一区二区精品| 色999日韩国产欧美一区二区| 91麻豆精品国产91久久久久久 | 在线播放日韩av| 久久久久久久久91| 国产精品福利无圣光在线一区| 国产a一区二区| 亚洲一区 在线播放| 爱情岛论坛vip永久入口| 老熟女高潮一区二区三区| 一区二区三区伦理片| 日韩欧美一级视频| 国模私拍视频在线| 国产成人午夜高潮毛片| 国产精品久久免费看| 五月激情六月综合| 亚洲精品成人久久久| 欧美第一淫aaasss性| 国产一区在线播放| 欧美日韩免费精品| 成人免费在线视频播放| 国模大尺度视频| 欧美日韩一级在线观看| 国产黄色片av| 懂色av一区二区三区免费观看| 国产精品久久毛片a| 6080国产精品一区二区| 久久精品免费电影| 91久久中文字幕| 黄色网在线视频| 漂亮人妻被黑人久久精品| 国产 欧美 日韩 在线| 久久久噜噜噜| 国产精品美女久久久久久久| 欧美性大战久久久久久久蜜臀| 国产亚洲视频在线| 91麻豆国产语对白在线观看| 激情五月五月婷婷| 中国免费黄色片| 久久久精品视频网站| 青青草原综合久久大伊人精品优势| 中文字幕乱码亚洲精品一区| 欧美日韩一区在线观看| 久久久国产精品一区| 国产欧美一区二区视频| 在线视频日韩一区| 欧美日韩免费做爰视频| 久久亚洲精选| 亚洲乱码中文字幕| 亚洲人永久免费| 99高清视频有精品视频| 激情综合在线观看| 91精品一区二区三区蜜桃| 神马午夜在线观看| 成人欧美一区二区三区小说 | 欧美xxxx18性欧美| 麻豆91蜜桃| jjzz黄色片| 97在线播放免费观看| 91麻豆精品在线观看| 日韩午夜电影av| 国产精品最新在线观看| 无码人妻丰满熟妇区96| 国产探花在线免费观看| 青椒成人免费视频| 狠狠躁夜夜躁久久躁别揉| 九九九热精品免费视频观看网站| 欧美一区激情视频在线观看| 日本中文字幕有码| 中国一级片黄色一级片黄| 2021国产精品久久精品| 精品精品国产高清a毛片牛牛| 国产精品普通话| 日本精品一区二区三区四区 | 国产亚洲短视频| 欧美成人一区二区三区| 成人欧美在线视频| 五月天激情播播| 97超碰人人模人人人爽人人爱| 91香蕉国产在线观看软件| 亚洲成**性毛茸茸| 亚洲一区二区少妇| 色呦色呦色精品| 国产露脸国语对白在线| 亚洲欧美乱综合| 欧美久久精品午夜青青大伊人| 一本一本久久a久久精品综合妖精| 中文字幕人妻一区二区三区在线视频 | 精品国产一区二区三| 制服丝袜在线第一页| 日本高清视频免费观看|