色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

微調后模型能生成更長更精確對話

大模型對話能更接近現實了!

不僅可以最多輸入20張圖像,還能支持多達27輪對話??商幚砦谋?圖像tokens最多18k。

這就是最新開源的超長多圖多輪對話理解數據集MMDU(Multi-Turn Multi-Image Dialog Understanding)。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

大型視覺語言模型(LVLMs)的核心能力之一是生成自然且有意義的回答,從而能夠與人類進行流暢的圖文對話。

盡管目前開源的LVLMs在如單輪單圖輸入等簡化場景中展示出了不錯的潛力,但在具有長上下文長度,且需要多輪對話和多圖輸入的真實對話場景中,表現則相對不足。

此外,現有的LVLM Benchmarks主要采用單項選擇題或簡短回答的形式,難以全面評估LVLMs在真實世界人機互動應用中的表現。

為此,研究團隊在論文A Multi-Turn Multi-Image Dialog Understanding Benchmark and Instruction-Tuning Dataset for LVLMs中提出了全新多圖多輪評測基準MMDU及大規模指令微調數據集MMDU-45k,旨在評估和提升LVLMs在多輪及多圖像對話中的性能。

目前,該研究在HuggingFace的6月18日Daily Papers中位居榜首,VQA dataset trending榜排名Top3,得到了國內外的廣泛關注。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

可縮小開閉源模型差距

MMDU基準測試具有以下優勢:

(1)多輪對話與多圖像輸入:MMDU基準測試最多包括20幅圖像和27輪問答對話,從而超越了先前的多種benchmark,并真實地復制了復現了現實世界中的聊天互動情景。

(2)長上下文:MMDU基準測試通過最多18k文本+圖像tokens,評估LVLMs處理和理解帶有長上下文歷史的情況下理解上下文信息的能力。

(3)開放式評估:MMDU擺脫傳統基準測試依賴的close-ended問題和短輸出(例如,多項選擇題或簡短的答案),采用了更貼合現實和精細評估的方法,通過自由形式的多輪輸出評估LVLM的性能,強調了評估結果的可擴展性和可解釋性。

在構建MMDU的過程中,研究者們從開源的維基百科中選取具有較高相關程度的圖像及文本信息,并在GPT-4o模型的輔助下,由人工標注員構建問題和答案對。

具體而言,研究者將wikipedia詞條通過聚類的方法進行合并,劃分為多個不同的類別,并在同一個類別中使用不同的詞條(包含圖文)進行組合。經過InternLM-Chat-20B清洗并去除無用信息之后,交給GPT-4o進行對話生成。生成的基于單詞條和多詞條的對話進行組合,從而構建具有長上下文的多圖多輪對話。

生成的對話以的格式標記圖像位置,使用者可以將不同的多圖多輪對話進一步組合,從而構建所需長度的對話。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實
MMDU和MMDU-45k數據生成pipeline

MMDU Benchmark包含的問答最長擁有18k的圖像+文本tokens、20幅圖像及27輪對話,其規模是以往同類型benchmark的至少五倍,為當前的LVLMs提出了新的挑戰。MMDU-45k包含的最長對話數據擁有超17k的圖像+文本tokens。

45k的多輪對話共包含超過410k的問答,能夠顯著提升LVLMs在長上下文理解,多圖多輪對話等方面的能力。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

受到利用強大的LLMs作為評判的NLP研究的啟發,MMDU的研究員們開發了一個使用GPT-4o進行模型性能評估的評估流程。

具體來說,模型在MMDU Benchmark上生成輸出后,GPT-4o將根據多個維度評估這些輸出結果,并將它們與參考答案進行比較。

為確保全面和細致的評估,MMDU確定了六個評估維度:創造力、豐富度、視覺感知、邏輯連貫性、答案準確性和圖像關系理解。為了引導GPT-4o提供平衡和公正的評估,每個維度都有精心制定的評估提示。

每個維度的評分范圍為10分,分為五個區間(0-2、2-4…8-10),每個區間都設定了相應的評判標準。GPT-4o遵循這些標準進行評判過程,并為每個維度提供最終分數。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

MMDU的評估流程中,使用GPT-4o作為評判,根據參考答案給出總體分數。在每次評估中,GPT-4o將同時參考模型的答案和參考答案。它將為每個評估標準(用藍色表示)提供相應的分數(用綠色表示),并最終以淺橙色總結結果。

通過對15個具有代表性的開源和閉源LVLMs進行深入分析,研究人員發現開源LVLMs(如LLaVa)由于缺乏足夠的對話指令微調數據,相比閉源系統(如GPT-4V)存在較大差距。研究表明,通過對開源LVLMs在MMDU-45k數據集上進行finetune,則可以顯著縮小這一差距,finetune后的模型能夠生成更長、更精確的對話,同時對于圖文交錯的多圖理解能力有了顯著的提升。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實
評估不同LVLMs在MMDU上的表現

團隊報告了以下指標:創造力(C)、豐富度(R)、視覺感知(VP)、邏輯連貫性(LC)、答案準確性(AA)、圖像關系理解(IRU),以及平均(Avg.)結果。

此外,經過MMDU-45k微調之后的模型,在現有基準測試上表現也有所提升(MMStar: +1.1%,MathVista: +1.5%,ChartQA: +1.2%)。這一結果說明,MMDU-45k能夠在各種圖像文本相關的任務上提升LVLMs的能力。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實
在LVLM監督微調(SFT)階段添加MMDU-45k數據的優勢。

表中報告了LLaVa和InternLM-XC2在MMDU和現有的代表性基準測試上的表現,包括MMB(MMBench-Dev-EN)、MMMU(MMMU-Val)、MMStar 、MathVista、AI2D、HallBench(HallusionBench)、MMVet 以及ChartQA。每個部分中的最佳和次佳結果分別用綠色和紅色標記。

在多圖多輪問答及普通單圖問答情境下,經過MMDU-45k微調的模型都有顯著的性能提升。這一性能提升首先表現在對圖像內容的識別上,相比微調前的LVLMs,微調之后的模型能夠更加準確的同時理解多張圖像的主要內容,圖像的順序,以及圖像之間的關系。此外,微調之后的模型能夠生成更為詳實和豐富的輸出,并能夠輕松應對具有超長上下文長度的圖文對話情景。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

InternLM-Xcomposer2在MMDU-45k數據集上finetune前后的表現。錯誤或幻覺描述在展示中用紅色標記,詳細且準確的描述則用綠色標記。

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
蜜臀av一区二区三区有限公司| 4444欧美成人kkkk| 一色屋精品亚洲香蕉网站| 国产精品国产三级国产传播| 日韩亚洲一区二区| 不卡一区二区中文字幕| 91制片厂在线| 日韩专区中文字幕| 国产香蕉在线观看| 国产一级大片在线观看| 黄色99视频| 欧美日韩在线精品一区二区三区激情| 国产成人精品亚洲男人的天堂| 91精品国产综合久久久久久蜜臀 | 亚洲欧美va天堂人熟伦| 亚洲国产精品无码观看久久| 欧美激情xxxxx| 国产一区二区三区免费看| 欧美婷婷精品激情| 亚洲mm色国产网站| 国产午夜久久久久| 色撸撸在线视频| 醉酒壮男gay强迫野外xx| 国产精品国色综合久久| 91福利国产成人精品照片| 国产精品综合在线视频| 九色综合日本| 国产亚洲精品va在线观看| 天堂在线资源网| 日本韩国免费观看| 99久久精品一区| 99精品久久99久久久久| 久久久精品黄色| 久久精品99国产精品日本| 人人爽人人爽av| 国产精品jizz视频| 欧美人在线视频| 91美女片黄在线观看91美女| 亚洲AV无码国产精品| 人妖粗暴刺激videos呻吟| 特色特色大片在线| 日本aⅴ大伊香蕉精品视频| 一区二区三区在线播放欧美| 成人久久久精品国产乱码一区二区| 日韩 欧美 精品| av直播在线观看| 超碰人人干人人| 伊人手机在线视频| 国产黄色片免费看| 国产老女人乱淫免费| 日韩 欧美 中文| www.在线观看av| 亚洲a级在线观看| 欧美孕妇性xx| 国产精品色在线| 国产成人精品亚洲| 一二三区中文字幕| 国产又粗又猛又黄| 69av视频在线| 国产成人无码精品久久二区三| 欧美另类第一页| 欧美疯狂做受xxxx富婆| 亚洲欧洲另类国产综合| 久久精品二区亚洲w码| 在线观看免费视频高清游戏推荐| 99影视tv| 亚洲天堂av在线免费观看| 在线不卡欧美精品一区二区三区| 国产精品一区二区久久不卡| 999精品在线视频| 影音先锋欧美在线| 噜噜噜在线视频| 初高中福利视频网站| 尤物av无码色av无码| 欧美日韩精品免费观看| 亚洲欧美激情一区二区| 一区二区在线免费| 亚洲一区二区三区视频在线 | 国产拍欧美日韩视频二区| 久久婷婷色综合| 日本欧美韩国一区三区| 欧美成人免费看| jjzz黄色片| 国产性生活毛片| 国产精品久久91| 亚洲国内精品视频| 亚洲精品一区在线观看香蕉| 国产91九色视频| 8050国产精品久久久久久| 久久婷婷国产麻豆91天堂| 亚洲美女喷白浆| 国产精品99精品久久免费| 精品在线播放免费| 中文字幕字幕中文在线中不卡视频| 日韩av在线免费看| 国产在线一区二| 日本三级黄色网址| 天天爱天天做天天爽| 国产精品xxxxxx| 好吊色在线视频| 91嫩草丨国产丨精品| 国产在线观看免费av| 欧洲第一无人区观看| 性生活免费在线观看| 亚洲精品怡红院| 国产精品久久久久久久精| 日日摸夜夜添夜夜添精品视频 | 91精品国产综合久久精品麻豆| 亚洲福利在线视频| 国产麻豆成人精品| 亚洲综合成人网| 7777精品伊人久久久大香线蕉的 | 久久精品国产亚洲AV无码麻豆| 成人自拍视频在线| 国产女主播一区| 国产精品国产三级国产专播品爱网| 国产夜色精品一区二区av| 亚洲精品久久久蜜桃| 欧美一级欧美三级在线观看| 欧美性猛交丰臀xxxxx网站| 国产日韩一级二级三级| 精品少妇一区二区三区在线视频 | 午夜免费福利小电影| 国产男女激情视频| 亚洲www永久成人夜色| 三年中国中文在线观看免费播放| 亚洲xxxx2d动漫1| 亚洲一区视频在线播放| 黄色在线视频网址| 老妇喷水一区二区三区| 好男人www在线视频| 青青草成人在线观看| 成人免费的视频| 一区二区三区在线视频免费| 北条麻妃国产九九精品视频| 久久精品国产99国产| 欧美日韩一级黄| 欧美猛少妇色xxxxx| 欧美视频在线一区二区三区| 中文字幕精品国产| 欧美一级bbbbb性bbbb喷潮片| 在线播放精品一区二区三区 | 毛片av免费在线观看| 国产一区二区三区在线观看| 亚洲精品久久7777| 国产欧美欧洲在线观看| 亚洲高清在线播放| 欧美激情国产精品日韩| 亚洲成a人无码| 国产免费一区二区三区四区| 国产精品国产高清国产| 久久99国产精品麻豆| 韩国av一区二区| 播五月开心婷婷综合| 最新国产精品拍自在线播放 | 国产综合视频在线观看| 美腿丝袜亚洲综合| 自拍偷自拍亚洲精品播放| 一区精品在线播放| 亚洲色图偷窥自拍| 亚洲精品影院| 九九热免费在线| 秋霞成人午夜伦在线观看| 国产视频一区二区在线| 亚洲国产sm捆绑调教视频| 日韩av影片在线观看| 日本伊人精品一区二区三区介绍| 91情侣在线视频| 中文字幕中文字幕一区三区| 一路向西2在线观看| 日本欧美加勒比视频| 丝袜一区二区三区| 精品日本一区二区| 性xxxxxxxxx| 免费久久99精品国产| 日韩精品免费视频人成| 亚瑟在线精品视频| 亚洲日本成人网| 性欧美精品一区二区三区在线播放| 午夜影院免费体验区| 国内精品久久久久久影视8| 久久嫩草捆绑紧缚| 大荫蒂欧美视频另类xxxx| 日韩精品一区二区三区色偷偷| 二区三区四区视频| 国产一区二区三区精品欧美日韩一区二区三区 | 久久综合九色综合欧美狠狠| 色婷婷av一区二区三区久久| 欧美视频在线第一页| 九九九在线视频| 午夜激情久久久| 欧美sm美女调教| 99在线看视频| 国产亚洲欧美精品久久久www| 久久99精品久久久久久国产越南 | 国产精品电影在线观看| 国产乱码在线观看| 亚洲国产精品va在线看黑人动漫 | 日韩欧美精品在线观看视频| 国产一区二区女内射| 欧美日韩精品一区二区三区四区 | 97免费观看视频| 国产精品亲子伦对白| 欧美激情精品久久久久| 国模大尺度视频| 国产成人在线免费视频| 久久精品一区二区三区不卡牛牛| 欧美激情中文字幕乱码免费| 在线不卡av电影| 日本一区二区在线视频| 成人性生交大片免费观看嘿嘿视频 | 国产精品视频看看| 丰腴饱满的极品熟妇| 亚洲理论中文字幕| 北条麻妃在线一区| 超碰成人免费在线| 欧洲xxxxx| 亚洲欧美影院| 日本一区不卡| 欧美日韩精品久久久免费观看| 国产精品二区三区四区| 亚洲一区二区免费| 成人黄色影片在线| 国产日韩中文在线| 国产欧美婷婷中文| 国产欧美精品久久久| 国产成人jvid在线播放| 欧美专区在线观看| 日本成人精品在线| 国产福利精品av综合导导航| 97视频com| 51色欧美片视频在线观看| 性欧美办公室18xxxxhd| 国内外成人免费激情在线视频| 欧美高清视频在线| 久久久久久久国产精品视频| 欧美成人久久久| 欧美福利在线观看| 51精品国产黑色丝袜高跟鞋| 欧美一级片一区| 日av在线播放中文不卡| 国产精品日韩欧美大师| 国产精品久久久久久久久影视| 国产精品狼人色视频一区| 国产精品香蕉av| 亚洲xxxxx性| 国产欧美韩日| 欧美日韩在线播放一区二区| 新呦u视频一区二区| 精品一区二区成人免费视频| 日本人妻伦在线中文字幕| 丁香婷婷综合激情| 北条麻妃在线观看| 日韩精品中文在线观看| 日本爱爱免费视频| 国产九色精品成人porny| 亚洲国产欧美一区| 1000精品久久久久久久久| 1024成人网| 欧美日韩国产中文字幕| 在线免费观看成人短视频| 91精品久久久久久久久99蜜臂| 亚洲丁香久久久| 深夜福利日韩在线看| 性欧美在线看片a免费观看| 国产精品日韩在线播放| 成人午夜影院在线观看| 午夜精品一区二区在线观看| 伊人再见免费在线观看高清版| 91成人在线观看喷潮教学| 尤物国产在线观看| 亚洲精品视频大全| 国产精品综合激情| www.国产高清| 日本波多野结衣在线| 国产经典欧美精品| 国产精品视频免费| 懂色av影视一区二区三区| 3751色影院一区二区三区| 亚洲天堂av网| 欧美亚洲第一区| 国产精品传媒毛片三区| 国产精品视频一二三四区| 欧美特级aaa| 中文字幕在线观看免费高清| 99热只有这里有精品| 欧美一级淫片aaaaaa| 成人美女在线观看| 一区二区在线观看av| 制服丝袜日韩国产| 日韩中文字幕在线免费观看| 26uuu日韩精品一区二区| 久久亚洲成人av| 4438x成人网最大色成网站| 尤物一区二区三区| 欧美成人精品高清在线播放| 亚洲欧美国产精品专区久久| 91超碰caoporn97人人| 国产一区二区免费电影| 成人免费看片'免费看| 中文字幕一区二区三区人妻在线视频| 超薄肉色丝袜一二三| 日韩精品在线一区二区三区| 蜜桃av噜噜一区二区三区小说| 国产亚洲综合在线| 欧美视频中文字幕| 伦伦影院午夜日韩欧美限制| 亚洲一区二区三区sesese| 丝袜人妻一区二区三区| 久久久久9999| 看黄色一级大片| 国内国产精品久久| 一区二区成人在线| 日韩激情视频在线播放| 国产精品极品美女在线观看免费 | 亚洲欧洲高清在线| 国产va免费精品高清在线观看 | 自拍偷拍亚洲一区| 成人三级视频在线观看一区二区| 男人添女荫道口图片| 在线小视频你懂的| 国产乱码精品一区二区三区精东| 成人深夜福利app| 在线欧美日韩精品| 久久国产精品久久久久久久久久| 国精产品一区二区| 成人不卡免费视频| 天天干天天干天天| 国产成人高清视频| 欧美亚洲国产怡红院影院| 欧美黑人性猛交| 亚洲精品高清视频| 97人妻天天摸天天爽天天| 亚洲一区在线观| 久久久www免费人成精品| 欧美成人精品3d动漫h| 国产成人午夜视频网址| www.av91| 久久久久99精品成人片试看| 奇米一区二区三区av| 午夜久久久久久久久| 久热精品视频在线免费观看| 日本不卡一区二区三区在线观看| 成人做爰69片免费| 国产理论视频在线观看| 国产精品免费视频一区| 亚洲精品一区二区久| 国产精品国色综合久久| 日韩成人av免费| 看黄色一级大片| 国产欧美日韩久久| 亚洲欧美激情一区| 久久99精品久久久久久青青日本 | 国产伦精品一区二区三区在线| 欧美成人乱码一二三四区免费| 日韩在线 中文字幕| 久久亚洲捆绑美女| 国产丝袜视频一区| 久久精品99久久| 成人精品在线观看视频| 无码精品视频一区二区三区| 午夜视频在线观看一区二区| 久久久女人电视剧免费播放下载| 激情五月五月婷婷| 强行糟蹋人妻hd中文| 国产.欧美.日韩| 精品1区2区在线观看| 风间由美一区二区三区| 手机在线观看日韩av| 国产99对白在线播放| 国产成人免费在线观看| 日韩精品在线一区| 成人av蜜桃| 日本中文字幕精品| 少妇高潮久久久| 欧美午夜丰满在线18影院| 日韩免费在线播放| 欧美污视频网站| 国产aaaaaaaaa| 国产一区激情在线| 日韩三级中文字幕| 精品久久久久久中文字幕动漫| 熟妇高潮一区二区| 视频一区二区中文字幕| 欧美伊人久久大香线蕉综合69| 国产欧美日韩高清| 午夜免费视频网站| 欧美一级在线免费观看| 色综合网色综合| 成人黄在线观看| 18禁一区二区三区| 欧美aaaaaa午夜精品| 在线成人av网站| 欧美大陆一区二区| 国产wwwwxxxx| 99国产欧美另类久久久精品| 国产香蕉一区二区三区在线视频 | 日韩欧美www| 精品国产乱码久久久久久丨区2区| 日本少妇xxxxx| 粉嫩13p一区二区三区| 色诱女教师一区二区三区| 男同互操gay射视频在线看| 日韩免费一级片| 日韩理论片中文av| 久久久久www| 免费日韩中文字幕| 色香蕉在线视频| 欧美不卡123| 可以在线看黄的网站|