色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

微調后模型能生成更長更精確對話

大模型對話能更接近現實了!

不僅可以最多輸入20張圖像,還能支持多達27輪對話。可處理文本+圖像tokens最多18k。

這就是最新開源的超長多圖多輪對話理解數據集MMDU(Multi-Turn Multi-Image Dialog Understanding)。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

大型視覺語言模型(LVLMs)的核心能力之一是生成自然且有意義的回答,從而能夠與人類進行流暢的圖文對話。

盡管目前開源的LVLMs在如單輪單圖輸入等簡化場景中展示出了不錯的潛力,但在具有長上下文長度,且需要多輪對話和多圖輸入的真實對話場景中,表現則相對不足。

此外,現有的LVLM Benchmarks主要采用單項選擇題或簡短回答的形式,難以全面評估LVLMs在真實世界人機互動應用中的表現。

為此,研究團隊在論文A Multi-Turn Multi-Image Dialog Understanding Benchmark and Instruction-Tuning Dataset for LVLMs中提出了全新多圖多輪評測基準MMDU及大規模指令微調數據集MMDU-45k,旨在評估和提升LVLMs在多輪及多圖像對話中的性能。

目前,該研究在HuggingFace的6月18日Daily Papers中位居榜首,VQA dataset trending榜排名Top3,得到了國內外的廣泛關注。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

可縮小開閉源模型差距

MMDU基準測試具有以下優勢:

(1)多輪對話與多圖像輸入:MMDU基準測試最多包括20幅圖像和27輪問答對話,從而超越了先前的多種benchmark,并真實地復制了復現了現實世界中的聊天互動情景。

(2)長上下文:MMDU基準測試通過最多18k文本+圖像tokens,評估LVLMs處理和理解帶有長上下文歷史的情況下理解上下文信息的能力。

(3)開放式評估:MMDU擺脫傳統基準測試依賴的close-ended問題和短輸出(例如,多項選擇題或簡短的答案),采用了更貼合現實和精細評估的方法,通過自由形式的多輪輸出評估LVLM的性能,強調了評估結果的可擴展性和可解釋性。

在構建MMDU的過程中,研究者們從開源的維基百科中選取具有較高相關程度的圖像及文本信息,并在GPT-4o模型的輔助下,由人工標注員構建問題和答案對。

具體而言,研究者將wikipedia詞條通過聚類的方法進行合并,劃分為多個不同的類別,并在同一個類別中使用不同的詞條(包含圖文)進行組合。經過InternLM-Chat-20B清洗并去除無用信息之后,交給GPT-4o進行對話生成。生成的基于單詞條和多詞條的對話進行組合,從而構建具有長上下文的多圖多輪對話。

生成的對話以的格式標記圖像位置,使用者可以將不同的多圖多輪對話進一步組合,從而構建所需長度的對話。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實
MMDU和MMDU-45k數據生成pipeline

MMDU Benchmark包含的問答最長擁有18k的圖像+文本tokens、20幅圖像及27輪對話,其規模是以往同類型benchmark的至少五倍,為當前的LVLMs提出了新的挑戰。MMDU-45k包含的最長對話數據擁有超17k的圖像+文本tokens。

45k的多輪對話共包含超過410k的問答,能夠顯著提升LVLMs在長上下文理解,多圖多輪對話等方面的能力。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

受到利用強大的LLMs作為評判的NLP研究的啟發,MMDU的研究員們開發了一個使用GPT-4o進行模型性能評估的評估流程。

具體來說,模型在MMDU Benchmark上生成輸出后,GPT-4o將根據多個維度評估這些輸出結果,并將它們與參考答案進行比較。

為確保全面和細致的評估,MMDU確定了六個評估維度:創造力、豐富度、視覺感知、邏輯連貫性、答案準確性和圖像關系理解。為了引導GPT-4o提供平衡和公正的評估,每個維度都有精心制定的評估提示。

每個維度的評分范圍為10分,分為五個區間(0-2、2-4…8-10),每個區間都設定了相應的評判標準。GPT-4o遵循這些標準進行評判過程,并為每個維度提供最終分數。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

MMDU的評估流程中,使用GPT-4o作為評判,根據參考答案給出總體分數。在每次評估中,GPT-4o將同時參考模型的答案和參考答案。它將為每個評估標準(用藍色表示)提供相應的分數(用綠色表示),并最終以淺橙色總結結果。

通過對15個具有代表性的開源和閉源LVLMs進行深入分析,研究人員發現開源LVLMs(如LLaVa)由于缺乏足夠的對話指令微調數據,相比閉源系統(如GPT-4V)存在較大差距。研究表明,通過對開源LVLMs在MMDU-45k數據集上進行finetune,則可以顯著縮小這一差距,finetune后的模型能夠生成更長、更精確的對話,同時對于圖文交錯的多圖理解能力有了顯著的提升。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實
評估不同LVLMs在MMDU上的表現

團隊報告了以下指標:創造力(C)、豐富度(R)、視覺感知(VP)、邏輯連貫性(LC)、答案準確性(AA)、圖像關系理解(IRU),以及平均(Avg.)結果。

此外,經過MMDU-45k微調之后的模型,在現有基準測試上表現也有所提升(MMStar: +1.1%,MathVista: +1.5%,ChartQA: +1.2%)。這一結果說明,MMDU-45k能夠在各種圖像文本相關的任務上提升LVLMs的能力。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實
在LVLM監督微調(SFT)階段添加MMDU-45k數據的優勢。

表中報告了LLaVa和InternLM-XC2在MMDU和現有的代表性基準測試上的表現,包括MMB(MMBench-Dev-EN)、MMMU(MMMU-Val)、MMStar 、MathVista、AI2D、HallBench(HallusionBench)、MMVet 以及ChartQA。每個部分中的最佳和次佳結果分別用綠色和紅色標記。

在多圖多輪問答及普通單圖問答情境下,經過MMDU-45k微調的模型都有顯著的性能提升。這一性能提升首先表現在對圖像內容的識別上,相比微調前的LVLMs,微調之后的模型能夠更加準確的同時理解多張圖像的主要內容,圖像的順序,以及圖像之間的關系。此外,微調之后的模型能夠生成更為詳實和豐富的輸出,并能夠輕松應對具有超長上下文長度的圖文對話情景。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

InternLM-Xcomposer2在MMDU-45k數據集上finetune前后的表現。錯誤或幻覺描述在展示中用紅色標記,詳細且準確的描述則用綠色標記。

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
久久伊99综合婷婷久久伊| 亚洲一区二区欧美日韩| 中文字幕免费高清视频| 日韩中文字幕视频| 国产第100页| 欧美日韩国产免费| 视频在线观看免费高清| 欧美日韩精品在线观看| 国产伦精品一区二区三区| 欧美人妻一区二区| 蜜桃麻豆91| 中文字幕一区二区三区乱码在线 | 日本乱人伦a精品| 少妇欧美激情一区二区三区| 亚洲大胆人体在线| av图片在线观看| 性欧美在线视频| 激情伦成人综合小说| 日韩一卡二卡三卡国产欧美| 中文字幕一区二区三区精品| www.亚洲男人天堂| 一区二区视频免费观看| av日韩免费电影| 欧美视频久久久| 久久久久久久网站| 国产91在线看| 中文字幕有码在线播放| 日韩精品在线观看一区二区| 九九九免费视频| 欧美午夜美女看片| 永久av免费网站| 欧美成人激情免费网| 国产精品久久久久久久久毛片 | 色婷婷综合激情| www.69av| 日韩精品在线视频| 国产在线一区观看| 亚洲精品视频三区| 色综合五月天导航| 欧美第一页浮力影院| 国产成人一区二区三区| 国产情侣自拍av| 在线播放一区二区三区| 在线看的黄色网址| 亚洲最新在线观看| 欧美 丝袜 自拍 制服 另类| 91老师国产黑色丝袜在线| 国产在线精品播放| 久久久久久9999| 中文字幕一区二区人妻| 午夜剧场免费在线观看| 国产xxxxxxxxx| 最新av在线免费观看| 日韩三级成人av网| 亚洲人在线观看视频| 久久五月天婷婷| 国产女人18水真多18精品一级做| 三级影片在线看| 久久久精品网站| 日本久久久久久久久久| 午夜视频在线观看一区| 可以免费在线看黄的网站| 欧美精品777| 蜜臀av性久久久久蜜臀aⅴ| 国内精品国语自产拍在线观看| 亚洲视频免费在线观看| 丰满人妻一区二区三区免费视频| 国产无码精品视频| 性高潮免费视频| 男女视频网站在线观看| 日本91av在线播放| 国产欧美日韩视频在线观看| 亚洲欧美日本一区二区三区| 久久夜色精品一区| 精品自拍偷拍视频| 欧美激情网友自拍| 久久精品视频9| 亚洲视频在线观看视频| 日韩成人免费观看| 国产精品久久久久9999爆乳| 午夜精品在线视频| 一区二区中文字幕在线| 在线观看中文字幕2021| 欧美精品一本久久男人的天堂| 国产老头老太做爰视频| 久久亚洲国产精品| 美国一级片在线观看| 欧美成人午夜影院| 日韩永久免费视频| 视频在线一区二区三区| 亚洲精品第一国产综合野| 亚洲 国产 图片| 精品88久久久久88久久久| 国产无人区码熟妇毛片多| 欧美激情精品久久久久久| 久草资源在线视频| 国产精品久久久久9999| 97精品久久人人爽人人爽| 国产成一区二区| 国产同性人妖ts口直男| 国产精品video| 视频一区二区中文字幕| 亚洲国产一区二区精品视频 | 欧美午夜www高清视频| 30一40一50老女人毛片| 欧美激情二区三区| 日韩va亚洲va欧美va久久| 国产精品成人v| 国产麻豆精品theporn| 日韩欧美一区二区三区四区| 亚洲一区在线观看免费| 老司机精品免费视频| 日韩精品在线观| 老司机精品导航| 中文字幕一区综合| 亚洲午夜免费福利视频| 精品少妇一二三区| 国产伦精品一区二区三区精品视频| 成人网在线免费视频| 大陆av在线播放| 欧美放荡的少妇| 亚洲风情第一页| 亚洲无吗一区二区三区| 久久久极品av| 成人一区二区视频| 精品手机在线视频| 国产精品无码专区在线观看| 一区二区三区精品在线| 中国特级黄色大片| 国产精品爱久久久久久久| 成人av在线播放网址| xfplay精品久久| 日韩欧美在线一区二区| 天天爱天天干天天操| 婷婷丁香激情网| 国产精品视频免费在线| 久草国产在线观看| 久久综合毛片| 丝袜美腿精品国产二区| 亚洲视频在线观看一区| 国产v片在线观看| 久久久久久久激情| 日韩电影视频免费| 国产色一区二区| 成年人视频免费| 日本成人在线免费观看| 川上优av一区二区线观看| 91精品蜜臀在线一区尤物| 狠狠狠色丁香婷婷综合激情| 免费视频网站www| 99草草国产熟女视频在线| 亚洲a成v人在线观看| 精品亚洲精品福利线在观看| 亚洲美女久久久| 欧美日韩一级视频| 亚洲影视在线观看| 午夜视频一区二区| 欧美午夜精品久久久久久久| 亚洲伦在线观看| 日韩激情视频在线观看| 国产三级三级三级看三级| 日本欧美中文字幕| 日韩精品在线免费观看| 亚洲韩国精品一区| 国产精品亚洲一区二区三区在线| 日本一区二区免费在线观看| 午夜福利三级理论电影 | 成人三级视频在线播放| 国产精品制服诱惑| 欧洲中文字幕国产精品| 伊人成人开心激情综合网| 欧洲亚洲精品在线| 国产精品国产成人国产三级| 久久精品国产一区二区三区免费看 | 国产欧美精品在线播放| 中文字幕亚洲天堂| 91精品国产高清一区二区三区| 夜夜嗨av一区二区三区中文字幕| 成人免费视频视频| 久久99国产精品久久99| 久久经典综合| 乱精品一区字幕二区| 国产剧情久久久| 中文字幕日本人妻久久久免费| 免费观看一级视频| 欧美成人综合色| 美国一级片在线观看| 免费一级黄色录像| 变态另类ts人妖一区二区| 性高潮久久久久久久| 男人的天堂影院| 91精品国产高清91久久久久久 | 欧美在线播放视频| 九九热这里只有在线精品视| 亚洲欧美另类自拍| 亚洲日本aⅴ片在线观看香蕉| 日韩欧美一区在线观看| 欧美一区二区免费观在线| 欧美男男青年gay1069videost | 国产精品羞羞答答| 国产精品日韩在线一区| 国产精品久久久久免费a∨| 欧美在线www| 琪琪第一精品导航| 国产999精品久久久| 国产啪精品视频网站| 粉嫩精品一区二区三区在线观看 | 久久综合亚州| 韩国av一区二区三区在线观看| 国产在线不卡一区| 成人小视频免费观看| 中文字幕成人网| 午夜精品久久久久久久久久久 | 岳乳丰满一区二区三区| 久久99久久久久久久久久久| 夜夜嗨av一区二区三区中文字幕| 欧美一区二区在线播放| 欧美成人一区在线| 91亚洲永久免费精品| 91黄色在线看| 国产性猛交xx乱| 亚洲一区精品在线观看| 国产精品一二三四五| 国产精品二区一区二区aⅴ污介绍| 亚洲成人自拍偷拍| 亚洲高清一二三区| 亚洲精品日产aⅴ| 中文字幕欧美人妻精品一区| 夜夜夜夜夜夜操| 超碰在线97免费| 女教师高潮黄又色视频| 午夜黄色福利视频| 91成人国产综合久久精品| 免费视频一二三区| 中文字幕超碰在线| 一区二区的视频| 日韩精品视频网| 99久久国产免费| 国产成人精品白浆久久69| 黑人巨大精品欧美一区| 无码av免费一区二区三区试看| 欧美精品一区在线观看| 国产精品亚洲激情| 日韩人妻精品无码一区二区三区| 91在线无精精品白丝| 人妻与黑人一区二区三区| 日本一区二区成人在线| 亚洲精品国精品久久99热 | 美女三级黄色片| 欧美在线 | 亚洲| 亚洲欧美色综合| www日韩欧美| 大桥未久一区二区| 亚洲性猛交xxxx乱大交| 黄色片网站免费在线观看| 亚洲免费在线观看| 日韩中文字幕在线观看| 欧美日韩精品免费看| 亚洲一区二区三区四区av| 国产美女明星三级做爰| 国产女同互慰高潮91漫画| 日韩精品中文字幕久久臀| 欧美精品一区二区三区蜜桃视频| 夜夜嗨av色综合久久久综合网 | 国产最新精品免费| 最新日韩av在线| 亚洲午夜在线电影| 欧美二区三区91| 亚洲欧美成人在线| 国产在线一区二| 欧美大波大乳巨大乳| 美女视频黄 久久| 欧美一区在线视频| 先锋影音亚洲资源| 欧美videossex极品| 一区二区在线电影| 国产v综合v亚洲欧美久久| 久久久久久久久久一区二区| 午夜小视频在线播放| 欧美成人一区二区三区在线观看| 久久久久久久久久码影片| 欧美精品一区二区蜜桃| 国产精品美女一区二区| 91精品国产电影| 少妇精品无码一区二区三区| 国产精品18久久久久久久久| 三级精品视频久久久久| 欧美日韩在线观看不卡| 粉嫩嫩av羞羞动漫久久久| 久久99亚洲精品| 美女被到爽高潮视频| 亚洲人成7777| 国产一区二区高清不卡| 在线观看免费高清视频| 亚洲精品一区二区三区蜜桃下载| 国产亚洲天堂网| 久久激五月天综合精品| 欧美激情xxxx| 国产在视频线精品视频| 精品久久中文字幕久久av| 精品久久久久久中文字幕动漫| 日韩av一区二区在线播放| 欧美在线制服丝袜| 欧美国产视频一区| 蜜臀91精品一区二区三区| 欧美激情乱人伦一区| 成人精品一二三区| 91极品美女在线| 在线无限看免费粉色视频| a级片在线免费看| 这里只有精品在线播放| 中文字幕影片免费在线观看| 91精品在线麻豆| 久青草视频在线播放| 精品一区二区三区视频在线观看| 中文字幕日韩免费视频| yjizz视频| 一区二区三区日韩| 日本公妇乱淫免费视频一区三区| 成 人片 黄 色 大 片| 久久久久久18| 草久视频在线观看| 色偷偷av一区二区三区| 精品一区二区6| 91精品蜜臀在线一区尤物| 三上悠亚av一区二区三区| 国产日产精品1区| 深夜福利成人| 国产成人日日夜夜| 成人在线免费观看一区| 亚洲爱情岛论坛永久| 欧美黑人性猛交| 久久久久久久久影院| 91精品国产高清| 久久国产美女视频| 久久久噜噜噜久久中文字幕色伊伊| 日韩精品影音先锋| 亚洲看片网站| 中文字幕一区二区人妻| 在线观看亚洲专区| 国产又黄又爽免费视频| 久久久精品人体av艺术| bt天堂新版中文在线地址| 亚洲国产成人午夜在线一区 | 亚洲欧美综合一区二区| 欧美老年两性高潮| 翡翠波斯猫1977年美国| 国产污污视频在线观看| 日韩欧美一级二级三级久久久| av在线网址导航| 欧美一二三区精品| 亚洲国产激情一区二区三区| 国产精品国产三级国产普通话三级| 中文字幕国产传媒| 欧美不卡在线视频| 丁香六月婷婷综合| 97视频热人人精品| 欧美国产精品中文字幕| 尤物网站在线看| 亚洲片av在线| 日韩一级片免费看| 日本三级中文字幕在线观看| 午夜欧美2019年伦理| 老司机成人免费视频| 国产精品99久久久久久人 | 成年人在线观看视频免费| 欧美手机在线视频| 99精品在线播放| 欧美一级在线播放| 四虎影院在线免费播放| 视频直播国产精品| 精品少妇久久久| 蜜月aⅴ免费一区二区三区| 欧美三日本三级少妇99| 久久躁日日躁aaaaxxxx| 青青国产在线视频| 欧美大奶子在线| 精品人妻一区二区三区潮喷在线| 久久色精品视频| 精品国产xxx| 26uuu久久噜噜噜噜| 中文字幕人成人乱码亚洲电影| 久久久精品日本| 亚洲视频一区二区三区四区| 国产精品嫩草视频| 国产福利一区在线| 香蕉精品视频在线| 国产精品色噜噜| 日本不卡一区在线| 91精品国产欧美日韩| 妖精视频在线观看免费| 亚洲人成免费电影| 国产日韩欧美一区二区东京热| 日本久久亚洲电影| 琪琪一区二区三区| 最新欧美日韩亚洲| 亚洲激情网站免费观看| 国产精品密蕾丝袜| 亚洲成人精品电影在线观看| 日本韩国一区二区三区| 久久精品视频2| 天天想你在线观看完整版电影免费| 亚洲成人激情图| 五月婷婷丁香六月| 无码日韩人妻精品久久蜜桃| 日韩久久免费视频| 97人妻一区二区精品免费视频| 99热在线国产| www.一区二区| 日本wwww视频|