色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

多模態大模型的多語種文字理解能力還有很長的路要走,字節、華科聯合發布MTVQA Bench

期待后續多模態大模型的研究和發展更加關注多語種場景

MTVQA Bench團隊 投稿
量子位 | 公眾號 QbitAI

近期多模態大模型(MLLM)在視覺文本理解領域取得了顯著進展,比如開源模型InternVL 1.5、MiniCPM-Llama3-V 2.5、TextMonkey, 閉源模型GPT-4o、Claude等,甚至在某些方面展現了超越人類的能力。

然而,當前的評估主要集中在英文和中文的語言環境中,對于更具挑戰的多語種環境,研究還相對缺乏。在全球化的今天,多語言環境越來越多的出現在人們日常生活中,也給人工智能的發展帶來了很大的挑戰。

MTVQA(Multilingual Text-Centric Visual Question Answering)基準測試正是在這樣的背景下應運而生,專注于以多語言文字為中心的視覺問答,旨在填補現有評測基準在多語種視覺文本領域的空白。

MTVQA涵蓋了阿拉伯語、韓語、日語、泰語、越南語、俄語、法語、德語和意大利語等9種語言,收集整理了自然場景和文檔場景下的多語種富文本圖片,如菜單、路標、地圖、賬單、PPT、論文、圖表等。問答對都經過人類專家的精心標注,以確保視覺文本與問題及答案之間的高度一致性。

在MTVQA基準的測試結果顯示,無論是開源模型還是最先進的閉源模型如GPT-4o (Acc. 27.8%),準確率不到30%,開源的文檔類專家大模型表現也不盡如人意。

無論從哪方面來看,多語種文字理解能力都還有較大的提升空間。MTVQA重點關注除中英文以外廣泛使用的語言,希望能促進多語種文字理解能力的發展,將多模態大模型的成果普及到更多的國家和地區。

多模態大模型的多語種文字理解能力還有很長的路要走,字節、華科聯合發布MTVQA Bench

論文鏈接:arxiv.org/abs/2405.1198

項目鏈接:bytedance.github.io/MTV

多模態大模型的多語種文字理解能力還有很長的路要走,字節、華科聯合發布MTVQA Bench
圖1 MTVQA中不同語種和場景樣例展示

背景介紹

視覺文本理解能力是多模態大模型能力中的一個關鍵維度,現有的benchmark如DocVQA、TextVQA、STVQA等在GPT-4o、Gemini 、Internlm VL等先進的閉源和開源MLLMs的測評中發揮了重要作用,評估了多模態大模型在不同維度的視覺文本理解能力,但是他們都專注于中英文能力的測評,缺少一個能夠測評其他語種理解能力的benchmark。針對這些不足,字節和華科的研究者提出了MTVQA,首個全面測評多場景多語種視覺文本理解能力的benchmark。

MTVQA的構建過程

數據收集

測試集包括1220張泛文檔類的圖片和876張自然場景的圖片,數據來源可分為三部分:
(1) 網絡收集的圖片,如PPT、paper、logo等。
(2) 實地采集拍攝圖片,包括各種場景,時間跨度2023年3月到2024年3月。
(3) 現有公開數據,從ICDAR MLT19的公開圖片中采樣了一些具有代表性的場景文本圖片。

數據標注

所有QA數據均為經過培訓的母語人士進行標注,并進行多輪交叉驗證,確保問題的豐富性和答案的準確性。
標注規則:

  • 問題必須和圖片中的文字內容有關
  • 每張圖片包括3個可以直接問答的問題和2個需要進行一定推理的問題
  • 答案盡可能和圖片中的文字保持一致
  • 答案盡可能簡短,不重復問題的內容
多模態大模型的多語種文字理解能力還有很長的路要走,字節、華科聯合發布MTVQA Bench
圖二 MTVQA 數據標注流程

交叉評估和修改:

  • 評估問題和圖片中文本內容的相關性
  • 評估答案的準確性和完整性
  • 道德評估,判斷是否符合人類道德規范

數據集概覽

多模態大模型的多語種文字理解能力還有很長的路要走,字節、華科聯合發布MTVQA Bench
圖三 MTVQA涵蓋的豐富場景以及不同語種的QA數量
多模態大模型的多語種文字理解能力還有很長的路要走,字節、華科聯合發布MTVQA Bench
圖4 Word Cloud

MLLMs在MTVQA Bench上的表現

在MTVQA上對19個先進的MLLM進行來測評,包括開源和閉源模型,測評結果如下:

多模態大模型的多語種文字理解能力還有很長的路要走,字節、華科聯合發布MTVQA Bench

實驗結果發現:

多語種文字理解現階段任然是非常有挑戰性的任務。盡管GPT-4o在大部分語種和總體成績上取得了第一名的成績,但是平均準確率只有27.8,相比于多模態大模型的英文理解能力,差距明顯,更別談和人類的差距了。

開源模型和閉源模型存在較大的差距。最優的開源模型是MiniCPM-V 2.5,取得了18.9%的成績,但距離頂尖的閉源模型如QwenVL Max, Gemini Ultra, Claude3 Opus, GPT-4o等還比較遠。

以文字理解為中心的多模態大模型并沒有明顯的優勢。研究者選取了最近的3個以視覺文字理解為中心的MLLM,mPLUG-DocOwl 1.5,TextMonkey,TextSquare,發現最優的TextSquare相比通用MLLM MiniCPM-V 2.5并沒有優勢(15.6 vs. 18.9)。

不同語種的理解能力差距明顯。拉丁類的語種如意大利語、德語、法語的表現遠好于非拉丁類語種如日語、韓語、俄語。這應該是由于拉丁類語種在視覺和語義上都和英文更相似。

多模態大模型的多語種文字理解能力還有很長的路要走,字節、華科聯合發布MTVQA Bench

總結

來自字節跳動和華中科大的研究者們針對多語種視覺文本理解任務提出了新的測評基準MTVQA Bench,并對多模態大模型的表現進行了測評和分析。研究發現,多語種視覺理解任務難度很大,當前多模態大模型表現較差,距離人類的水平還有很長的路要走。研究者們期待后續多模態大模型的研究和發展更加關注多語種場景,擴大多模態大模型的應用范圍,使得更多國家和地區的人們能夠參與其中,共享人工智能帶來的便利

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
亚洲精品中文字幕乱码三区不卡| 中国美女黄色一级片| 亚洲在线免费看| 欧美日韩视频在线第一区| 无码国产精品一区二区色情男同| 国产视频精品视频| 一级特黄免费视频| 成人影视免费观看| 久草网视频在线观看| 日本丰满少妇裸体自慰| 久久久视频6r| 亚洲精品无码久久久久久久| 色黄视频免费看| 成人乱码一区二区三区| 成人夜色视频网站在线观看| 亚洲人成在线观看一区二区| 日韩电影中文字幕在线观看| 国产一区福利在线| 欧美视频裸体精品| 国模极品一区二区三区| 男人亚洲天堂网| 日韩一卡二卡在线| 久久―日本道色综合久久| 一区二区三区无码高清视频| 欧美极品色图| 日本亚洲一区二区三区| 亚洲欧美日本一区| www.毛片com| 国产探花精品一区二区| 国产av一区二区三区精品| 99热这里只有精品在线| 亚洲一区av在线| 亚洲精品一二区| 久久九九精品99国产精品| 欧美一区二区三区……| 亚洲国产精品久久精品怡红院| 日本乱人伦a精品| 神马影院一区二区三区| 在线看无码的免费网站| 日本中文在线视频| av网站免费线看精品| 精品视频在线免费看| 色av中文字幕一区| 97久久精品国产| 欧美xxxx黑人又粗又长密月 | 91theporn国产在线观看| 国产丝袜视频在线观看| 亚洲精选视频在线| 国产精品久久久久久久久久久久久久 | 杨幂一区二区国产精品| 欧美人成在线观看| 91久久精品国产91性色69| 欧美一级搡bbbb搡bbbb| 日日摸日日碰夜夜爽av| 久久一区国产| 色天天综合色天天久久| 欧美激情在线观看| 国产一区视频观看| 亚洲自拍第三页| 中文字幕一区二区三区手机版| 麻豆精品在线观看| caoporen国产精品视频| 色婷婷精品大视频在线蜜桃视频| 国产日韩第一页| 国产精彩视频在线| 国产精品白丝jk黑袜喷水| 欧美日本乱大交xxxxx| 五月婷婷久久综合| 成人国产亚洲精品a区天堂华泰| 天天做天天干天天操| 91美女精品网站| www.日韩在线| 欧美日韩在线三级| 国产91露脸中文字幕在线| 国产人妻人伦精品| 日本不卡在线观看视频| 国产成人免费看| 欧美美女网站色| 久久6免费高清热精品| 中文字幕久精品免| 在线观看精品国产| 日本一区二区网站| 国产精品激情偷乱一区二区∴| 久久精品欧美视频| 性欧美13一14内谢| 欧美日韩1区2区| 潘金莲一级淫片aaaaa| 国产欧美一区二区精品性色超碰| 国产剧情久久久久久| 熟妇人妻久久中文字幕| 97国产成人无码精品久久久| 天天综合日日夜夜精品| 国产精品久久久久久久久久久久冷 | 人妻丰满熟妇av无码久久洗澡 | 三区精品视频| 国产一区二区在线视频聊天| 在线视频欧美日韩| 亚洲熟女www一区二区三区| 欧美精品一区二区三区久久久| 51国偷自产一区二区三区的来源| 免费毛片一区二区三区| 国产精品色在线观看| 欧美激情2020午夜免费观看| 国产xxxx振车| 在线观看国产小视频| 精品久久久久久中文字幕| 91精品在线一区二区| 欧美成人精品在线视频| 麻豆av一区二区| 国产精品久久久久久9999| 国产suv精品一区二区三区| 欧美极品欧美精品欧美视频| 尤物av无码色av无码| 石原莉奈在线亚洲二区| 欧美久久精品午夜青青大伊人| 欧美精品一二三四区| 国产精品高潮呻吟久久av黑人| 国产浮力第一页| 成人激情综合网| 国产美女视频91| 国产日韩一区二区三区| 日本天堂网在线观看| 亚洲蜜臀av乱码久久精品| 国产欧美欧洲在线观看| 久久久久久久久97| 亚洲成人黄色在线| 99久久国产宗和精品1上映| 色欲一区二区三区精品a片| 国产一区亚洲一区| 欧美一级在线免费| 国产精品久久久久久久小唯西川| av大全在线观看| 日韩电视剧在线观看免费网站| 国产美女主播在线播放| 亚洲精品免费在线观看视频| 深夜福利国产精品| www五月婷婷| 成人欧美一区二区三区在线观看| 国产宾馆实践打屁股91| av日韩在线看| 亚洲你懂的在线视频| 久久国产精品-国产精品| 成人a v视频| 欧美一卡2卡三卡4卡5免费| 色爽爽爽爽爽爽爽爽| 国产精品一区二区久激情瑜伽| 国产成人高清激情视频在线观看| 蜜桃视频一区二区在线观看| 人人爽人人爽人人片av| 亚洲一区二区欧美日韩| 欧美在线视频一区二区| 中文字幕亚洲精品一区| 亚洲欧美一区二区三区四区 | 日日噜噜噜夜夜爽亚洲精品 | 黄色国产小视频| 午夜精品影院在线观看| 日本精品一二三| 欧美成人精品3d动漫h| 中文字幕 欧美日韩| 91视频精品在这里| 亚洲一区二区三区视频播放| 中文字幕日韩国产| 欧美人与性动交a欧美精品| av2014天堂网| 国产成人在线观看| 欧美激情精品久久久| 亚洲综合123| av网站免费线看精品| 欧美二区三区| 国产91精品免费| 亚洲wwwav| 日韩成人午夜电影| 亚洲va久久久噜噜噜久久天堂| 日韩综合一区二区| 看高清中日韩色视频| 美女诱惑一区二区| 国产精品成人免费视频| 免费一级a毛片| 超薄丝袜一区二区| av动漫在线播放| 少妇一区二区三区四区| 国产精品久久77777| 国产精品夜夜嗨| 九九热在线免费| 亚洲亚洲精品在线观看| 中文字幕亚洲影院| 欧美疯狂性受xxxxx喷水图片| 欧美亚洲爱爱另类综合| 久久精品夜夜夜夜久久| 久久久精品在线视频| 欧美精品v日韩精品v韩国精品v| 国产强被迫伦姧在线观看无码| 日本精品福利视频| 国产视频久久久久| www.看毛片| 黄色免费视频大全| 午夜视频一区在线观看| 亚洲国产日韩在线一区| 欧美麻豆精品久久久久久| 免费网站看av| 国产精品美女www| 美国三级日本三级久久99| 日本不卡高字幕在线2019| 国产女主播喷水视频在线观看| 欧美在线免费观看| 久久精品人人爽人人爽| 亚洲一区二区在线视频观看| 日本精品一级二级| 国产在视频线精品视频| 欧美精品在线视频观看| av无码av天天av天天爽| 九色91av视频| 久久99国产精品久久99| 久久婷婷综合色| 98视频在线噜噜噜国产| 国产欧美日本一区二区三区| 手机在线中文字幕| 国产精品无码专区在线观看| 好吊视频一区二区三区| 狠狠爱一区二区三区| 日本一区免费视频| 蜜臀一区二区三区精品免费视频| 欧美成人video| 成人在线观看免费完整| 亚洲精品一区久久久久久| √资源天堂中文在线| 日韩av在线一区二区三区| 日韩欧美在线123| 99久久精品国产色欲| 色一情一乱一伦一区二区三区丨| 亚洲国产精品嫩草影院| 精品自拍偷拍视频| 日韩欧美的一区| 进去里视频在线观看| 中文字幕av一区中文字幕天堂| 国产肥老妇视频| 午夜剧场在线免费观看| 2019中文在线观看| 欧美日韩在线一区二区| 亚洲精品字幕在线| 亚洲五月激情网| 上原亚衣av一区二区三区| 蜜桃传媒麻豆第一区在线观看| 综合久久国产| 欧美成人vps| www.久久久久久| 91免费黄视频| 亚洲特级片在线| 7788色淫网站小说| 久久久中精品2020中文| 亚洲成人av一区二区| 国产一区二区三区四区视频 | 欧美激情精品久久久久久小说| 色婷婷精品大在线视频| 天天操天天干天天操天天干| 成人中心免费视频| 婷婷丁香久久五月婷婷| 国产视频在线观看视频| 亚欧精品在线视频| 亚洲自拍偷拍福利| 日韩一区中文字幕| 精品国产综合久久| 一本一本大道香蕉久在线精品| 国产视频www| 丰满人妻一区二区三区53号| 3atv在线一区二区三区| 青娱乐av在线| 免费精品视频一区二区三区| 亚洲女人天堂视频| 亚洲人成在线观看一区二区| 国产av精国产传媒| 毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 红桃av永久久久| 国产精品偷伦视频免费观看了 | 精品福利樱桃av导航| www.五月婷婷| 99九九99九九九99九他书对| 亚洲香蕉成人av网站在线观看| 91在线视频免费播放| 亚洲aa中文字幕| 色网站国产精品| 永久免费未视频| eeuss一区二区三区| 久久综合国产精品| 秋霞午夜鲁丝一区二区| 欧美人在线观看| 国产宾馆实践打屁股91| 看全色黄大色大片| 欧美日韩亚州综合| 免费观看一级特黄欧美大片| 国产精品密蕾丝袜| 国产精品区免费视频| 日韩免费高清av| 五月婷婷丁香花| 韩国三级hd中文字幕| wwwxx欧美| 日韩一级在线观看| 中文字幕一区二区三区人妻四季 | 在线观看国产福利| 国内视频一区二区| 日韩美女视频在线| 国产精品久线观看视频| 九一九一国产精品| 国产伦精品一区二区三区视频网站| ww国产内射精品后入国产| 人人爽久久涩噜噜噜网站| 欧美精品一区二区久久婷婷 | 亚洲色图欧洲色图婷婷| 97精品人妻一区二区三区在线 | 国产成人8x视频一区二区| 久久99热99| 日本激情一区二区| av免费观看在线| 一级特黄aa大片| 久草视频精品在线| 亚洲熟妇无码av| 国产精品免费入口| 国产伦精品一区二区三区视频孕妇| 亚洲成人精品视频在线观看| 国产日本欧美一区二区| 亚洲国产精品二区| 日本人亚洲人jjzzjjz| 蜜臀av色欲a片无码精品一区| 国产精品亚发布| 国产日韩av一区| 国产精品丝袜一区二区| 美女被啪啪一区二区| 欧美在线免费观看亚洲| 久久久亚洲一区| 日韩一区二区三区视频在线 | 久久永久免费视频| 女人另类性混交zo| 97在线免费观看视频| 综合网在线视频| 久久国产视频播放| 成人免费视频91| 午夜精品久久久久久久99热浪潮| 国产视频不卡一区| 国产女同在线观看| 亚洲小说欧美另类激情| 亚洲天堂影视av| 国产亚洲精品aa| 无码免费一区二区三区| 91国产精品视频在线观看| 欧美另类在线播放| 国产精品人妖ts系列视频| 国产精品第一页在线观看| 一本大道东京热无码aⅴ| 日韩在线视频观看| 自拍偷拍国产精品| 91国在线视频| 老熟女高潮一区二区三区| 国产成人精品免费视频大全最热| 日韩欧美国产综合在线一区二区三区| 精品在线亚洲视频| 亚洲黄网在线观看| 麻豆传传媒久久久爱| 99在线免费观看视频| 久久精品国产2020观看福利| 婷婷综合在线观看| 97精品久久人人爽人人爽| 男女啪啪免费视频网站| 2019日本中文字幕| 色狠狠综合天天综合综合| 日韩成人精品在线| 国产传媒国产传媒| 神马午夜伦理影院| 日本午夜人人精品| 欧美精品在欧美一区二区少妇| 国产jizzjizz一区二区| 一区二区三区午夜| 公肉吊粗大爽色翁浪妇视频| 天天躁夜夜躁狠狠是什么心态| 久久免费视频精品| 国产成人无码精品亚洲| 性做久久久久久久久久| 成人国产视频在线观看| www在线观看免费| 国产二级片在线观看| 污污网站免费看| 国产国语性生话播放| 一级片一级片一级片| 久久久久久久久久影视| 国产九九九视频| 日韩有码免费视频| 超碰网在线观看| www亚洲成人| 波多野结衣在线免费观看| av天堂一区二区| 欧美在线一级片| 91传媒理伦片在线观看| 亚洲色图欧美日韩| 手机免费看av网站| 性久久久久久久久久久久久久| 免费一级黄色录像| 日本视频免费观看| 99久久国产免费| 黄色大全在线观看| 涩涩视频在线观看| 国产精品丝袜黑色高跟鞋| 久久综合狠狠| 高清在线成人网| 日本91福利区| 天天躁日日躁狠狠躁喷水| 国产一区二区影院| 国产精品免费视频观看| 国产精品不卡在线| 7777女厕盗摄久久久| 欧美人在线观看| 欧美精品一区三区在线观看|