色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

阿里7B多模態文檔理解大模型拿下新SOTA|開源

各種復雜結構圖一鍵提取解析

mPLUG團隊 投稿

量子位 | 公眾號 QbitAI

多模態文檔理解能力新SOTA!

阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl 1.5,針對高分辨率圖片文字識別、通用文檔結構理解、指令遵循、外部知識引入四大挑戰,提出了一系列解決方案。

話不多說,先來看效果。

復雜結構的圖表一鍵識別轉換為Markdown格式:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

不同樣式的圖表都可以:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

更細節的文字識別和定位也能輕松搞定:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

還能對文檔理解給出詳細解釋:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

要知道,“文檔理解”目前是大語言模型實現落地的一個重要場景,市面上有很多輔助文檔閱讀的產品,有的主要通過OCR系統進行文字識別,配合LLM進行文字理解可以達到不錯的文檔理解能力。

不過,由于文檔圖片類別多樣、文字豐富且排版復雜,難以實現圖表、信息圖、網頁等結構復雜圖片的通用理解。

當前爆火的多模態大模型QwenVL-Max、Gemini, Claude3、GPT4V都具備很強的文檔圖片理解能力,然而開源模型在這個方向上的進展緩慢。

而阿里新研究mPLUG-DocOwl 1.5在10個文檔理解基準上拿下SOTA,5個數據集上提升超過10個點,部分數據集上超過智譜17.3B的CogAgent,在DocVQA上達到82.2的效果。

阿里7B多模態文檔理解大模型拿下新SOTA|開源

除了具備基準上簡單回答的能力,通過少量“詳細解釋”(reasoning)數據的微調,DocOwl 1.5-Chat也能具備多模態文檔領域詳細解釋的能力,具有很大的應用潛力。

阿里mPLUG團隊從2023年7月份開始投入多模態文檔理解的研究,陸續發布了mPLUG-DocOwl、 UReader、mPLUG-PaperOwl、mPLUG-DocOwl 1.5,開源了一系列文檔理解大模型和訓練數據。

本文從最新工作mPLUG-DocOwl 1.5出發,剖析“多模態文檔理解”領域的關鍵挑戰和有效解決方案。

挑戰一:高分辨率圖片文字識別

區分于一般圖片,文檔圖片的特點在于形狀大小多樣化,其可以包括A4大小的文檔圖、短而寬的表格圖、長而窄的手機網頁截圖以及隨手拍攝的場景圖等等,分辨率的分布十分廣泛。

主流的多模態大模型編碼圖片時,往往直接縮放圖片的大小,例如mPLUG-Owl2和QwenVL縮放到448×448,LLaVA 1.5縮放到336×336。

簡單的縮放文檔圖片會導致圖片中的文字模糊形變從而不可辨認。

為了處理文檔圖片,mPLUG-DocOwl 1.5延續了其前序工作UReader的切圖做法,模型結構如圖1所示:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖1:DocOwl 1.5模型結構圖

UReader最早提出在已有多模態大模型的基礎上,通過無參數的形狀適應切圖模塊(Shape-adaptive Cropping Module)得到一系列子圖,每張子圖通過低分辨率編碼器進行編碼,最后通過語言模型關聯子圖直接的語義。

該切圖策略可以最大程度利用已有通用視覺編碼器(例如CLIP ViT-14/L)的能力進行文檔理解,大大減少重新訓練高分辨率視覺編碼器的代價。形狀適應的切圖模塊如圖2所示:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖2:形狀適應的切圖模塊。

挑戰二:通用文檔結構理解

對于不依賴OCR系統的文檔理解來說,識別文字是基本能力,要實現文檔內容的語義理解、結構理解十分重要,例如理解表格內容需要理解表頭和行列的對應關系,理解圖表需要理解線圖、柱狀圖、餅圖等多樣化結構,理解合同需要理解日期署名等多樣化的鍵值對。

mPLUG-DocOwl 1.5著力于解決通用文檔等結構理解能力,通過模型結構的優化和訓練任務的增強實現了顯著更強的通用文檔理解能力。

結構方面,如圖1所示,mPLUG-DocOwl 1.5放棄了mPLUG-Owl/mPLUG-Owl2中Abstractor的視覺語言連接模塊,采用基于“卷積+全連接層”的H-Reducer進行特征聚合以及特征對齊

相比于基于learnable queries的Abstractor,H-Reducer保留了視覺特征之間的相對位置關系,更好的將文檔結構信息傳遞給語言模型。

相比于保留視覺序列長度的MLP,H-Reducer通過卷積大幅縮減了視覺特征數量,使得LLM可以更高效地理解高分辨率文檔圖片。

考慮到大部分文檔圖片中文字優先水平排布,水平方向的文字語義具有連貫性,H-Reducer中采用1×4的卷積形狀和步長。論文中,作者通過充分的對比實驗證明了H-Reducer在結構理解方面的優越性以及1×4是更通用的聚合形狀。

訓練任務方面,mPLUG-DocOwl 1.5為所有類型的圖片設計了統一結構學習(Unified Structure Learning)任務,如圖3所示。

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖3:統一結構學習

Unified Structure Learning既包括了全局的圖片文字解析,又包含了多粒度的文字識別和定位。

在全局圖片文字解析任務中,對于文檔圖片和網頁圖片,采用空格和換行的形式可以最通用地表示文字的結構;對于表格,作者在Markdown語法的基礎上引入表示多行多列的特殊字符,兼顧了表格表示的簡潔性和通用性;對于圖表,考慮到圖表是表格數據的可視化呈現,作者同樣采用Markdown形式的表格作為圖表的解析目標;對于自然圖,語義描述和場景文字同等重要,因此采用圖片描述拼接場景文字的形式作為解析目標。

在“文字識別和定位”任務中,為了更貼合文檔圖片理解,作者設計了單詞、詞組、行、塊四種粒度的文字識別和定位,bounding box采用離散化的整數數字表示,范圍0-999。

為了支持統一的結構學習,作者構建了一個全面的訓練集DocStruct4M,涵蓋了文檔/網頁、表格、圖表、自然圖等不同類型的圖片。

經過統一結構學習,DocOwl 1.5具備多領域文檔圖片的結構化解析和文字定位能力。

阿里7B多模態文檔理解大模型拿下新SOTA|開源
阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖4: 結構化文字解析

如圖4和圖5所示:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖5: 多粒度文字識別和定位

挑戰三:指令遵循

“指令遵循”(Instruction Following)要求模型基于基礎的文檔理解能力,根據用戶的指令執行不同的任務,例如信息抽取、問答、圖片描述等。

延續mPLUG-DocOwl的做法,DocOwl 1.5將多個下游任務統一為指令問答的形式,在統一的結構學習之后,通過多任務聯合訓練的形式得到一個文檔領域的通用模型(generalist)。

此外,為了使得模型具備詳細解釋的能力,mPLUG-DocOwl曾嘗試引入純文本指令微調數據進行聯合訓練,有一定效果但并不理想。

在DocOwl 1.5中,作者基于下游任務的問題,通過GPT3.5以及GPT4V構建了少量的詳細解釋數據(DocReason25K)。

通過聯合文檔下游任務和DocReason25K進行訓練,DocOwl 1.5-Chat既可以在基準上實現更優的效果:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖6:文檔理解Benchmark評測

又能給出詳細的解釋:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖7:文檔理解詳細解釋

挑戰四:外部知識引入

文檔圖片由于信息的豐富性,進行理解的時候往往需要額外的知識引入,例如特殊領域的專業名詞及其含義等等。

為了研究如何引入外部知識進行更好的文檔理解,mPLUG團隊著手于論文領域提出了mPLUG-PaperOwl,構建了一個高質量論文圖表分析數據集M-Paper,涉及447k的高清論文圖表。

該數據中為論文中的圖表提供了上下文作為外部知識來源,并且設計了“要點”(outline)作為圖表分析的控制信號,幫助模型更好地把握用戶的意圖。

基于UReader,作者在M-Paper上微調得到mPLUG-PaperOwl,展現了初步的論文圖表分析能力,如圖8所示。

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖8:論文圖表分析

mPLUG-PaperOwl目前只是引入外部知識進文檔理解的初步嘗試,仍然面臨著領域局限性、知識來源單一等問題需要進一步解決。

總的來說,本文從最近發布的7B最強多模態文檔理解大模型mPLUG-DocOwl 1.5出發,總結了不依賴OCR的情況下,進行多模態文檔理解的關鍵四個關鍵挑戰(“高分辨率圖片文字識別”,“通用文檔結構理解”,“指令遵循”, “外部知識引入” )和阿里巴巴mPLUG團隊給出的解決方案。

盡管mPLUG-DocOwl 1.5大幅提升了開源模型的文檔理解表現,其距離閉源大模型以及現實需求仍然有較大差距,在自然場景中文字識別、數學計算、通用型等方面仍然有進步空間。

mPLUG團隊會進一步優化DocOwl的性能并進行開源,歡迎大家持續關注和友好討論!

GitHub鏈接:https://github.com/X-PLUG/mPLUG-DocOwl
論文鏈接:https://arxiv.org/abs/2403.12895

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
日韩一区二区精品葵司在线| 午夜精品一区二区在线观看的| 日韩av有码在线| 亚洲国产综合人成综合网站| 曰韩不卡视频| 国产午夜在线一区二区三区| 性做久久久久久久| 最好看的中文字幕久久| 国产精品欧美一级免费| 色av吧综合网| 日本高清一二三区| 中文字幕免费国产精品| 麻豆国产尤物av尤物在线观看 | 一级做a爰片久久毛片| 久久免费黄色| 精品盗摄一区二区三区| 国产精品久久久久久久久久久久| 精品无人乱码一区二区三区的优势| 激情婷婷综合网| 久久女同性恋中文字幕| 国产亚洲美女精品久久久| 欧美视频在线第一页| 国产人妖在线播放| 91福利免费视频| 精品久久久久久久一区二区蜜臀| 亚洲二区在线播放| 日韩亚洲在线观看| 少妇av片在线观看| 蜜臀国产一区二区三区在线播放| 91精品黄色| 麻豆久久久久久久| 国产91亚洲精品| 波多野结衣家庭教师视频| 中文字幕人妻一区二区三区视频| 亚洲成人三级在线| 69av成年福利视频| 日韩在线视频在线观看| 亚洲精品在线一区二区| 久草福利在线观看| 亚洲激情网站免费观看| 一区二区不卡在线观看| 日韩av一级大片| 色一情一区二区三区| 国产特黄大片aaaa毛片| 国产精品主播直播| 97av在线影院| 国产不卡精品视频| 国产手机视频在线观看| 色哦色哦哦色天天综合| 精品国产精品国产精品| 4p变态网欧美系列| 韩国av免费观看| 国产精品私人影院| 欧美激情第一页在线观看| 黄色片一区二区| 亚洲国产精品一区二区久久恐怖片| 国产精品亚洲美女av网站| 日韩在线一区二区三区四区| 日韩精品有码在线观看| 小毛片在线观看| 欧美日韩亚洲综合| 欧美成人综合网站| 国产在线视频你懂的| 欧美日韩高清区| 国产乱对白刺激视频不卡| 大又大又粗又硬又爽少妇毛片 | 97视频在线观看视频免费视频 | 六月丁香婷婷色狠狠久久| 精品一区二区电影| 中文字幕 视频一区| 亚洲夜晚福利在线观看| 久久中文字幕人妻| 亚洲精美色品网站| 久久久999国产| 亚洲第一天堂网| 水蜜桃亚洲精品| 中文字幕激情小说| 国产精品丝袜视频| 国产一区二区三区观看| 日韩av一级大片| 久久综合九色综合97婷婷| 亚洲精品成人久久| 日韩福利小视频| 欧美电视剧在线看免费| 91ts人妖另类精品系列| 精品国产一区a| 九色91在线视频| x88av在线| 中文字幕亚洲不卡| 99视频在线免费播放| 亚洲图片制服诱惑| 久草视频精品在线| 国产欧美亚洲精品| av一二三不卡影片| 日韩欧美国产综合一区| 国产又粗又猛又爽| 亚洲第一精品区| 久久久精品免费| 成人av电影免费在线播放| xxxx日本免费| 日韩欧美亚洲日产国| 91丨九色porny丨蝌蚪| 四虎4hu永久免费入口| 午夜视频一区二区| 福利视频第一页| 成人91视频| 国内成人免费视频| 亚洲精品成人久久久| 99福利在线观看| 成人av在线看| av一区二区三区免费| 日韩视频一区二区三区在线播放 | 国产麻豆a毛片| 久久精品中文字幕| 免费观看国产精品| 欧美大秀在线观看| 国产精品自拍第一页| 欧美激情欧美激情| 91亚洲欧美激情| 国产成一区二区| 国产欧美日韩成人| 国产日韩综合一区二区性色av| 国产成人无码www免费视频播放| 国产精品99导航| 色窝窝无码一区二区三区成人网站 | 久久久久久久电影| 天天成人综合网| 亚洲国产精品传媒在线观看| 18禁网站免费无遮挡无码中文 | 国产精品50p| 亚洲另类在线一区| 久久久精品高清| 欧美精品1区2区3区| 精品无人区无码乱码毛片国产 | 久久久久亚洲AV成人| 日韩一级黄色av| 国产又粗又黄视频| 成人黄色在线免费| 国产美女av一区二区三区| 色播亚洲视频在线观看| 久久精品欧美日韩精品| 丰满爆乳一区二区三区| 亚洲成人黄色影院| 北岛玲一区二区| 亚洲性av在线| 国产欧美日韩综合精品一区二区三区| 国产探花视频在线| 亚洲精品av在线| 欧美成人精品欧美一级乱黄| 久久久久成人精品| 香蕉久久国产av一区二区| 精品高清视频| 国产精品久久午夜夜伦鲁鲁| 午夜福利123| 精品偷拍一区二区三区在线看| www.国产成人| 91免费观看网站| 久久先锋资源网| 在线免费看v片| 亚洲精品中文字幕女同| 国产三级理论片| 国产v亚洲v天堂无码| 欧美极品少妇xxxxⅹ高跟鞋 | 亚洲第一色在线| 国产一级片av| 国产一区二区三区奇米久涩| 国产精品区一区二区三| 99精品一区二区三区无码吞精| 日韩禁在线播放| 午夜精品一区二区三| 亚洲欧美日产图| 欧美性黄网官网| 久久综合色综合| 亚洲综合视频1区| 国产精品成人网| 中文字幕伦理片| 日韩免费观看高清| 久久精品视频在线免费观看| 插我舔内射18免费视频| 久久久久久久久久婷婷| 粉嫩av一区二区三区| 国产精品自在自线| 亚洲最新av网址| 日韩电影在线一区二区| 成年网站在线免费观看| 日韩精品一区二区三区视频在线观看| 91肉色超薄丝袜脚交一区二区| 日韩一区二区三区资源| 欧美曰成人黄网| 免费黄色片视频| 亚洲 国产 欧美一区| 欧美亚洲国产怡红院影院| 午夜精品久久久久久久蜜桃| 日韩欧美一区二区三区四区| 欧美日韩国产色站一区二区三区| 中文无码av一区二区三区| 天堂资源在线亚洲视频| 91精品欧美一区二区三区综合在| 一区二区三区免费在线| 日韩国产小视频| 亚洲美女在线观看| 久久精品久久久精品美女| 浓精h攵女乱爱av| 九九热这里只有在线精品视| 99国产精品视频免费观看| 黄色国产在线观看| 国产精品久久久久久久久| 亚洲日本一区二区| 免费人成视频在线| 超碰中文字幕在线观看| 久久99久久99精品中文字幕| 国产精品自在在线| 欧美在线视频免费播放| 国产日韩欧美一区二区东京热| 午夜精品三级久久久有码| 国产成人精品777777| 国产三级第一页| 日韩人妻无码一区二区三区99| 一二三级黄色片| 91九色精品视频| 精品少妇一区二区三区视频免付费| 在线中文字幕一区| 中文久久乱码一区二区| 看黄色一级大片| 亚洲制服中文字幕| 国产专区一区二区三区| 日韩高清av一区二区三区| 蜜桃视频一区二区三区在线观看| 手机免费观看av| 日本亚洲导航| 欧美tickling挠脚心丨vk| 国产精品网站在线播放| 色呦呦视频在线| 看黄色一级大片| 蜜桃av免费看| 免费在线激情视频| 麻豆tv在线播放| 精品国产乱码久久久久久108| 亚洲欧美日韩国产中文专区| 日韩久久一区二区| 国产一区二区三区中文字幕| 魔女鞋交玉足榨精调教| 亚洲天堂第一区| 日本久久久久久久久久久| 亚洲第一免费播放区| 亚洲免费观看高清完整| 玖玖视频精品| 国产性猛交普通话对白| 国产淫片av片久久久久久| 91久久国产精品91久久性色| 亚洲精品按摩视频| 国产精品免费视频一区| 天天操天天操天天操| 性欧美videos| 国产精品日日摸夜夜爽| 成人性生交大片免费看视频直播| 亚洲欧美日韩天堂一区二区| 日韩av在线直播| 亚洲精品综合久久中文字幕| 国产精品免费视频网站| 日韩在线播放一区二区| 色呦呦免费观看| caoporn国产| 久久精品视频7| 欧美性猛交 xxxx| 国产黄色片网站| 国产人妻精品一区二区三| 亚洲欧美日韩激情| 好吊日在线视频| 日本少妇性高潮| 日韩av一二三四| 春色成人在线视频| 夜夜嗨av一区二区三区四区| 亚洲国产精品尤物yw在线观看| 日韩高清一级片| 国产精品18p| www.色.com| 亚洲第一导航| 日本韩国欧美精品大片卡二| 日韩欧美在线一区二区三区| 国产精品国产自产拍在线| 欧美自拍偷拍第一页| 九九热视频在线免费观看| 黑人粗进入欧美aaaaa| 久久久神马电影| 韩国19禁主播vip福利视频| 欧美一区二区视频免费观看| 国产网站一区二区| 日本激情视频网站| 国产成年人免费视频| 97人妻精品一区二区三区免费| 99国产精品白浆在线观看免费| 成人激情视频在线播放| 中文字幕自拍vr一区二区三区| 色狠狠一区二区三区香蕉| 久久久久综合网| 色欲av永久无码精品无码蜜桃| 欧美毛片在线观看| 国产又粗又猛又爽又黄| 嫩草影院中文字幕| 久久精品99| 国产欧美精品一区二区| 欧美大胆在线视频| 日韩成人在线电影网| 91国产福利在线| 亚洲男人的天堂av| 91在线免费视频观看| 蜜臀精品久久久久久蜜臀| 亚洲资源在线播放| 久久网免费视频| 亚洲一区视频在线播放| 亚洲av无日韩毛片久久| 日本a视频在线观看| 视频一区不卡| 精品毛片久久久久久| 91精品久久久久久久久久| 2018日韩中文字幕| www.欧美精品| 亚洲女同精品视频| 日韩欧美一级片| 欧美精品第1页| 日本黄色一区二区| 亚洲一线二线三线久久久| 欧美激情一区二区在线| 99精品欧美一区二区蜜桃免费 | 欧美系列亚洲系列| 亚洲激情男女视频| 国产精品热久久久久夜色精品三区| 成人一区二区三区视频在线观看| 日韩在线一二三区| 亚欧洲精品视频| 欧美一级在线免费观看| 91中文字幕在线视频| 人人爽人人爽人人片av| 国产午夜福利精品| 九热这里只有精品| 精品少妇爆乳无码av无码专区| 久久爱一区二区| 黑鬼狂亚洲人videos| 毛片视频免费播放| 少妇精品无码一区二区免费视频 | 极品人妻videosss人妻| 国产精品久久久久无码av色戒| 日韩片在线观看| 三上悠亚ssⅰn939无码播放| 鲁大师私人影院在线观看| 精品熟女一区二区三区| 日本泡妞xxxx免费视频软件| 国产调教打屁股xxxx网站| 特级特黄刘亦菲aaa级| 亚洲成年人在线观看| av网站免费在线播放| 久久偷拍免费视频| 丁香六月激情综合| 欧美三根一起进三p| 久久精品这里有| 国产91国语对白在线| 中文字幕精品在线观看| 国产露脸国语对白在线| 亚洲国产精品久久人人爱潘金莲| 午夜成人免费影院| 久久精品国产成人一区二区三区| 国产一区二区成人久久免费影院| 成人少妇影院yyyy| 国产午夜精品一区二区| 亚洲精品福利视频网站| 精品久久久一区| 91麻豆精品国产综合久久久久久| 精品国产乱码久久| 最近2019中文免费高清视频观看www99 | 久久免费视频1| 在线一区亚洲| 18岁网站在线观看| 无套内谢丰满少妇中文字幕| 波多野吉衣中文字幕| 动漫精品一区一码二码三码四码 | 久久免费在线观看| 国产精品a久久久久久| 成人黄色在线免费观看| 性欧美videosex高清少妇| 免费观看国产精品视频| 欧美精品色视频| 男女全黄做爰文章| 精品久久久久久久久久久国产字幕 | 免费精品视频最新在线| 99久久99久久精品免费观看| 亚洲精品高清视频在线观看| 欧美三级日韩三级| 国产亚洲精品美女久久久久| 91av在线播放视频| 国产一区二区三区四区五区加勒比| 最新av在线免费观看| 亚洲欧洲日本精品| 欧美人与性囗牲恔配| 天天综合网久久综合网| 亚洲人成色777777精品音频| 99免费精品在线| 欧美日韩免费区域视频在线观看| 精品国产污污免费网站入口| 欧美乱大交xxxxx| 亚洲free嫩bbb| 黄色一级视频播放| 亚洲黄色小说在线观看| 久久国产在线观看| 亚洲国产一二三区| 成人精品免费视频| 色综合天天天天做夜夜夜夜做| 一区二区三区国产在线观看| 成人中心免费视频| 3d动漫一区二区三区|