色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

阿里7B多模態文檔理解大模型拿下新SOTA|開源

各種復雜結構圖一鍵提取解析

mPLUG團隊 投稿

量子位 | 公眾號 QbitAI

多模態文檔理解能力新SOTA!

阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl 1.5,針對高分辨率圖片文字識別、通用文檔結構理解、指令遵循、外部知識引入四大挑戰,提出了一系列解決方案。

話不多說,先來看效果。

復雜結構的圖表一鍵識別轉換為Markdown格式:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

不同樣式的圖表都可以:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

更細節的文字識別和定位也能輕松搞定:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

還能對文檔理解給出詳細解釋:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

要知道,“文檔理解”目前是大語言模型實現落地的一個重要場景,市面上有很多輔助文檔閱讀的產品,有的主要通過OCR系統進行文字識別,配合LLM進行文字理解可以達到不錯的文檔理解能力。

不過,由于文檔圖片類別多樣、文字豐富且排版復雜,難以實現圖表、信息圖、網頁等結構復雜圖片的通用理解。

當前爆火的多模態大模型QwenVL-Max、Gemini, Claude3、GPT4V都具備很強的文檔圖片理解能力,然而開源模型在這個方向上的進展緩慢。

而阿里新研究mPLUG-DocOwl 1.5在10個文檔理解基準上拿下SOTA,5個數據集上提升超過10個點,部分數據集上超過智譜17.3B的CogAgent,在DocVQA上達到82.2的效果。

阿里7B多模態文檔理解大模型拿下新SOTA|開源

除了具備基準上簡單回答的能力,通過少量“詳細解釋”(reasoning)數據的微調,DocOwl 1.5-Chat也能具備多模態文檔領域詳細解釋的能力,具有很大的應用潛力。

阿里mPLUG團隊從2023年7月份開始投入多模態文檔理解的研究,陸續發布了mPLUG-DocOwl、 UReader、mPLUG-PaperOwl、mPLUG-DocOwl 1.5,開源了一系列文檔理解大模型和訓練數據。

本文從最新工作mPLUG-DocOwl 1.5出發,剖析“多模態文檔理解”領域的關鍵挑戰和有效解決方案。

挑戰一:高分辨率圖片文字識別

區分于一般圖片,文檔圖片的特點在于形狀大小多樣化,其可以包括A4大小的文檔圖、短而寬的表格圖、長而窄的手機網頁截圖以及隨手拍攝的場景圖等等,分辨率的分布十分廣泛。

主流的多模態大模型編碼圖片時,往往直接縮放圖片的大小,例如mPLUG-Owl2和QwenVL縮放到448×448,LLaVA 1.5縮放到336×336。

簡單的縮放文檔圖片會導致圖片中的文字模糊形變從而不可辨認。

為了處理文檔圖片,mPLUG-DocOwl 1.5延續了其前序工作UReader的切圖做法,模型結構如圖1所示:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖1:DocOwl 1.5模型結構圖

UReader最早提出在已有多模態大模型的基礎上,通過無參數的形狀適應切圖模塊(Shape-adaptive Cropping Module)得到一系列子圖,每張子圖通過低分辨率編碼器進行編碼,最后通過語言模型關聯子圖直接的語義。

該切圖策略可以最大程度利用已有通用視覺編碼器(例如CLIP ViT-14/L)的能力進行文檔理解,大大減少重新訓練高分辨率視覺編碼器的代價。形狀適應的切圖模塊如圖2所示:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖2:形狀適應的切圖模塊。

挑戰二:通用文檔結構理解

對于不依賴OCR系統的文檔理解來說,識別文字是基本能力,要實現文檔內容的語義理解、結構理解十分重要,例如理解表格內容需要理解表頭和行列的對應關系,理解圖表需要理解線圖、柱狀圖、餅圖等多樣化結構,理解合同需要理解日期署名等多樣化的鍵值對。

mPLUG-DocOwl 1.5著力于解決通用文檔等結構理解能力,通過模型結構的優化和訓練任務的增強實現了顯著更強的通用文檔理解能力。

結構方面,如圖1所示,mPLUG-DocOwl 1.5放棄了mPLUG-Owl/mPLUG-Owl2中Abstractor的視覺語言連接模塊,采用基于“卷積+全連接層”的H-Reducer進行特征聚合以及特征對齊

相比于基于learnable queries的Abstractor,H-Reducer保留了視覺特征之間的相對位置關系,更好的將文檔結構信息傳遞給語言模型。

相比于保留視覺序列長度的MLP,H-Reducer通過卷積大幅縮減了視覺特征數量,使得LLM可以更高效地理解高分辨率文檔圖片。

考慮到大部分文檔圖片中文字優先水平排布,水平方向的文字語義具有連貫性,H-Reducer中采用1×4的卷積形狀和步長。論文中,作者通過充分的對比實驗證明了H-Reducer在結構理解方面的優越性以及1×4是更通用的聚合形狀。

訓練任務方面,mPLUG-DocOwl 1.5為所有類型的圖片設計了統一結構學習(Unified Structure Learning)任務,如圖3所示。

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖3:統一結構學習

Unified Structure Learning既包括了全局的圖片文字解析,又包含了多粒度的文字識別和定位。

在全局圖片文字解析任務中,對于文檔圖片和網頁圖片,采用空格和換行的形式可以最通用地表示文字的結構;對于表格,作者在Markdown語法的基礎上引入表示多行多列的特殊字符,兼顧了表格表示的簡潔性和通用性;對于圖表,考慮到圖表是表格數據的可視化呈現,作者同樣采用Markdown形式的表格作為圖表的解析目標;對于自然圖,語義描述和場景文字同等重要,因此采用圖片描述拼接場景文字的形式作為解析目標。

在“文字識別和定位”任務中,為了更貼合文檔圖片理解,作者設計了單詞、詞組、行、塊四種粒度的文字識別和定位,bounding box采用離散化的整數數字表示,范圍0-999。

為了支持統一的結構學習,作者構建了一個全面的訓練集DocStruct4M,涵蓋了文檔/網頁、表格、圖表、自然圖等不同類型的圖片。

經過統一結構學習,DocOwl 1.5具備多領域文檔圖片的結構化解析和文字定位能力。

阿里7B多模態文檔理解大模型拿下新SOTA|開源
阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖4: 結構化文字解析

如圖4和圖5所示:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖5: 多粒度文字識別和定位

挑戰三:指令遵循

“指令遵循”(Instruction Following)要求模型基于基礎的文檔理解能力,根據用戶的指令執行不同的任務,例如信息抽取、問答、圖片描述等。

延續mPLUG-DocOwl的做法,DocOwl 1.5將多個下游任務統一為指令問答的形式,在統一的結構學習之后,通過多任務聯合訓練的形式得到一個文檔領域的通用模型(generalist)。

此外,為了使得模型具備詳細解釋的能力,mPLUG-DocOwl曾嘗試引入純文本指令微調數據進行聯合訓練,有一定效果但并不理想。

在DocOwl 1.5中,作者基于下游任務的問題,通過GPT3.5以及GPT4V構建了少量的詳細解釋數據(DocReason25K)。

通過聯合文檔下游任務和DocReason25K進行訓練,DocOwl 1.5-Chat既可以在基準上實現更優的效果:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖6:文檔理解Benchmark評測

又能給出詳細的解釋:

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖7:文檔理解詳細解釋

挑戰四:外部知識引入

文檔圖片由于信息的豐富性,進行理解的時候往往需要額外的知識引入,例如特殊領域的專業名詞及其含義等等。

為了研究如何引入外部知識進行更好的文檔理解,mPLUG團隊著手于論文領域提出了mPLUG-PaperOwl,構建了一個高質量論文圖表分析數據集M-Paper,涉及447k的高清論文圖表。

該數據中為論文中的圖表提供了上下文作為外部知識來源,并且設計了“要點”(outline)作為圖表分析的控制信號,幫助模型更好地把握用戶的意圖。

基于UReader,作者在M-Paper上微調得到mPLUG-PaperOwl,展現了初步的論文圖表分析能力,如圖8所示。

阿里7B多模態文檔理解大模型拿下新SOTA|開源

△圖8:論文圖表分析

mPLUG-PaperOwl目前只是引入外部知識進文檔理解的初步嘗試,仍然面臨著領域局限性、知識來源單一等問題需要進一步解決。

總的來說,本文從最近發布的7B最強多模態文檔理解大模型mPLUG-DocOwl 1.5出發,總結了不依賴OCR的情況下,進行多模態文檔理解的關鍵四個關鍵挑戰(“高分辨率圖片文字識別”,“通用文檔結構理解”,“指令遵循”, “外部知識引入” )和阿里巴巴mPLUG團隊給出的解決方案。

盡管mPLUG-DocOwl 1.5大幅提升了開源模型的文檔理解表現,其距離閉源大模型以及現實需求仍然有較大差距,在自然場景中文字識別、數學計算、通用型等方面仍然有進步空間。

mPLUG團隊會進一步優化DocOwl的性能并進行開源,歡迎大家持續關注和友好討論!

GitHub鏈接:https://github.com/X-PLUG/mPLUG-DocOwl
論文鏈接:https://arxiv.org/abs/2403.12895

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
av一区二区三区免费| 亚洲欧美国产精品va在线观看| 久久精品99国产国产精| 中文字幕 欧美激情| 亚洲天堂视频一区| 亚洲一区二区三区四区五区六区| 女女百合国产免费网站| 日本大片免费看| 91在线看www| 最近2019中文字幕大全第二页| 国产精品日日摸夜夜摸av| 国产一区二区在线观看视频| 国产欧美精品一区二区| 成人黄色大片在线观看 | 99久久国产宗和精品1上映| 亚洲小视频在线播放| 波多野结衣精品久久| 黄色片一区二区三区| 国产精品伊人色| 亚洲精品国产成人| 特级黄色录像片| 亚洲视频小说| 农村寡妇一区二区三区| 手机在线免费看毛片| 成人精品视频网站| 国产综合在线看| 中文字幕第三区| 国产专区欧美精品| 久久久精品视频成人| 少妇高清精品毛片在线视频| 亚洲 国产 欧美 日韩| 日韩精品中文字幕视频在线| 日韩黄色短视频| 日韩在线视频免费| 亚洲欧美一区二区三区情侣bbw | 国产精品人人爽人人爽| 午夜视频在线播放| 中文字幕精品在线| 国产一级片中文字幕| 成人午夜在线播放| 国产午夜精品理论片a级大结局| 亚洲综合激情网| 国产精品视频白浆免费视频| 白嫩少妇丰满一区二区| 偷拍夫妻性生活| 亚洲天堂久久久久| 2021中文字幕一区亚洲| 日韩美女视频在线| 国产精品欧美激情| 久久久久人妻精品一区三寸| 全程偷拍露脸中年夫妇| 男人天堂网在线视频| 久久精品免费在线观看| 精品久久在线播放| 欧美日韩国产精品一区二区三区四区| 欧美日韩中字一区| 一区二区在线观看不卡| 一区二区在线免费观看| 色av中文字幕一区| 日本一区二区成人在线| 中文一区二区在线观看| 亚洲欧美国产精品久久久久久久| 国产精品扒开腿做爽爽爽男男| 亚洲天堂中文字幕| 午夜精品一区二区三区视频免费看| 国产精品第七页| 亚洲欧洲三级电影| 久久亚洲综合网| www男人的天堂| 久久久成人av| 污污视频网站在线免费观看| 色网综合在线观看| 内射国产内射夫妻免费频道| 成人视屏免费看| 亚洲永久免费观看| 国产原创中文av| 久久精品人人做人人爽| 国产一区第一页| 91精品国产福利在线观看| 亚洲一级免费在线观看| 国产又粗又猛又爽又黄| 国产亚洲自拍一区| 18涩涩午夜精品.www| 日韩国产精品亚洲а∨天堂免| 日韩av第一页| 熟妇高潮一区二区| 久久99国产精品久久| 日韩精品中文字幕久久臀| 乱妇乱女熟妇熟女网站| 午夜精品小视频| 国产午夜精品麻豆| 国产女大学生av| 亚洲香蕉伊在人在线观| 日韩爱爱小视频| 岛国视频一区免费观看| 丝袜情趣国产精品| 亚洲美女偷拍久久| 亚洲成人久久精品| 麻豆亚洲一区| 性猛交xxxx| 欧美少妇一区| 中文av一区特黄| 手机免费av片| 久久久一区二区三区捆绑**| 成人免费看片视频在线观看| 最近2019中文字幕在线高清| 国产成人精品亚洲男人的天堂 | 欧美日韩在线另类| 久久精品国产一区二区三区日韩| 亚洲亚洲精品在线观看| 在线观看福利片| 狠狠躁狠狠躁视频专区| 国产欧美一区二区精品忘忧草 | 色偷偷av亚洲男人的天堂| 欧美激情图片小说| 中日韩美女免费视频网站在线观看| gv天堂gv无码男同在线观看| 日韩精品久久久久久福利| 激情无码人妻又粗又大| 亚洲人免费视频| 日本免费一二三区| 欧美丰满老妇厨房牲生活| 亚洲无码精品一区二区三区| 久久久久亚洲精品| 中文字幕欧美在线观看| 日本一区二区在线免费播放| 欧美熟妇交换久久久久久分类| 亚洲一区二区三区毛片| 国产一区二区三区在线观看免费视频 | 五月婷婷六月香| 日韩中文字幕免费看| 无码人妻精品一区二区| 情事1991在线| 三级不卡在线观看| 日本一区免费看| 国产精品久久久久aaaa樱花| 亚洲36d大奶网| 欧美一区二区视频在线观看2020 | 国产强伦人妻毛片| 亚洲最大成人网色| 国产白丝网站精品污在线入口| 国产三级中文字幕| 亚洲国产成人av网| 免费无码一区二区三区| 中文亚洲视频在线| 一区二区三区免费在线| 91精品美女在线| 国产a久久麻豆| 日本www在线视频| 91精品福利在线| 中文字幕无码日韩专区免费| 精品综合久久久久久97| 亚洲av成人无码久久精品老人| 欧美亚洲一级二级| 亚洲综合免费观看高清在线观看| www.免费av| 美女福利视频一区| 久久精品导航| 欧美在线观看黄| 在线观看欧美日本| 久久亚洲av午夜福利精品一区| 欧美一区二区三区…… | 欧美日韩一区在线视频| 亚洲视频一区二区在线观看| 亚洲国产综合视频| 久久久久久午夜| 国产精品自产自拍| 五月天av在线播放| 亚洲人成在线免费观看| 人人妻人人澡人人爽人人欧美一区| 亚洲欧洲免费无码| 欧洲精品一区二区| 国产精品999在线观看| 亚洲xxxx在线| 亚洲精品欧美激情| 午夜成人亚洲理伦片在线观看| 国产精品久久久久91| 久久青草国产手机看片福利盒子| 波多野结衣办公室双飞| 欧美精品videosex极品1| 国产精品一二三在| 中文字幕第六页| 欧美国产日韩免费| www.性欧美| 亚洲天堂久久新| 国产精品三级在线| 亚洲精品视频在线观看免费| 欧美日韩精品亚洲精品| 国产精品免费区二区三区观看| 亚洲影院免费观看| 亚洲免费激情视频| 欧美在线视频二区| 欧美久久一二区| 国产黄色一区二区| 日韩在线综合网| 国产亚洲精品日韩| 国产黄色精品网站| 制服丝袜第一页在线观看| 欧美一级片一区| 亚洲丝袜美腿综合| 国产精品黄色大片| 国产高清免费在线| 亚洲美女激情视频| 国产在线精品一区二区三区不卡| 日本wwwxx| 国产精品美女999| 亚洲国产精品久久不卡毛片| 欧美成人精品网站| 你懂的av在线| 美女扒开尿口让男人操亚洲视频网站| 91麻豆国产福利在线观看| 亚洲a∨无码无在线观看| 国产精品综合久久久久久| 在线免费一区三区| www.日韩高清| 日本美女视频一区| 国产精品黄色av| 狠狠操狠狠色综合网| 国产精品呻吟久久| 中文字幕av不卡在线| 欧美一区二区三区艳史| 亚洲一区二区三区在线看| 中文字幕在线观看视频一区| 国内自拍在线观看| 久久久久久免费精品| 亚洲一区二区在线免费看| 亚洲熟妇无码久久精品| 黄色av免费在线播放| 欧美一级在线亚洲天堂| 精品欧美国产一区二区三区| 亚洲av永久无码国产精品久久| 亚洲精品www.| 91久久精品国产91性色| 欧美疯狂做受xxxx富婆| 日本成人超碰在线观看| 性猛交ⅹxxx富婆video| 日韩电影免费观看在| 亚洲欧洲第一视频| 中文字幕乱码日本亚洲一区二区| 中文字幕xxxx| 中文字幕在线观看日| 91精品啪在线观看麻豆免费| 777xxx欧美| 国产传媒一区在线| 欧美福利视频一区二区| 国产熟人av一二三区| 成人av电影天堂| 精品99一区二区三区| 久久久午夜电影| 9i精品福利一区二区三区| 一区二区三区网址| 98国产高清一区| 亚洲欧美999| 亚洲婷婷在线视频| 人妻少妇精品无码专区久久| 美女被到爽高潮视频| www.亚洲一区二区| 91精品国产99久久久久久| 欧美日韩亚洲综合在线 欧美亚洲特黄一级 | 国产精品伊人色| 毛片视频网站在线观看| www.cao超碰| 精品一区二区日本| 久久在线视频在线| 欧美午夜精品理论片a级按摩| 国产精品一区二区久久精品爱涩| 国产精品 欧美 日韩| 狠狠躁狠狠躁视频专区| 免费av在线一区二区| 欧美日韩不卡合集视频| 欧美日韩一区二区欧美激情| 99久久久久久| 国产成人a人亚洲精品无码| 国产jk精品白丝av在线观看| cao在线观看| 999视频在线免费观看| 丝袜一区二区三区| 激情内射人妻1区2区3区| 亚洲精品一区久久久久久| 一区二区激情小说| 国产一区二区不卡在线| 伊人久久久久久久久久久久 | 亚洲老头老太hd| 一区二区成人在线| 国产999精品久久久久久| 一卡二卡在线观看| 青青草自拍偷拍| 不卡的在线视频| 中文字幕在线亚洲精品| 成人国产精品久久久| 精品国产一区二区三区四区在线观看 | 成熟了的熟妇毛茸茸| 成人在线观看网址| 久久久黄色av| 亚洲成色www8888| 婷婷久久综合九色综合绿巨人| 成人黄色小视频在线观看| 色丁香婷婷综合久久| 特级西西444www大精品视频免费看| 少妇精品一区二区三区| 欧美大尺度做爰床戏| 樱空桃在线播放| 精品综合久久| 国产精品偷伦视频免费观看国产| 久久国产精品久久精品| 亚洲国产精品va在线看黑人动漫| 欧美亚洲精品一区| 一区二区三区四区激情| 久久综合丝袜日本网| 麻豆精品在线播放| 国产丝袜在线视频| 亚洲国产成人精品女人久久| 国产盗摄一区二区三区在线| 香港三级日本三级| 日本高清久久久| 欧美精品成人网| 男女午夜激情视频| 九一国产精品视频| 激情六月天婷婷| 一区二区三区一级片| 欧美日韩综合精品| 国产偷久久久精品专区| 国产免费亚洲高清| 日本最新高清不卡中文字幕| 美日韩丰满少妇在线观看| 一区二区av在线| 亚洲国产欧美精品| 日韩欧美一卡二卡| 91精品国产欧美一区二区| 欧美性大战久久久久久久蜜臀| 狠狠爱在线视频一区| 亚洲成人精品影院| 久艹视频在线免费观看| 中文字幕一区二区中文字幕| 亚洲电影网站| 日韩电影天堂视频一区二区| 狠狠干一区二区| 精品视频一区在线| 国精产品99永久一区一区| 国产精品自拍首页| 精品久久久久久乱码天堂| 官网99热精品| 久久99蜜桃综合影院免费观看| 国产一区二区三区色淫影院| 精品乱色一区二区中文字幕| 久久伦理网站| 日韩在线第一区| 影音先锋在线亚洲| 免费的av在线| 精品这里只有精品| 亚洲人成色77777| 毛片毛片毛片毛| 精品国产免费久久久久久婷婷| 中国免费黄色片| 亚洲第一成人网站| 久久午夜精品视频| 久草免费新视频| www毛片com| 国产精品怡红院| 少妇精品高潮欲妇又嫩中文字幕 | 国产成人精品免高潮在线观看| 欧洲精品在线视频| 国产欧美一区二区三区在线看| caoporn国产精品免费公开| 精品欧美一区二区在线观看视频| 神马影院午夜我不卡影院| 300部国产真实乱| 无码人妻丰满熟妇区五十路百度| 久久撸在线视频| 免费在线观看成年人视频| 午夜剧场免费在线观看| 一级黄色免费网站| 精品人妻无码一区二区三区蜜桃一| 视频一区二区三区在线| 成人一级视频在线观看| 国产欧美一区二区精品仙草咪| 亚洲高清不卡在线| 欧美一区二区不卡视频| 永久免费看mv网站入口亚洲| 91精品国产九九九久久久亚洲| 91综合免费在线| 青青草原国产免费| 欧美在线观看视频网站| 黑人玩弄人妻一区二区三区| 狂野欧美性猛交| 国产三级理论片| 蜜桃91丨九色丨蝌蚪91桃色| 久久久99久久| 日本丰满少妇一区二区三区| 日韩av在线免播放器| 久久久久久亚洲精品中文字幕| 成人久久一区二区| 中国成人亚色综合网站| 日韩一级片播放| 91狠狠综合久久久久久| 国产女主播喷水视频在线观看| 视频一区二区国产| 欧美国产日韩精品免费观看| 色综合久久久久久久久久久| 日韩电影在线观看中文字幕 | 97婷婷涩涩精品一区| 91嫩草在线| 亚洲熟妇av日韩熟妇在线| 日本黄色片在线播放| 亚洲视频 欧美视频| 久久99精品国产麻豆婷婷洗澡| 亚洲日韩欧美一区二区在线| 精品成人免费观看| 91原创在线视频| 国产亚洲综合在线|