色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

神經網絡提取PDF表格工具來了,支持圖片,還能白嫖谷歌GPU資源

“表哥表姐”們還在為大量PDF文件中的表格發愁嗎?

賈浩楠 發自 凹非寺
量子位 報道 | 公眾號 QbitAI

“表哥表姐”們還在為大量PDF文件中的表格發愁嗎?

百度一下,網上有大量提取PDF表格的工具,但是,它們都只支持文本格式PDF。

但掃描生成的圖片表格怎么辦?

別著急,一種使用深度神經網絡識別提取表格的開源工具可以幫助你。

兼容圖片、高準確率、還不占用本地運算資源,如此實用的工具值得你擁有。

測試實例

如果在輸入的PDF文件中檢測的表格,模型會在邊界框(bounding box)標出表格邊框:

然后,表格數據會被轉化為Panda數據框架,方便后續處理:

怎么樣,是不是很實用?那這個工具如何使用呢?

使用姿勢詳解

神經網絡算法,還不占用本地運算資源?

對,你沒聽錯,這個工具的所有代碼都可以在谷歌Colab上運行。也就是說你可以利用Colab云端資源完成訓練和推理,無需本地安裝。

這個工具使用到的深度神經網絡是Keras-RetinaNet,首先要在Colab上安裝Keras-RetinaNet,通過一下一行代碼就可以完成:

git clone https://github.com/fizyr/keras-retinanet

同時需要安裝必要的庫:

pip install .python setup.py build_extinplace

訓練Keras-RetinaNet識別表格

首先要構建或一個訓練使用的數據庫。

這里要用到Colab工具PDF2Img,將PDF文件轉為JPG格式供算法學習。

然后將轉好的圖片保存在Images文件夾中。接下來需要手動給這些訓練數據打標簽,這里推薦使用在線標記工具makesense.ai。

將XML注釋文件保存在注釋文件夾中,并創建用于培訓和測試的PDF文件列表,將該列表導入train.txt和test.txt中。

接下來,克隆Github項目https://github.com/ferrygun/PDFTableExtract,并安裝beautifulsoup。

運行以下命令以將PASCALVOC格式轉換為Keras-RetinaNet所需的格式:

python build_logos.py

運行上述命令后,會得到retinanet_classes.csv,retinanet_test.csv和retinanet_train.csv。

在retinanet_classses.csv中,由于只識別PDF文檔中的表,所以只有到一個class,即class 0。

如果你在打標簽的過程中加入頁眉頁腳等標簽,相應能得到多個class。

完整的文件和文件夾結構的列表:

然后,將retinanet_classes.csv,retinanet_test.csv,retinanet_train.csv,train.txt和test.txt 導入keras-retinanet的根文件夾中:

接下來,運行Colab TrainOCR,可以根據要訓練的JPG文件數量來調整訓練的epoch數量。

訓練完成后,就會得到權重文件output.h5,下載此文件并將其保存到本地主機。后面將使用該文件來運行測試。

這里需要注意的一點是,在Colab中,已將文件上傳到Git并進行了Git克隆。

運行測試

運行測試前,還需要安裝處理PDF文件必要的庫。

PyPDF2是一個python工具庫,能夠提取文檔信息,裁剪頁面等。

使用以下命令安裝此庫:

pip install PyPDF2

Camelot是專門用于解析PDF頁面表格的python庫。

使用以下命令安裝此庫:

pip install camelot-py[cv]

PDF2IMG是將Python轉換為PIL Image對象的python庫。

使用以下命令安裝此庫:

pip install pdf2imag

在運行預測之前,需要使用從訓練中獲得的權重文件output.h5加載模型,并從retinanet_classes.csv定義標簽class 0。

model_path = ‘output.h5’model = models.load_model(model_path, backbone_name=’resnet50’)labels = ‘retinanet_classes.csv’LABELS = open(labels).read().strip().split(‘\n’)LABELS = {int(L.split(‘,’)[1]): L.split(‘,’)[0] for L in LABELS}print(LABELS){0: ‘tabel’}

接下來運行測試

import numpy as npimport cv2import matplotlib.pyplot as pltimage_path = imgfname#image = cv2.imread(image_path)image = read_image_bgr(image_path)image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)output = image.copy()output = cv2.cvtColor(output, cv2.COLOR_BGR2RGB)print(output.shape) # row (height) x column (width) x color (3)image = preprocess_image(image)(image, scale) = resize_image(image)image = np.expand_dims(image, axis=0)# detect objects in the input image and correct for the image scale(boxes, scores, labels) = model.predict_on_batch(image)boxes /= scaleconfidence =  0.2from google.colab.patches import cv2_imshowimport matplotlib.pyplot as pltlabel_out = []result = ""# loop over the detectionsfor (box, score, label) in zip(boxes[0], scores[0], labels[0]):  # filter out weak detections  if score < confidence:    continue  # convert the bounding box coordinates from floats to integers  box = box.astype("int")  # build the label and draw the label + bounding box on the output  # image  labeli = label  label = "{}: {:.2f}".format(LABELS[label], score)  print(label)  if LABELS[labeli] not in label_out:      label_out.append(LABELS[labeli])      cv2.rectangle(output, (box[0], box[1]), (box[2], box[3]), (255, 0, 0), 12)      print(box[0])      print(box[1])      print(box[2])      print(box[3])      #result            cv2.putText(output, label, (box[0], box[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 4.5, (255, 1, 1), 12)plt.figure(figsize=(20, 20))plt.imshow(output)plt.show()

如果檢測的表格,模型會在邊界框(bounding box)標出表格邊框:

邊界框坐標(x1,y1,x2,y2),將table_area輸入到Camelot read_pdf函數中,table_area是已標準化的邊界框。

interesting_areas=[]output = [[x1, y1, x2, y2]]for x in output:  [x1, y1, x2, y2] = bboxes_pdf(img, pdf_page, x)  bbox_camelot = [            ",".join([str(x1), str(y1), str(x2), str(y2)])        ][0]  # x1,y1,x2,y2 where (x1, y1) -> left-top and (x2, y2) -> right-bottom in PDF coordinate space        #print(bbox_camelot)  interesting_areas.append(bbox_camelot)print(interesting_areas)output_camelot = camelot.read_pdf(    filepath=pdf_file, pages=str(pg), flavor="stream", table_areas=interesting_areas)output_camelot[0].df

這樣就可以將表格數據轉化為Panda數據框架,方便后續處理:

圖片怎么辦

針對掃描圖片格式的PDF表格,可以使用Ocrmypdf包來將圖片格式PDF轉為文本格式。

Ocrmypdf是一個python軟件包,可將基于圖像的pdf轉換為基于文本的PDF。

安裝ocrmypdf,可以通過以下命令行將其用于macOS和Linux:

brew?install?ocrmypdf

通過以下命令調用:

ocrmypdf input_file.pdf output_file.pdf

之后就可以按照上面的方法進行表格提取了。

怎么樣,這款兼容圖片,又能白嫖谷歌GPU的PDF表格工具對你有幫助嗎?

傳送門

項目地址:
https://github.com/ferrygun/PDFTableExtract

在線打標簽工具:
https://www.makesense.ai/

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
久久不射热爱视频精品| 国产精品无码在线播放| 在线不卡的av| 最新免费av网址| 精品国产乱码久久久久久天美 | 免费看污片网站| 成人免费视频国产| 国产成人精品视频| 中文字幕一区二区三区视频| 强伦女教师2:伦理在线观看| 97精品国产露脸对白| 欧美无砖砖区免费| av网页在线观看| 亚洲国产精品va| 亚洲午夜激情影院| 久久久久久影视| 国产日韩第一页| 国产麻豆视频精品| 国产精品青草久久久久福利99| 日本二区三区视频| 精品美女在线观看| 无码人妻丰满熟妇区毛片| 亚洲欧美激情在线观看| 91麻豆精品久久久久蜜臀| 动漫美女被爆操久久久| 岛国精品资源网站| 26uuu色噜噜精品一区| 一区二区三区日韩在线| 中文字幕日韩一区二区三区不卡| 久久精品国产亚洲av高清色欲| 久久99精品久久久久久动态图 | 久久久久久久久久毛片| 九九热精品在线观看| 欧洲精品一区二区三区在线观看| 国产免费一区二区三区四在线播放| 人成免费在线视频| 一区二区三区中文字幕| 欧美主播福利视频| 免费成人午夜视频| 日韩经典中文字幕一区| 欧美日韩国产综合一区二区三区| 久久青草福利网站| 成人性视频欧美一区二区三区| 青娱乐国产盛宴| 最新高清无码专区| 亚洲精品成人久久电影| 少妇av一区二区三区无码| 性感美女视频一二三| 亚洲精品一区av在线播放| 国产精品国产三级国产专区51| 久草视频一区二区| 亚洲电影天堂av| 欧美日韩国产综合视频在线| 国产精品久久久久久在线| 制服.丝袜.亚洲.另类.中文| 国产成人av影视| 国产ts人妖一区二区| 色噜噜噜噜噜噜| 99久免费精品视频在线观看| 91麻豆国产语对白在线观看| 精品人妻无码一区| 色噜噜久久综合| 91视频最新入口| 亚洲国产精品av| 神马影院午夜我不卡影院| 亚洲视屏在线观看| 成人短视频在线观看免费| 日韩区在线观看| 少妇高潮一区二区三区69| 国产91在线播放九色| 亚洲一级免费在线观看| 日韩欧美中文字幕公布| 亚洲国产精品欧美一二99| 免费看黄色的视频| 亚洲国产成人在线播放| 日韩成人dvd| 亚洲欧美一区二区三区不卡| 欧洲色大大久久| 91精品人妻一区二区| 午夜久久资源| 亚洲网站在线播放| 亚洲综合激情网| 精品人妻一区二区三区免费看 | 日本午夜激情视频| 成人av午夜影院| 久久大片网站| 亚洲av成人无码网天堂| 欧美一级视频一区二区| 亚洲精品一区二区口爆| 69久久夜色精品国产69乱青草| 国产精品久久久午夜夜伦鲁鲁| 91精品成人久久| 日韩有码第一页| 欧美日本韩国在线| 一区二区三区日本| 天堂va久久久噜噜噜久久va| 99精品欧美一区二区蜜桃免费| 国产网站免费在线观看| 欧美一激情一区二区三区| 看国产成人h片视频| 国产超碰人人爽人人做人人爱| 成人国产在线看| 日韩经典第一页| 神马午夜在线观看| 婷婷四月色综合| 欧美一二三区在线观看| 一区二区美女视频| 国产午夜伦鲁鲁| 欧美精品中文字幕一区| 一级特黄色大片| 国产免费一区二区三区在线观看| 99久久免费视频.com| 神马影院我不卡| 中文字幕一区二区三中文字幕| 日韩精品一区二区三| 成人黄色片在线| 一区二区三区免费网站| 一区二区三区免费播放| 成人美女视频在线看| 国产爆乳无码一区二区麻豆| 国产欧美日韩另类一区| 亚洲AV无码国产精品| 情事1991在线| 日本护士做爰视频| 久久久久看片| 视频一区二区三| 欧美日韩国产a| 一级片在线观看视频| 成人av免费在线看| 在线日韩国产精品| 国产剧情av麻豆香蕉精品| 久久亚洲a v| 日韩精品在线观看一区| 日韩中文字幕高清| 国产一区二区三区奇米久涩| 懂色av中文字幕一区二区三区| www.涩涩涩| 图片区小说区国产精品视频| 超碰影院在线观看| 最近2019中文字幕一页二页| 91精品人妻一区二区三区果冻| 亚洲精品一卡二卡三卡四卡| 日韩你懂的在线播放| 免费观看成年人视频| 手机视频在线观看| 97精品国产97久久久久久春色| 欧美偷拍第一页| 成人在线中文字幕| 欧美主播一区二区三区| 亚洲精品一级片| 中文字幕5566| 欧美一级在线播放| 成人丝袜高跟foot| 亚洲精品久久一区二区三区777| 91麻豆精品国产91久久久久久久久 | 天堂成人在线观看| 亚洲一区二区三区毛片| 精品国产电影一区| www.国产三级| 日韩av在线综合| 久久精品成人欧美大片| 成人午夜免费av| 深田咏美中文字幕| 成人黄色免费看| 天天综合色天天综合| 亚洲欧美一区二区三区在线观看 | 成人在线观看免费高清| 青青草久久网络| 亚洲欧美日韩天堂| 亚洲av无码一区二区三区dv| 中国特级黄色大片| 亚洲xxx自由成熟| |精品福利一区二区三区| 亚洲黄色片视频| 久久一区二区电影| 小说区视频区图片区| 色多多国产成人永久免费网站| 一区二区三区四区在线播放| 亚洲精品国产suv一区| 欧美a在线播放| www.国产区| 亚洲精品欧美一区二区三区| 日韩午夜激情视频| 亚洲欧美日韩久久精品| 国产一区二区在线视频观看| 污污网站免费观看| 国产高清在线一区| 在线精品播放av| 538在线一区二区精品国产| 亚洲精品视频在线| www.99re6| 天天爽夜夜爽视频| 一区二区欧美国产| 黄色一级片在线免费观看| 亚洲aⅴ天堂av在线电影软件| 国产香蕉97碰碰久久人人| 国产精品久久福利| 97免费在线观看视频| 97超碰免费观看| 久久资源免费视频| 日韩精品在线一区| 欧美激情综合网| 国产一区二区三区四区视频| 亚洲精品乱码久久久久久蜜桃欧美| 亚洲va男人天堂| 91国产高清在线| 另类视频在线观看| 欧美一级精品大片| 在线观看视频一区二区欧美日韩| 亚洲欧美一区二区不卡| 91在线高清观看| 国产三级自拍视频| 国产三级理论片| 久久久无码精品亚洲国产| 午夜性福利视频| 三大队在线观看| 先锋资源在线视频| 日本在线观看a| 亚洲爆乳无码专区| 大地资源第二页在线观看高清版| 欧洲久久久久久| 国产啪精品视频网站| 日韩电影大全免费观看2023年上| 国产免费久久久久| 亚洲最新视频在线观看| 欧美激情一区不卡| 国产亚洲一区二区在线观看| 99久久亚洲一区二区三区青草| 麻豆精品视频在线观看视频| 三级视频在线看| 中日韩黄色大片| 日本青青草视频| 国产午夜视频在线播放| 欧美视频www| 免费观看黄网站| 亚洲码无人客一区二区三区| www在线观看免费视频| 亚洲国产精品成人无久久精品| 国产剧情久久久| 韩国精品免费视频| 国产欧美日韩亚州综合 | 成人精品久久一区二区三区| 国产精品二区三区| 久久综合九色综合久99| 一区二区三区中文字幕电影 | 制服.丝袜.亚洲.中文.综合懂色| 免费在线不卡av| 午夜精品小视频| 高清av一区二区| 亚洲色图丝袜美腿| 欧美一区二区播放| 欧美高清在线播放| 国产精品主播视频| 久久精品日产第一区二区三区乱码| 亚洲综合首页| 亚洲欧美自拍另类日韩| 性高潮久久久久久久| 91精品国产综合久久久蜜臀九色| 免费在线观看不卡| 一区视频在线播放| 国产一区二区三区免费视频| 成人综合网网址| 欧美啪啪免费视频| 91麻豆免费视频网站| 日本亚洲三级在线| 一本色道久久加勒比精品 | 影音先锋男人的网站| 少妇饥渴放荡91麻豆| www.激情网| www.桃色.com| 一区二区小视频| 国产成人av一区二区三区在线| 亚洲三级免费观看| 欧美老女人xx| 九一国产精品视频| 欧美一区二区激情视频| 97超碰欧美中文字幕| 亚洲国产精品久久久| 91黄在线观看| 国产三级国产精品| 巨乳诱惑日韩免费av| 欧美一区在线视频| 成人资源av| 日本精品在线免费观看| 91免费视频网| 亚洲午夜色婷婷在线| 国产区欧美区日韩区| www.日本高清| 国产高清亚洲一区| 亚洲欧洲第一视频| 五月天亚洲综合小说网| 青青操免费在线视频| 国产精品久久久久久久久晋中 | 国产日韩在线免费| 亚洲精品第二页| 秋霞电影网一区二区| 国产丝袜精品视频| 欧美爱爱视频网站| 99在线精品视频免费观看软件| 亚洲亚洲人成综合网络| 日韩美女中文字幕| 免费无码国产精品| 98精品在线视频| 国产午夜精品无码一区二区| 国产精品主播直播| 国产亚洲精品美女久久久m| 另类小说欧美激情| 日日狠狠久久偷偷四色综合免费| 日本免费a视频| av加勒比在线| 欧美群妇大交群中文字幕| 一区二区三区四区免费视频| 中文字幕 日韩有码| 精品久久久久av影院| 蜜臀在线免费观看| 狠狠综合久久av一区二区| 亚洲精品永久免费| 国产美女永久无遮挡| 美腿丝袜亚洲综合| 欧美激情欧美激情在线五月| a视频免费观看| 久久久久免费观看| 国产成人午夜视频网址| 日韩在线一卡二卡| 天天综合天天综合色| 在线视频91| 国产精品一区免费视频| 成人在线小视频| 亚洲熟女www一区二区三区| 色综合天天性综合| 精品一区二区三区毛片| 国产精品白丝av| 蜜桃导航-精品导航| 久久免费国产| 欧美一级视频在线观看| 国产又黄又粗又爽| 美女久久久久久久| 毛片久久久久久| 欧美变态口味重另类| 制服 丝袜 综合 日韩 欧美| 欧美视频第一页| 亚洲 欧美 另类人妖| 精品久久中文字幕| 色片在线免费观看| 亚洲国产成人91porn| 色一情一区二区三区| 亚洲男人的天堂av| 欧美中日韩在线| 久久蜜臀中文字幕| 性做爰过程免费播放| 一二三四视频社区在线| 国产在线精品一区二区夜色| 国产精品你懂得| www.天堂在线| 国产精品成人久久久久| 无码精品视频一区二区三区| 俄罗斯精品一区二区| 国产丰满美女做爰| 亚洲一区制服诱惑| 国产精品夜夜嗨| 国产女人18毛片| 精品日韩视频在线观看| 在线成人免费av| 欧美一区二区二区| 国产美女精品在线观看| 精品亚洲国内自在自线福利| 欧美这里只有精品| 欧美色涩在线第一页| 国产免费嫩草影院| 欧美高清视频在线播放| 日本成人超碰在线观看| 三年中文高清在线观看第6集| 久久精品欧美一区二区三区麻豆| 成人在线观看a| 精品国产一区二区三区不卡| 精品国产免费观看| 国产 高清 精品 在线 a| 99久久综合国产精品| 制服丝袜综合网| 日韩黄色av网站| 国产亚洲久一区二区| 免费亚洲一区二区| 久久久精品国产免费观看同学| 欧美国产日韩在线播放| 欧美综合天天夜夜久久| 久久精品美女视频| 国产精品三级在线| 国产ts人妖一区二区| 五月婷婷之婷婷| 最近日韩中文字幕中文| 极品少妇一区二区| 欧美激情第3页| 黄色激情视频在线观看| 日韩美女av在线免费观看| 日本一区二区视频在线观看| 女人被狂躁c到高潮| 国产91露脸中文字幕在线| 成人免费看视频| 国产精品一区二区在线免费观看| 午夜精品一区二区三区视频免费看 | 亚洲精品成人久久| 丁香六月天婷婷| 人人爽人人av| 欧美精品videossex性护士| 久久综合色鬼综合色| 国产第一页浮力| 精品视频免费观看| 日韩一区二区精品| 久久中文在线| 91精品999|