色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

神經網絡提取PDF表格工具來了,支持圖片,還能白嫖谷歌GPU資源

“表哥表姐”們還在為大量PDF文件中的表格發愁嗎?

賈浩楠 發自 凹非寺
量子位 報道 | 公眾號 QbitAI

“表哥表姐”們還在為大量PDF文件中的表格發愁嗎?

百度一下,網上有大量提取PDF表格的工具,但是,它們都只支持文本格式PDF。

但掃描生成的圖片表格怎么辦?

別著急,一種使用深度神經網絡識別提取表格的開源工具可以幫助你。

兼容圖片、高準確率、還不占用本地運算資源,如此實用的工具值得你擁有。

測試實例

如果在輸入的PDF文件中檢測的表格,模型會在邊界框(bounding box)標出表格邊框:

然后,表格數據會被轉化為Panda數據框架,方便后續處理:

怎么樣,是不是很實用?那這個工具如何使用呢?

使用姿勢詳解

神經網絡算法,還不占用本地運算資源?

對,你沒聽錯,這個工具的所有代碼都可以在谷歌Colab上運行。也就是說你可以利用Colab云端資源完成訓練和推理,無需本地安裝。

這個工具使用到的深度神經網絡是Keras-RetinaNet,首先要在Colab上安裝Keras-RetinaNet,通過一下一行代碼就可以完成:

git clone https://github.com/fizyr/keras-retinanet

同時需要安裝必要的庫:

pip install .python setup.py build_extinplace

訓練Keras-RetinaNet識別表格

首先要構建或一個訓練使用的數據庫。

這里要用到Colab工具PDF2Img,將PDF文件轉為JPG格式供算法學習。

然后將轉好的圖片保存在Images文件夾中。接下來需要手動給這些訓練數據打標簽,這里推薦使用在線標記工具makesense.ai。

將XML注釋文件保存在注釋文件夾中,并創建用于培訓和測試的PDF文件列表,將該列表導入train.txt和test.txt中。

接下來,克隆Github項目https://github.com/ferrygun/PDFTableExtract,并安裝beautifulsoup。

運行以下命令以將PASCALVOC格式轉換為Keras-RetinaNet所需的格式:

python build_logos.py

運行上述命令后,會得到retinanet_classes.csv,retinanet_test.csv和retinanet_train.csv。

在retinanet_classses.csv中,由于只識別PDF文檔中的表,所以只有到一個class,即class 0。

如果你在打標簽的過程中加入頁眉頁腳等標簽,相應能得到多個class。

完整的文件和文件夾結構的列表:

然后,將retinanet_classes.csv,retinanet_test.csv,retinanet_train.csv,train.txt和test.txt 導入keras-retinanet的根文件夾中:

接下來,運行Colab TrainOCR,可以根據要訓練的JPG文件數量來調整訓練的epoch數量。

訓練完成后,就會得到權重文件output.h5,下載此文件并將其保存到本地主機。后面將使用該文件來運行測試。

這里需要注意的一點是,在Colab中,已將文件上傳到Git并進行了Git克隆。

運行測試

運行測試前,還需要安裝處理PDF文件必要的庫。

PyPDF2是一個python工具庫,能夠提取文檔信息,裁剪頁面等。

使用以下命令安裝此庫:

pip install PyPDF2

Camelot是專門用于解析PDF頁面表格的python庫。

使用以下命令安裝此庫:

pip install camelot-py[cv]

PDF2IMG是將Python轉換為PIL Image對象的python庫。

使用以下命令安裝此庫:

pip install pdf2imag

在運行預測之前,需要使用從訓練中獲得的權重文件output.h5加載模型,并從retinanet_classes.csv定義標簽class 0。

model_path = ‘output.h5’model = models.load_model(model_path, backbone_name=’resnet50’)labels = ‘retinanet_classes.csv’LABELS = open(labels).read().strip().split(‘\n’)LABELS = {int(L.split(‘,’)[1]): L.split(‘,’)[0] for L in LABELS}print(LABELS){0: ‘tabel’}

接下來運行測試

import numpy as npimport cv2import matplotlib.pyplot as pltimage_path = imgfname#image = cv2.imread(image_path)image = read_image_bgr(image_path)image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)output = image.copy()output = cv2.cvtColor(output, cv2.COLOR_BGR2RGB)print(output.shape) # row (height) x column (width) x color (3)image = preprocess_image(image)(image, scale) = resize_image(image)image = np.expand_dims(image, axis=0)# detect objects in the input image and correct for the image scale(boxes, scores, labels) = model.predict_on_batch(image)boxes /= scaleconfidence =  0.2from google.colab.patches import cv2_imshowimport matplotlib.pyplot as pltlabel_out = []result = ""# loop over the detectionsfor (box, score, label) in zip(boxes[0], scores[0], labels[0]):  # filter out weak detections  if score < confidence:    continue  # convert the bounding box coordinates from floats to integers  box = box.astype("int")  # build the label and draw the label + bounding box on the output  # image  labeli = label  label = "{}: {:.2f}".format(LABELS[label], score)  print(label)  if LABELS[labeli] not in label_out:      label_out.append(LABELS[labeli])      cv2.rectangle(output, (box[0], box[1]), (box[2], box[3]), (255, 0, 0), 12)      print(box[0])      print(box[1])      print(box[2])      print(box[3])      #result            cv2.putText(output, label, (box[0], box[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 4.5, (255, 1, 1), 12)plt.figure(figsize=(20, 20))plt.imshow(output)plt.show()

如果檢測的表格,模型會在邊界框(bounding box)標出表格邊框:

邊界框坐標(x1,y1,x2,y2),將table_area輸入到Camelot read_pdf函數中,table_area是已標準化的邊界框。

interesting_areas=[]output = [[x1, y1, x2, y2]]for x in output:  [x1, y1, x2, y2] = bboxes_pdf(img, pdf_page, x)  bbox_camelot = [            ",".join([str(x1), str(y1), str(x2), str(y2)])        ][0]  # x1,y1,x2,y2 where (x1, y1) -> left-top and (x2, y2) -> right-bottom in PDF coordinate space        #print(bbox_camelot)  interesting_areas.append(bbox_camelot)print(interesting_areas)output_camelot = camelot.read_pdf(    filepath=pdf_file, pages=str(pg), flavor="stream", table_areas=interesting_areas)output_camelot[0].df

這樣就可以將表格數據轉化為Panda數據框架,方便后續處理:

圖片怎么辦

針對掃描圖片格式的PDF表格,可以使用Ocrmypdf包來將圖片格式PDF轉為文本格式。

Ocrmypdf是一個python軟件包,可將基于圖像的pdf轉換為基于文本的PDF。

安裝ocrmypdf,可以通過以下命令行將其用于macOS和Linux:

brew?install?ocrmypdf

通過以下命令調用:

ocrmypdf input_file.pdf output_file.pdf

之后就可以按照上面的方法進行表格提取了。

怎么樣,這款兼容圖片,又能白嫖谷歌GPU的PDF表格工具對你有幫助嗎?

傳送門

項目地址:
https://github.com/ferrygun/PDFTableExtract

在線打標簽工具:
https://www.makesense.ai/

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
国产极品视频在线观看| 97色伦亚洲国产| 日韩高清专区| 久久午夜免费电影| 国产精品久久久久久久久免费看| 中国a一片一级一片| 日韩美女视频在线观看| 五月婷婷伊人网| 久久伦理网站| 国产精品国产三级国产普通话蜜臀| 伊人色综合影院| 久久综合给合久久狠狠狠97色69| 亚洲欧洲日产国码无码久久99| 99国产精品久久久久| 国产 欧美 日韩 一区| 国产成人综合在线播放| 高清视频一区二区三区| 91一区二区视频| 国产精品久久久久7777婷婷| 精品一区二区精品| 男人天堂网站在线| 久久综合久久99| 妺妺窝人体色www看人体| 欧美日韩免费不卡视频一区二区三区 | 亚洲午夜国产一区99re久久| 91av免费观看| 久久精品福利视频| 国产在线不卡视频| 黑人巨大国产9丨视频| 欧美日本一区二区| 亚洲a视频在线| 日韩精品免费播放| 欧美国产精品日韩| 国产99一区视频免费| 大乳护士喂奶hd| 午夜精品久久久久久久男人的天堂 | 欧美电影影音先锋| 日韩va亚洲va欧美va清高| 亚洲伊人一本大道中文字幕| 亚洲综合在线视频| 国产精品国产三级国产aⅴ| 亚洲春色在线视频| 国产高清视频免费| 久久亚洲一区| 中文字幕第3页| 久久久久久国产三级电影| 成人ar影院免费观看视频| 成人黄色综合网站| 国产视频精品久久久| 精品国产乱码久久久久久老虎| 欧美色偷偷大香| 成人免费一级片| 成人va在线观看| 2023国产精品视频| 亚洲一二三级电影| 日韩精品中文在线观看| 亚洲黄色免费三级| 国产精品久久久久久久久久新婚| 3d蒂法精品啪啪一区二区免费| 精品视频一区在线| 欧美又黄又嫩大片a级| 福利视频一二区| 日日干日日操日日射| 中文字幕超清在线免费观看| 日韩精品久久一区| 亚洲一区不卡在线| 日韩福利影院| 五月婷婷一区| 看av免费毛片手机播放| 亚洲男人天堂2021| 大地资源二中文在线影视观看| 国产一级二级毛片| 少妇精品高潮欲妇又嫩中文字幕| 99国产精品久久久久久久久久| 奇米四色…亚洲| 久久精品综合| av网站免费大全| 国产亚洲一区二区在线观看| 亚洲欧美在线播放| 欧美综合激情| 91人妻一区二区三区蜜臀| 国产一区二区日韩精品| 欧美一区二区三级| 国产精品大全| 亚洲日本精品视频| 激情五月婷婷综合网| 制服视频三区第一页精品| 国产精品一 二 三| www.涩涩爱| 成人性视频网站| 亚洲欧美日韩成人| 三年中文高清在线观看第6集 | 国产精品视频福利| 国产又爽又黄无码无遮挡在线观看| 日本亚洲天堂网| 亚洲国产精品美女| 在线免费观看一区二区三区| 精品成人久久久| 亚洲精品亚洲人成人网| 国产精品久久久久久久久久久久久久 | 中文字幕中文字幕一区| 久久91精品国产91久久跳| 免费无遮挡无码永久视频| 中文字幕在线视频第一页| 精品露脸国产偷人在视频| 亚洲va久久久噜噜噜久久天堂| 黄色免费视频网站| k8久久久一区二区三区| 欧美高清视频免费观看| 九九热视频免费| 国产在线播放一区三区四| 在线精品91av| 2025韩国理伦片在线观看| 欧美亚洲精品在线观看| 精品久久一区二区| 国产不卡一区二区视频| 亚洲第一精品网站| 亚洲第一免费网站| 大陆av在线播放| 免费观看国产精品| 国产丝袜一区二区三区免费视频| 日韩免费视频播放| 久久男女视频| 日韩中文字幕在线观看| 亚洲第一成肉网| 成人sese在线| 国产精品88a∨| 成人免费视频网站入口::| 亚洲国产精品嫩草影院| 日本高清久久一区二区三区| 亚洲天堂视频网| 精品国产露脸精彩对白| 国产欧美高清在线| 国产成人免费xxxxxxxx| 97成人在线视频| 国内毛片毛片毛片毛片毛片| 精品久久香蕉国产线看观看gif| 黑人巨大精品欧美一区二区小视频| 天堂在线免费观看视频| 日韩一区二区三区电影在线观看 | 日韩av在线播放资源| 国产真实乱子伦| 国产a久久麻豆| 国产精品视频久久久| 日韩美女视频网站| 日韩亚洲欧美综合| 爱情岛论坛亚洲首页入口章节| 国产一区视频导航| 国产日韩视频在线观看| 狠狠人妻久久久久久综合| 欧美大黄免费观看| 无码人妻一区二区三区在线视频| 国产欧美综合色| 精品无人乱码一区二区三区的优势| 国产男人搡女人免费视频| 国产视频自拍一区| 波多野结衣 在线| 色呦呦国产精品| 无码人妻h动漫| 久久无码av三级| 99在线视频免费观看| 国产又大又粗又硬| 久国内精品在线| 九九九免费视频| 亚洲第一页在线| 国产精品无码电影| 一本久久a久久精品亚洲| av动漫在线看| 国产精品免费看片| 色哺乳xxxxhd奶水米仓惠香| 国产大陆精品国产| 久久草视频在线看| 久久超碰97中文字幕| 亚洲999一在线观看www| 丰满人妻一区二区三区免费视频| 久久久久这里只有精品| 日韩av黄色片| 色系列之999| 久久久久亚洲av成人片| 国产亚洲精品美女久久久| 干b视频在线观看| 日韩欧美国产精品一区| 白丝女仆被免费网站| 欧美一区二区成人| 色欲av无码一区二区三区| 在线播放/欧美激情| 菠萝菠萝蜜网站| 91精品国产丝袜白色高跟鞋| 黑人巨大精品欧美| 亚洲国产黄色片| 精品伦精品一区二区三区视频密桃| 欧美一级高清片在线观看| 国产激情视频网站| 欧美va亚洲va香蕉在线| 亚洲毛片亚洲毛片亚洲毛片| 亚洲成人av片| 青娱乐91视频| 欧美精品一本久久男人的天堂| 秋霞av一区二区三区| 久久久久久久国产精品视频| 国产精品高潮呻吟久久久| 日韩美女视频免费在线观看| 手机看片一区二区三区| 精品伦理一区二区三区| 99国产精品国产精品毛片| 日本免费在线视频观看| 亚洲精品国产精华液| 亚洲精品成人在线播放| 制服.丝袜.亚洲.中文.综合| 日本成人免费在线观看| 久久好看免费视频| 国产普通话bbwbbwbbw| 91免费在线视频网站| 国产乱码精品1区2区3区| 懂色av一区二区三区四区五区| 国产精品久久看| 中文字幕 欧美日韩| 日韩一区二区三| 久久免费精彩视频| 97久久精品在线| 蜜臀精品久久久久久蜜臀 | 在线电影欧美日韩一区二区私密| 偷偷操不一样的久久| 国产精品96久久久久久又黄又硬| 毛片一区二区三区| 福利在线一区二区| 在线观看免费一区| 黄色一级片在线免费观看| 国外成人在线直播| 精品一区二区三区香蕉蜜桃| 人妻少妇精品无码专区二区 | 国产成人aaa| 黄色av免费在线播放| 精品久久一二三区| 男人天堂视频网| 精品日本一区二区| 亚洲精品国产成人久久av盗摄| 最近中文字幕无免费| 欧美激情手机在线视频 | 妺妺窝人体色www婷婷| 国产精品色视频| 久久一区二区三区国产精品| 免费黄色av网址| 色爱av美腿丝袜综合粉嫩av| 亚洲人午夜射精精品日韩| 丁香六月激情网| 日韩美女视频一区二区在线观看| 91黑人精品一区二区三区| 久久久久久久久久码影片| 亚洲综合一区二区精品导航| 五月综合色婷婷| 成人黄色免费在线观看| 中文一区在线播放| 亚洲自拍偷拍图| 国产成人精品av| 国产午夜精品久久久久久久| 成人免费无码大片a毛片| 国产做受高潮69| 成av人片一区二区| 国产大学生av| 91精品国产高清久久久久久久久 | 亚洲精品在线一区二区| 国产wwwwwww| 成人免费性视频| 日韩精品欧美国产精品忘忧草 | 国产在线观看免费播放| 57pao成人国产永久免费| 久久综合给合久久狠狠狠97色69| 日韩网站在线播放| 91精品视频在线看| 亚洲成av人片在线| 精品人妻一区二区色欲产成人| 欧美日韩精品免费观看| 日韩一区二区三区观看| 神马午夜精品95 | 97se在线视频| 天天影视涩香欲综合网| 最近日韩免费视频| 免费观看国产精品视频| 中文字幕v亚洲ⅴv天堂| 成人自拍视频在线观看| a级在线免费观看| 国产精品高清一区二区三区| 欧美日韩一区二区在线观看视频| 在线观看毛片视频| av在线com| 久久久av一区| 国产精品国产三级国产有无不卡 | 91小视频网站| 久久久久久久久爱| 一区二区三区高清| 久久久久久久亚洲| 久热免费在线观看| 青青久久av北条麻妃海外网| 亚洲福利视频三区| www.五月婷婷| 亚洲AV无码久久精品国产一区| 国产精品视频专区| 欧美三级一区二区| 日韩av高清在线观看| 中文字幕免费视频| 亚洲高清视频在线观看| 中文字幕欧美日韩| |精品福利一区二区三区| 中文人妻熟女乱又乱精品| 午夜两性免费视频| 91理论片午午论夜理片久久| 欧美一激情一区二区三区| 国产资源在线一区| 妺妺窝人体色www在线下载| 国产免费黄色一级片| 性色av一区二区三区免费| 午夜视频在线观看一区二区三区| 日本激情一区二区| 亚洲av成人无码久久精品| 一区二区三区四区五区精品| 久久国产精品久久久| 午夜亚洲福利老司机| 日韩激情一区二区| 青青草原在线免费观看视频| av天堂永久资源网| 91日韩在线播放| 亚洲精选一区二区| 亚洲一区二区三区四区不卡| 日韩影院精彩在线| 天天天天天天天天操| 日本丰满少妇xxxx| 91免费观看网站| 亚洲视频第一页| 天天色天天爱天天射综合| 精品一区二区三区久久| 欧美精品亚洲精品日韩精品| 在线看免费毛片| 日韩偷拍一区二区| 欧美制服第一页| 亚洲精品电影久久久| 亚洲国产日产av| 丰满放荡岳乱妇91ww| 999av视频| avtt天堂在线| 激情成人在线观看| 亚洲精品一区二区三区四区五区| 91精品国产亚洲| 亚洲精品ady| 精品国产老师黑色丝袜高跟鞋| 国产精品99久久久久久有的能看| 中文字幕视频二区| 夫妻性生活毛片| 国产不卡的av| 青青草国产精品视频| 国产一区二区精品免费| 97精品视频在线播放| 亚洲欧洲在线免费| 欧美性大战久久| 亚洲码国产岛国毛片在线| 岛国精品在线观看| 秋霞av鲁丝片一区二区| 亚洲精品视频在线观看免费视频| 在线观看国产免费视频| 国产精品无码专区av在线播放| 热re99久久精品国99热蜜月| 国产欧美一区二区三区四区| 欧美黄色免费网站| 国产视频综合在线| 欧美大胆人体bbbb| 在线中文字幕一区| 一区二区三区免费观看| 91啪九色porn原创视频在线观看| 日韩综合小视频| 国产日韩欧美中文字幕| 国产无套粉嫩白浆内谢| 国产熟女一区二区| www.四虎在线| 久久久精品高清| 国产精品一区二区免费在线观看| 正在播放91九色| 精品无人乱码一区二区三区的优势| 国产精品一区二区三区久久| 国语自产精品视频在线看| 色综合亚洲精品激情狠狠| 日韩精品在线看片z| 欧美日本一道本在线视频| 日本高清视频一区二区| 亚洲国产欧美在线| 亚洲欧美另类在线| 中文字幕av一区二区三区高| 99国产精品久久久久久久久久 | 青青青在线免费观看| 97香蕉碰碰人妻国产欧美| 亚洲第一成肉网| 久久婷婷中文字幕| 亚洲精品中文字幕乱码无线| 伊人影院综合在线| 邪恶网站在线观看| 91高清国产视频| 手机看片福利日韩| 亚洲免费一级视频| 日本激情综合网| 91小视频在线播放| 国产毛片久久久久久| 国产又粗又猛又爽又黄| 国产在线观看免费播放| 荫蒂被男人添免费视频| xxxx国产视频| 亚洲欧美日韩色| 中文字幕在线观看的网站| 欧美人与禽zoz0善交| 欧美色图亚洲视频| 精品国产乱码一区二区| 精品国产一区二区三区四|