欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python利用pdfplumber庫提取pdf中表格數(shù)據(jù)

 更新時(shí)間:2023年05月29日 10:04:59   作者:空空star  
pdfplumber是一個(gè)用于從PDF文檔中提取文本和表格數(shù)據(jù)的Python庫,它可以幫助用戶輕松地從PDF文件中提取有用的信息,例如表格、文本、元數(shù)據(jù)等,本文介紹了如何通過Python的pdfplumber庫提取pdf中表格數(shù)據(jù),感興趣的同學(xué)可以參考一下

一、pdfplumber庫是什么?

pdfplumber是一個(gè)用于從PDF文檔中提取文本和表格數(shù)據(jù)的Python庫。它可以幫助用戶輕松地從PDF文件中提取有用的信息,例如表格、文本、元數(shù)據(jù)等。pdfplumber庫的特點(diǎn)包括:簡(jiǎn)單易用、速度快、支持多種PDF文件格式、支持從多個(gè)頁面中提取數(shù)據(jù)等。pdfplumber庫還提供了一些方便的方法來處理提取的數(shù)據(jù),例如排序、過濾和格式化等。它是一個(gè)非常有用的工具,特別是在需要從大量PDF文件中提取數(shù)據(jù)時(shí)。

二、安裝pdfplumber庫

pip install pdfplumber

三、查看pdfplumber庫版本

pip show pdfplumber

Name: pdfplumber
Version: 0.9.0
Summary: Plumb a PDF for detailed information about each char, rectangle, and line.
Home-page: https://github.com/jsvine/pdfplumber
Author: Jeremy Singer-Vine
Author-email: jsvine@gmail.com
License:
Requires: pdfminer.six, Pillow, Wand
Required-by:

四、提取pdf中表格數(shù)據(jù)

1.引入庫

import pdfplumber

2.定義pdf文件路徑

local = '/Users/kkstar/Downloads/'

3.打開pdf文件

with pdfplumber.open(local+"demo_table.pdf") as pdf:

4.獲取pdf文件中的頁數(shù)

num_pages = len(pdf.pages)

5.遍歷每一頁

for page_num in range(num_pages):

6.獲取當(dāng)前頁內(nèi)容

page = pdf.pages[page_num]

7.提取表格數(shù)據(jù)

        table = page.extract_table(table_settings={
            "vertical_strategy": "lines",
            "horizontal_strategy": "lines",
            "intersection_x_tolerance": 15,
            "intersection_y_tolerance": 15
        })

8.輸出表格數(shù)據(jù)

        for row in table:
            print(row)

9.效果

['username', 'nickname', 'article']
['weixin_38093452', '空空 star', '130889268']
['weixin_38093452', '空空 star', '130852811']
['weixin_38093452', '空空 star', '130815851']
Process finished with exit code 0

到此這篇關(guān)于Python利用pdfplumber庫提取pdf中表格數(shù)據(jù)的文章就介紹到這了,更多相關(guān)Python提取pdf表格數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python基礎(chǔ)之類的定義和使用詳解

    Python基礎(chǔ)之類的定義和使用詳解

    在Python中,類表示具有相同屬性和方法的對(duì)象的集合。在使用類時(shí),需要先定義類,然后再創(chuàng)建類的實(shí)例,通過類的實(shí)例就可以訪問類中的屬性和方法了。本文就來和大家一起聊聊Python中類的定義和使用,需要的可以參考一下
    2022-08-08
  • Python實(shí)現(xiàn)批量識(shí)別圖片文字并存為Excel

    Python實(shí)現(xiàn)批量識(shí)別圖片文字并存為Excel

    批量文字識(shí)別是Python辦公自動(dòng)化的基本操作,應(yīng)用在我們工作生活中的方方面面。本文主要以開源免費(fèi)的easyocr來實(shí)現(xiàn)批量識(shí)別圖片文字并存為Excel,感興趣的可以學(xué)習(xí)一下
    2022-06-06
  • 基于Python函數(shù)的作用域規(guī)則和閉包(詳解)

    基于Python函數(shù)的作用域規(guī)則和閉包(詳解)

    下面小編就為大家分享一篇基于Python函數(shù)的作用域規(guī)則和閉包詳解,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2017-11-11
  • windows系統(tǒng)多個(gè)python中更改默認(rèn)python版本

    windows系統(tǒng)多個(gè)python中更改默認(rèn)python版本

    這篇文章主要給大家介紹了關(guān)于windows系統(tǒng)多個(gè)python中更改默認(rèn)python版本的相關(guān)資料,在Python開發(fā)中,不同的項(xiàng)目往往需要使用不同的Python版本,需要的朋友可以參考下
    2023-09-09
  • Python中的程序流程控制語句

    Python中的程序流程控制語句

    這篇文章主要介紹了Python中的程序流程控制語句,本篇博客將會(huì)講述一下Python語言中的流程控制語句,在高中我們數(shù)學(xué)中學(xué)過程序流程題,下面我們來看看python中得流程語句會(huì)是怎么樣呢,需要的小伙伴可以參考一下
    2022-02-02
  • PyQt5 實(shí)現(xiàn)狀態(tài)欄永久顯示消息

    PyQt5 實(shí)現(xiàn)狀態(tài)欄永久顯示消息

    這篇文章主要介紹了PyQt5 實(shí)現(xiàn)狀態(tài)欄永久顯示消息的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • python?random模塊常用函數(shù)基礎(chǔ)教程

    python?random模塊常用函數(shù)基礎(chǔ)教程

    這篇文章主要為大家介紹了python?random模塊常用函數(shù)基礎(chǔ)教程,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-06-06
  • Python中字符串轉(zhuǎn)換為列表的常用方法總結(jié)

    Python中字符串轉(zhuǎn)換為列表的常用方法總結(jié)

    本文將詳細(xì)介紹Python中將字符串轉(zhuǎn)換為列表的八種常用方法,每種方法都具有其獨(dú)特的用途和適用場(chǎng)景,文中的示例代碼講解詳細(xì),感興趣的可以了解下
    2023-11-11
  • Python打開與讀取文件操作的常用方法

    Python打開與讀取文件操作的常用方法

    這篇文章主要介紹了Python打開與讀取文件操作的常用方法,通過編寫代碼自動(dòng)化操作文件,讀寫文件、打開文件、寫入文件、刪除文件一系列都稱作為電腦的操作,需要的朋友可以參考下
    2023-07-07
  • python 6種方法實(shí)現(xiàn)單例模式

    python 6種方法實(shí)現(xiàn)單例模式

    這篇文章主要介紹了python 6種方法實(shí)現(xiàn)單例模式,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2020-12-12

最新評(píng)論