欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

C# 提取PDF中的表格詳情

 更新時(shí)間:2021年10月20日 08:31:40   作者:E-iceblue  
這篇文章主要給大家介紹C# 提取PDF中的表格,本文介紹在C#程序中(附VB.NET代碼)提取PDF中的表格的方法,調(diào)用Spire.PDF for .NET提供的提取表格的 類 以及 方法 等來獲取表格單元格中的文本內(nèi)容,需要的朋友可以參考一下

1、簡單介紹

本文介紹在C#程序中(附VB.NET代碼)提取PDF中的表格的方法,調(diào)用Spire.PDF for .NET提供的提取表格的 類 以及 方法 等來獲取表格單元格中的文本內(nèi)容;代碼內(nèi)容中涉及到的主要類及方法歸納如下表,供參考:

類型

描述

PdfDocument Class

Represents a pdf document model.

PdfDocument.LoadFromFile(string filename) Method

Loads a PDF document.

PdfTableExtractor Class

Represents the PDF table extractor.

PdfTable Class

Defines a PDF table.

PdfTableExtractor. ExtractTable(int pageIndex) Method

Extracts table from page.

PdfTable.GetText(int rowIndex,int columnIndex) Method

Gets Text in cell.

File.WriteAllText() Method

Saves extracted text in table to a .txt file.

2、環(huán)境配置

  • Visual Studio 2017
  •   .net framework 4.6.1
  •   PDF測試文檔
  •   庫:Spire.PDF for .NET 7.10.4

引用dll文件的2種方法:

方法1 :通過 NuGet 安裝。

【步驟】

鼠標(biāo)右鍵點(diǎn)擊“引用”,“管理NuGet程序包”,

點(diǎn)擊“瀏覽”,在搜索框中輸入,點(diǎn)擊“安裝”,

或者使用PM控制臺(tái)安裝:

PM>Install-Package Spire.PDF -Version 7.10.4 

方法2 :手動(dòng)添加引用。

【步驟】

鼠標(biāo)右鍵點(diǎn)擊“引用”,“添加引用”,

點(diǎn)擊“瀏覽”,“瀏覽”,將本地路徑下的dll文件(需提前 下載 到本地,并解壓)添加到引用列表

點(diǎn)擊OK,完成引用:

3、代碼示例

C#

using Spire.Pdf;
using Spire.Pdf.Utilities;
using System.IO;
using System.Text;

namespace ExtractTable
{
    class Program
    {
        static void Main(string[] args)
        {
            //加載PDF文檔
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("sample.pdf");
            StringBuilder builder = new StringBuilder();

            //抽取表格
            PdfTableExtractor extractor = new PdfTableExtractor(pdf);
            PdfTable[] tableLists = null;
            for (int pageIndex = 0; pageIndex < pdf.Pages.Count; pageIndex++)
            {
                tableLists = extractor.ExtractTable(pageIndex);
                if (tableLists != null && tableLists.Length > 0)
                {
                    foreach (PdfTable table in tableLists)
                    {
                        int row = table.GetRowCount();
                        int column = table.GetColumnCount();
                        for (int i = 0; i < row; i++)
                        {
                            for (int j = 0; j < column; j++)
                            {
                                string text = table.GetText(i, j);
                                builder.Append(text + " ");
                            }
                            builder.Append("\r\n");
                        }
                    }
                }
            }

            //保存提取的表格內(nèi)容到txt文檔
            File.WriteAllText("ExtractedTable.txt", builder.ToString());
        }
    }
}


VB.NET

Imports Spire.Pdf
Imports Spire.Pdf.Utilities
Imports System.IO
Imports System.Text

Namespace ExtractTable
    Class Program
        Private Shared Sub Main(args As String())
            '加載PDF文檔
            Dim pdf As New PdfDocument()
            pdf.LoadFromFile("sample.pdf")
            Dim builder As New StringBuilder()

            '抽取表格
            Dim extractor As New PdfTableExtractor(pdf)
            Dim tableLists As PdfTable() = Nothing
            For pageIndex As Integer = 0 To pdf.Pages.Count - 1
                tableLists = extractor.ExtractTable(pageIndex)
                If tableLists IsNot Nothing AndAlso tableLists.Length > 0 Then
                    For Each table As PdfTable In tableLists
                        Dim row As Integer = table.GetRowCount()
                        Dim column As Integer = table.GetColumnCount()
                        For i As Integer = 0 To row - 1
                            For j As Integer = 0 To column - 1
                                Dim text As String = table.GetText(i, j)
                                builder.Append(text & Convert.ToString(" "))
                            Next
                            builder.Append(vbCr & vbLf)
                        Next
                    Next
                End If
            Next

            '保存提取的表格內(nèi)容到txt文檔
            File.WriteAllText("ExtractedTable.txt", builder.ToString())
        End Sub
    End Class
End Namespace

表格內(nèi)容提取結(jié)果:

其他注意事項(xiàng):

  • 代碼中的PDF文件以及生成的.txt文件路徑為 F:\VS2017Project\ExtractTable\bin\Debug\sample.pdf F:\VS2017Project\ ExtractTable\bin\Debug\ExtractedTable.txt。文件路徑也可以自定義為其他路徑。
  • 注意使用的dll文件版本。低于7.10.4的其他版本不支持提取表格。

到此這篇關(guān)于C# 提取PDF中的表格詳情的文章就介紹到這了,更多相關(guān)C# 提取PDF中的表格內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • C#實(shí)現(xiàn)簡單的飛行棋小游戲

    C#實(shí)現(xiàn)簡單的飛行棋小游戲

    這篇文章主要為大家詳細(xì)介紹了C#實(shí)現(xiàn)簡單的飛行棋小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下<BR>
    2021-11-11
  • C#開發(fā)Winform實(shí)現(xiàn)窗體間相互傳值

    C#開發(fā)Winform實(shí)現(xiàn)窗體間相互傳值

    這篇文章介紹了C#開發(fā)Winform實(shí)現(xiàn)窗體間相互傳值的方法,文中通過示例代碼介紹的非常詳細(xì)。對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2022-03-03
  • C# JavaScriptSerializer序列化時(shí)的時(shí)間處理詳解

    C# JavaScriptSerializer序列化時(shí)的時(shí)間處理詳解

    這篇文章主要為大家詳細(xì)介紹了C# JavaScriptSerializer序列化時(shí)的時(shí)間處理詳解,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2017-08-08
  • C#連接Oracle的方法實(shí)例總結(jié)

    C#連接Oracle的方法實(shí)例總結(jié)

    這篇文章主要介紹了C#連接Oracle的方法,結(jié)合實(shí)例形式總結(jié)分析了幾種常見的C#連接Oracle數(shù)據(jù)庫的操作技巧與相關(guān)注意事項(xiàng),需要的朋友可以參考下
    2017-06-06
  • 詳解C#泛型的類型參數(shù)約束

    詳解C#泛型的類型參數(shù)約束

    這篇文章主要介紹了C#泛型的類型參數(shù)約束的相關(guān)資料,文中講解非常細(xì)致,幫助大家更好的理解和學(xué)習(xí)c#,感興趣的朋友可以了解下
    2020-07-07
  • C#基于基姆拉爾森算法計(jì)算指定日期是星期幾的方法

    C#基于基姆拉爾森算法計(jì)算指定日期是星期幾的方法

    這篇文章主要介紹了C#基于基姆拉爾森算法計(jì)算指定日期是星期幾的方法,實(shí)例分析了基姆拉爾森算法的原理與使用技巧,非常具有實(shí)用價(jià)值,需要的朋友可以參考下
    2015-04-04
  • C# PDF Page操作設(shè)置頁面切換按鈕的方法

    C# PDF Page操作設(shè)置頁面切換按鈕的方法

    這篇文章主要介紹了C# PDF Page操作設(shè)置頁面切換按鈕的方法,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下
    2018-05-05
  • C#設(shè)置WinForm中DataGrid列的方法(列寬/列標(biāo)題等)

    C#設(shè)置WinForm中DataGrid列的方法(列寬/列標(biāo)題等)

    這篇文章主要介紹了C#設(shè)置WinForm中DataGrid列的方法,包括列寬、列標(biāo)題等部分,并分析了其中相關(guān)的操作技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下
    2015-07-07
  • c#得到本月有幾周和這幾周的起止時(shí)間示例代碼

    c#得到本月有幾周和這幾周的起止時(shí)間示例代碼

    本篇文章主要是對c#得到本月有幾周和這幾周的起止時(shí)間的示例代碼進(jìn)行了介紹,需要的朋友可以過來參考下,希望對大家有所幫助
    2014-01-01
  • C#生成帶logo的二維碼

    C#生成帶logo的二維碼

    帶logo的二維碼生成分為兩步驟:首先根據(jù)輸入的內(nèi)容生成二維碼圖片,然后讀取本地的logo圖片,通過圖片處理生成帶logo的二維碼。本文對此進(jìn)行介紹,具有很好的參考價(jià)值,下面跟著小編一起來看下吧
    2017-02-02

最新評論