快捷導(dǎo)航

詳解C#如何提取PDF文檔中的圖片

更新時(shí)間：2025年04月03日 15:54:28 作者：Eiceblue

提取圖片可以將這些圖像資源進(jìn)行單獨(dú)保存,方便后續(xù)在不同的項(xiàng)目中使用,下面我們就來(lái)看看如何使用C#通過(guò)代碼從PDF文檔中提取圖片吧

當(dāng) PDF 文件中包含有價(jià)值的圖片，如藝術(shù)畫作、設(shè)計(jì)素材、報(bào)告圖表等，提取圖片可以將這些圖像資源進(jìn)行單獨(dú)保存，方便后續(xù)在不同的項(xiàng)目中使用，避免每次都要從 PDF 中查找。本文將介紹如何使用C#通過(guò)代碼從PDF文檔中提取圖片，包含以下兩個(gè)示例：

提取PDF圖片需要用到 Spire.PDF for .NET 庫(kù)?？梢酝ㄟ^(guò)此鏈接下載產(chǎn)品包后手動(dòng)添加引用，或者直接通過(guò)NuGet安裝。

C# 提取指定 PDF 頁(yè)面中的圖片

PdfImageHelper 類可用于幫助用戶管理 PDF 文檔中的圖像，要從某個(gè)指定的PDF頁(yè)面中提取圖片，參考以下步驟：

使用 PdfDocument 類的 LoadFromFile() 方法加載 PDF 文件。

通過(guò) PdfDocument 類的 Pages[index] 屬性獲取指定頁(yè)面。

創(chuàng)建 PdfImageHelper 對(duì)象，然后使用其 GetImagesInfo() 方法獲取頁(yè)面中圖像信息集合。

遍歷圖像信息集合，并使用 PdfImageInfo.Image.Save() 方法將每一張圖片以PNG格式儲(chǔ)存到指定文件路徑。

C# 代碼：

using Spire.Pdf;
using Spire.Pdf.Utilities;
using System.Drawing;

namespace ExtractImagesFromSpecificPage
{
    class Program
    {
        static void Main(string[] args)
        {
            // 加載PDF文檔
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("E:\\PythonPDF\\AI.pdf");

            // 獲取第一頁(yè)
            PdfPageBase page = pdf.Pages[0];

            // 創(chuàng)建PdfImageHelper對(duì)象
            PdfImageHelper imageHelper = new PdfImageHelper();

            // 獲取頁(yè)面上的圖片信息 
            PdfImageInfo[] imageInfos = imageHelper.GetImagesInfo(page);

            // 遍歷圖片信息
            for (int i = 0; i < imageInfos.Length; i++)
            {
                // 獲取某個(gè)指定圖片信息
                PdfImageInfo imageInfo = imageInfos[i];

                // 獲取指定圖片
                Image image = imageInfo.Image;

                // 將圖片保存為png格式
                image.Save("圖片\\圖-" + i + ".png");
            }

            pdf.Dispose();
        }
    }
}

C# 提取PDF 文檔中所有圖片

要獲取整個(gè)PDF文檔中的圖片，就需要遍歷每一頁(yè)然后再提取，具體參考以下步驟：

使用 PdfDocument 類的 LoadFromFile() 方法加載 PDF 文件。
創(chuàng)建 PdfImageHelper 對(duì)象。
遍歷文檔中的每一個(gè)頁(yè)面。
通過(guò) PdfDocument 類的 Pages[index] 屬性獲取指定頁(yè)面。
使用 PdfImageHelper.GetImagesInfo() 方法獲取頁(yè)面中圖像信息集合。
遍歷圖像信息集合，并使用 **PdfImageInfo.Image.Save()**方法將每一張圖片以PNG格式儲(chǔ)存到指定文件路徑。

C# 代碼：

using Spire.Pdf;
using Spire.Pdf.Utilities;
using System.Drawing;

namespace ExtractAllImages
    {
        class Program
        {
            static void Main(string[] args)
            {
                // 加載PDF文檔
                PdfDocument pdf = new PdfDocument();
                pdf.LoadFromFile("E:\\PythonPDF\\AI.pdf");

                // 創(chuàng)建PdfImageHelper對(duì)象
                PdfImageHelper imageHelper = new PdfImageHelper();

                int m = 0;
                // 遍歷PDF頁(yè)面
                for (int i = 0; i < pdf.Pages.Count; i++)
                {
                    // 獲取指定頁(yè)面
                    PdfPageBase page = pdf.Pages[i];

                    // 獲取頁(yè)面上的圖片信息 
                    PdfImageInfo[] imageInfos = imageHelper.GetImagesInfo(page);

                    // 遍歷圖片信息
                    for (int j = 0; j < imageInfos.Length; j++)
                    {
                        // 獲取某個(gè)指定圖片信息
                        PdfImageInfo imageInfo = imageInfos[j];

                        // 獲取指定圖片
                        Image image = imageInfo.Image;

                        // 將圖片保存為png格式
                        image.Save("PDF圖片\\圖-" + m + ".png");
                        m++;
                    }

                }

                pdf.Dispose();
            }
        }
    }