詳解C#如何提取PDF文檔中的圖片
當(dāng) PDF 文件中包含有價(jià)值的圖片,如藝術(shù)畫(huà)作、設(shè)計(jì)素材、報(bào)告圖表等,提取圖片可以將這些圖像資源進(jìn)行單獨(dú)保存,方便后續(xù)在不同的項(xiàng)目中使用,避免每次都要從 PDF 中查找。本文將介紹如何使用C#通過(guò)代碼從PDF文檔中提取圖片,包含以下兩個(gè)示例:
提取PDF圖片需要用到 Spire.PDF for .NET 庫(kù)??梢酝ㄟ^(guò)此鏈接下載產(chǎn)品包后手動(dòng)添加引用,或者直接通過(guò)NuGet安裝。
C# 提取指定 PDF 頁(yè)面中的圖片
PdfImageHelper 類(lèi)可用于幫助用戶(hù)管理 PDF 文檔中的圖像,要從某個(gè)指定的PDF頁(yè)面中提取圖片,參考以下步驟:
使用 PdfDocument 類(lèi)的 LoadFromFile() 方法加載 PDF 文件。
通過(guò) PdfDocument 類(lèi)的 Pages[index] 屬性獲取指定頁(yè)面。
創(chuàng)建 PdfImageHelper 對(duì)象,然后使用其 GetImagesInfo() 方法獲取頁(yè)面中圖像信息集合。
遍歷圖像信息集合,并使用 PdfImageInfo.Image.Save() 方法將每一張圖片以PNG格式儲(chǔ)存到指定文件路徑。
C# 代碼:
using Spire.Pdf; using Spire.Pdf.Utilities; using System.Drawing; namespace ExtractImagesFromSpecificPage { class Program { static void Main(string[] args) { // 加載PDF文檔 PdfDocument pdf = new PdfDocument(); pdf.LoadFromFile("E:\\PythonPDF\\AI.pdf"); // 獲取第一頁(yè) PdfPageBase page = pdf.Pages[0]; // 創(chuàng)建PdfImageHelper對(duì)象 PdfImageHelper imageHelper = new PdfImageHelper(); // 獲取頁(yè)面上的圖片信息 PdfImageInfo[] imageInfos = imageHelper.GetImagesInfo(page); // 遍歷圖片信息 for (int i = 0; i < imageInfos.Length; i++) { // 獲取某個(gè)指定圖片信息 PdfImageInfo imageInfo = imageInfos[i]; // 獲取指定圖片 Image image = imageInfo.Image; // 將圖片保存為png格式 image.Save("圖片\\圖-" + i + ".png"); } pdf.Dispose(); } } }
C# 提取PDF 文檔中所有圖片
要獲取整個(gè)PDF文檔中的圖片,就需要遍歷每一頁(yè)然后再提取,具體參考以下步驟:
- 使用 PdfDocument 類(lèi)的 LoadFromFile() 方法加載 PDF 文件。
- 創(chuàng)建 PdfImageHelper 對(duì)象。
- 遍歷文檔中的每一個(gè)頁(yè)面。
- 通過(guò) PdfDocument 類(lèi)的 Pages[index] 屬性獲取指定頁(yè)面。
- 使用 PdfImageHelper.GetImagesInfo() 方法獲取頁(yè)面中圖像信息集合。
- 遍歷圖像信息集合,并使用 **PdfImageInfo.Image.Save()**方法將每一張圖片以PNG格式儲(chǔ)存到指定文件路徑。
C# 代碼:
using Spire.Pdf; using Spire.Pdf.Utilities; using System.Drawing; namespace ExtractAllImages { class Program { static void Main(string[] args) { // 加載PDF文檔 PdfDocument pdf = new PdfDocument(); pdf.LoadFromFile("E:\\PythonPDF\\AI.pdf"); // 創(chuàng)建PdfImageHelper對(duì)象 PdfImageHelper imageHelper = new PdfImageHelper(); int m = 0; // 遍歷PDF頁(yè)面 for (int i = 0; i < pdf.Pages.Count; i++) { // 獲取指定頁(yè)面 PdfPageBase page = pdf.Pages[i]; // 獲取頁(yè)面上的圖片信息 PdfImageInfo[] imageInfos = imageHelper.GetImagesInfo(page); // 遍歷圖片信息 for (int j = 0; j < imageInfos.Length; j++) { // 獲取某個(gè)指定圖片信息 PdfImageInfo imageInfo = imageInfos[j]; // 獲取指定圖片 Image image = imageInfo.Image; // 將圖片保存為png格式 image.Save("PDF圖片\\圖-" + m + ".png"); m++; } } pdf.Dispose(); } } }
到此這篇關(guān)于詳解C#如何提取PDF文檔中的圖片的文章就介紹到這了,更多相關(guān)C#提取PDF圖片內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C#獲取文件、文件夾和驅(qū)動(dòng)器的信息示例詳解
在C#中,文件、文件夾和驅(qū)動(dòng)器是文件系統(tǒng)操作的基本元素,了解如何獲取這些元素的信息對(duì)于開(kāi)發(fā)文件處理和管理工具至關(guān)重要,本文將詳細(xì)介紹如何在C#中獲取有關(guān)文件、文件夾和驅(qū)動(dòng)器的信息,并提供相應(yīng)的示例,需要的朋友可以參考下2024-08-08C#調(diào)用HTTP POST請(qǐng)求上傳圖片的示例代碼
現(xiàn)在很多B/S系統(tǒng)的開(kāi)發(fā)都是通過(guò)API方式來(lái)進(jìn)行的,一般服務(wù)端會(huì)開(kāi)放一個(gè)API接口,客戶(hù)端調(diào)用API接口來(lái)實(shí)現(xiàn)圖片或文件上傳的功能,感興趣的可以了解一下2021-05-05C#中數(shù)組初始化與數(shù)組元素復(fù)制的方法
這篇文章主要介紹了C#中數(shù)組初始化與數(shù)組元素復(fù)制的方法,涉及C#中數(shù)組的創(chuàng)建、初始化及使用Array.Copy方法復(fù)制數(shù)組元素的技巧,需要的朋友可以參考下2015-04-04C# 通過(guò) oledb 操作Excel實(shí)例代碼
本篇文章主要介紹了C# 通過(guò) oledb 操作Excel實(shí)例代碼,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-06-06C# 鍵盤(pán)Enter鍵取代Tab鍵實(shí)現(xiàn)代碼
這篇文章主要介紹了C# 鍵盤(pán)Enter鍵取代Tab鍵實(shí)現(xiàn)代碼,有需要的朋友可以參考一下2013-11-11