C#實(shí)現(xiàn)查找并刪除PDF中的空白頁(yè)面
PDF 文件中的空白頁(yè)并不少見(jiàn),因?yàn)樗鼈冇锌赡苁亲髡哂幸饬粝碌?,也有可能是在處理文檔時(shí)不小心添加的。在閱讀或打印文檔時(shí),這些空白頁(yè)可能會(huì)比較麻煩,因此很有必要?jiǎng)h除它們。在本文中,您將學(xué)習(xí)如何使用 Spire.PDF for .NET 通過(guò) C# 查找和并刪除 PDF 文檔中的空白頁(yè)。
安裝 Spire.PDF for .NET
首先,您需要添加 Spire.PDF for .NET 包中包含的 DLL 文件作為 .NET 項(xiàng)目中的引用。
PM> Install-Package Spire.PDF
C# 查找并刪除 PDF 文檔中的空白頁(yè)
Spire.PDF for .NET 提供了 PdfPageBase.IsBlank() 方法來(lái)檢測(cè) PDF 頁(yè)面是否為絕對(duì)空白。但有些頁(yè)面看起來(lái)是空白的,但實(shí)際上包含了白色 圖像,使用 PdfPageBase.IsBlank() 方法并無(wú)法將這些頁(yè)面視為空白頁(yè)面。因此,需要?jiǎng)?chuàng)建一個(gè)自定義方法 IsImageBlank() 來(lái)檢測(cè)這些白色但非空白的頁(yè)面。
具體步驟如下:
- 創(chuàng)建 PdfDocument 對(duì)象。
- 使用 PdfDocument.LoadFromFile() 方法加載 PDF 文件。
- 遍歷 PDF 文檔中的頁(yè)面,并使用 PdfPageBase.IsBlank() 方法檢測(cè)頁(yè)面是否為空白頁(yè)面。
- 使用 PdfDocument.Pages.RemoveAt() 方法刪除絕對(duì)空白的頁(yè)面。
- 對(duì)于非絕對(duì)空白的頁(yè)面,使用 PdfDocument.SaveAsImage() 方法將其保存為圖像。然后使用自定義方法 IsImageBlank() 檢測(cè)轉(zhuǎn)換后的圖像是否空白,如果是,則使用 PdfDocument.Pages.RemoveAt() 方法刪除這些“空白”頁(yè)面。
- 使用 PdfDocument.SaveToFile() 方法保存結(jié)果文檔。
using Spire.Pdf;
using Spire.Pdf.Graphics;
using System.Drawing;
namespace DeleteBlankPage
{
class Program
{
static void Main(string[] args)
{
// 應(yīng)用授權(quán)
Spire.Pdf.License.LicenseProvider.SetLicenseKey("your license key");
// 創(chuàng)建 PdfDocument 對(duì)象
PdfDocument document = new PdfDocument();
// 加載 PDF 文檔
document.LoadFromFile("匯報(bào).pdf");
// 遍歷PDF中的頁(yè)面
for (int i = document.Pages.Count - 1; i >= 0; i--)
{
// 檢測(cè)頁(yè)面是否為空白
if (document.Pages[i].IsBlank())
{
// 刪除絕對(duì)空白頁(yè)
document.Pages.RemoveAt(i);
}
else
{
// 將 PDF 頁(yè)面保存為圖像
Image image = document.SaveAsImage(i, PdfImageType.Bitmap);
// 檢測(cè)轉(zhuǎn)換后的圖像是否為空白
if (IsImageBlank(image))
{
// 如果是,則刪除頁(yè)面
document.Pages.RemoveAt(i);
}
}
}
// 保存結(jié)果文檔
document.SaveToFile("刪除空白頁(yè).pdf", FileFormat.PDF);
}
// 檢測(cè)圖像是否為空白
public static bool IsImageBlank(Image image)
{
Bitmap bitmap = new Bitmap(image);
for (int i = 0; i < bitmap.Width; i++)
{
for (int j = 0; j < bitmap.Height; j++)
{
Color pixel = bitmap.GetPixel(i, j);
if (pixel.R < 240 || pixel.G < 240 || pixel.B < 240)
{
return false;
}
}
}
return true;
}
}
}效果如下

C# 添加與刪除PDF空白頁(yè)
工具使用
這里示例中使用的是免費(fèi)版的.NET PDF控件 Free Spire.PDF for .NET(添加dll引用時(shí),可在安裝路徑下的Bin文件夾中獲取dll文件)
測(cè)試文檔截圖(文檔包含兩頁(yè)內(nèi)容):

添加PDF空白頁(yè)
1.在默認(rèn)位置,即文檔末插入一張空白頁(yè)
//創(chuàng)建PDF文檔1,并加載測(cè)試文檔
PdfDocument doc1 = new PdfDocument();
doc1.LoadFromFile("sample.pdf");
//添加一頁(yè)空白頁(yè)到文檔(默認(rèn)在文檔最后一頁(yè)添加)
doc1.Pages.Add();
//保存并打開(kāi)文檔
doc1.SaveToFile("result1.pdf");
System.Diagnostics.Process.Start("result1.pdf");測(cè)試結(jié)果:

2.在指定位置插入空白頁(yè)
//創(chuàng)建文檔2,加載測(cè)試文檔
PdfDocument doc2 = new PdfDocument();
doc2.LoadFromFile("sample.pdf");
//添加一頁(yè)空白頁(yè)作為第2頁(yè)
doc2.Pages.Insert(1);
//保存并打開(kāi)文檔
doc2.SaveToFile("result2.pdf");
System.Diagnostics.Process.Start("result2.pdf");測(cè)試結(jié)果:

刪除PDF空白頁(yè)
測(cè)試文檔:

這里的測(cè)試文檔中,包含了兩頁(yè)空白頁(yè),一頁(yè)空白頁(yè)是沒(méi)有任何內(nèi)容的;另一頁(yè)空白頁(yè)是包含了空白圖片的頁(yè)面,看似沒(méi)有內(nèi)容,但是這樣的頁(yè)面實(shí)際上也是不需要的。
using Spire.Pdf;
using System.Drawing;
using Spire.Pdf.Graphics;
namespace DeleteBlankPage_PDF
{
class Program
{
static void Main(string[] args)
{
//應(yīng)用許可證
Spire.License.LicenseProvider.SetLicenseFileName("license.elic.xml");
//創(chuàng)建PdfDocument類對(duì)象,并加載PDF文檔
PdfDocument document = new PdfDocument();
document.LoadFromFile("Test.pdf");
//遍歷文檔中所有頁(yè)面
for (int i = document.Pages.Count - 1; i >= 0; i--)
{
//診斷頁(yè)面是否為空白頁(yè)
if (document.Pages[i].IsBlank())
{
//刪除空白頁(yè)
document.Pages.RemoveAt(i);
}
else
{
//將PDF頁(yè)轉(zhuǎn)換為Bitmap圖像
Image image = document.SaveAsImage(i, PdfImageType.Bitmap);
//診斷圖片是否為空白圖片
if (IsImageBlank(image))
{
//移除包含空白圖片的頁(yè)面
document.Pages.RemoveAt(i);
}
}
}
//保存并打開(kāi)文檔
document.SaveToFile("RemoveBlankPage.pdf", FileFormat.PDF);
System.Diagnostics.Process.Start("RemoveBlankPage.pdf");
}
//自定義方法IsImageBlank()診斷圖片是否為空白圖片
public static bool IsImageBlank(Image image)
{
//初始化Bitmap類實(shí)例,遍歷文檔中所有圖片
Bitmap bitmap = new Bitmap(image);
for (int i = 0; i < bitmap.Width; i++)
{
for (int j = 0; j < bitmap.Height; j++)
{
Color pixel = bitmap.GetPixel(i, j);
if (pixel.R < 240 || pixel.G < 240 || pixel.B < 240)
{
return false;
}
}
}
return true;
}
}
}測(cè)試結(jié)果:

附:VB.NET代碼(刪除PDF空白頁(yè))
Imports Spire.Pdf
Imports System.Drawing
Imports Spire.Pdf.Graphics
Namespace DeleteBlankPage_PDF
Class Program
Private Shared Sub Main(ByVal args As String())
Spire.License.LicenseProvider.SetLicenseFileName("license.elic.xml")
Dim document As PdfDocument = New PdfDocument()
document.LoadFromFile("Test.pdf")
For i As Integer = document.Pages.Count - 1 To 0
If document.Pages(i).IsBlank() Then
document.Pages.RemoveAt(i)
Else
Dim image As Image = document.SaveAsImage(i, PdfImageType.Bitmap)
If IsImageBlank(image) Then
document.Pages.RemoveAt(i)
End If
End If
Next
document.SaveToFile("RemoveBlankPage.pdf", FileFormat.PDF)
System.Diagnostics.Process.Start("RemoveBlankPage.pdf")
End Sub
Public Shared Function IsImageBlank(ByVal image As Image) As Boolean
Dim bitmap As Bitmap = New Bitmap(image)
For i As Integer = 0 To bitmap.Width - 1
For j As Integer = 0 To bitmap.Height - 1
Dim pixel As Color = bitmap.GetPixel(i, j)
If pixel.R < 240 OrElse pixel.G < 240 OrElse pixel.B < 240 Then
Return False
End If
Next
Next
Return True
End Function
End Class
End Namespace到此這篇關(guān)于C#實(shí)現(xiàn)查找并刪除PDF中的空白頁(yè)面的文章就介紹到這了,更多相關(guān)C#查找與刪除PDF空白頁(yè)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C#操作SQLite數(shù)據(jù)庫(kù)方法小結(jié)(創(chuàng)建,連接,插入,查詢,刪除等)
C# WinForm程序處理后臺(tái)繁忙導(dǎo)致前臺(tái)控件假死現(xiàn)象解決方法
PowerShell 定時(shí)執(zhí)行.Net(C#)程序的方法

