在.NET框架使用C#實(shí)現(xiàn)PDF文件轉(zhuǎn)為HTML格式的步驟
引言
HTML作為一種開放標(biāo)準(zhǔn)的網(wǎng)頁標(biāo)記語言,具有跨平臺(tái)、易于瀏覽和搜索引擎友好的特性,使得內(nèi)容能夠在多種設(shè)備上輕松訪問并優(yōu)化了在線分享與互動(dòng)。通過將PDF文件轉(zhuǎn)換為HTML格式,我們可以更方便地在瀏覽器中展示PDF文檔內(nèi)容,同時(shí)也更容易集成到更復(fù)雜的HTML頁面中。使用C#在.NET框架下我們可以實(shí)現(xiàn)更快的轉(zhuǎn)換過程,以及轉(zhuǎn)換的自動(dòng)化進(jìn)行。本文將介紹如何在.NET框架使用C#將PDF文件轉(zhuǎn)換為HTML格式。
文所使用的方法需要用到免費(fèi)的Free Spire.PDF for .NET,NuGet:Install-Package FreeSpire.PDF
。
文中所用的示例PDF文檔:
用C#直接轉(zhuǎn)換PDF文件為HTML格式
我們可以使用PdfDocument.LoadFromFile()
方法從文件載入PDF文檔,然后再使用PdfDocument.SaveToFile(string: fileName, FileFormat.HTML)
方法將PDF文檔直接轉(zhuǎn)換為HTML文件并保存。以下是操作步驟示例:
- 導(dǎo)入所需模塊。
- 創(chuàng)建
PdfDocument
實(shí)例,并使用PdfDocument.LoadFromFile()
方法從文件載入PDF文檔。 - 使用
PdfDocument.SaveToFile(string: fileName, FileFormat.HTML)
方法將PDF文檔直接轉(zhuǎn)換為HTML格式并保存到文件。 - 釋放資源。
代碼示例
using Spire.Pdf; namespace PDFToHTML { class Program { static void Main(string[] args) { // 創(chuàng)建PdfDocument實(shí)例 PdfDocument pdf = new PdfDocument(); // 載入PDF文件 pdf.LoadFromFile("Sample.pdf"); // 將PDF轉(zhuǎn)換為HTML并保存 pdf.SaveToFile("output/PDFToHTML.html", FileFormat.HTML); // 釋放資源 pdf.Dispose(); } } }
運(yùn)行結(jié)果
轉(zhuǎn)換PDF到HTML時(shí)自定義轉(zhuǎn)換選項(xiàng)
在載入 PDF 文檔后,可以通過訪問文檔的PdfDocument.ConvertOptions
屬性獲取PdfConvertOptions
實(shí)例。隨后,可調(diào)用PdfConvertOptions.SetPdfToHtmlOptions()
方法設(shè)置轉(zhuǎn)換選項(xiàng)。該方法接受以下四個(gè)參數(shù):
- bool: 是否將 SVG 嵌入到 HTML 中;
- bool: 是否將圖像嵌入到 HTML 中;
- int: 單文件最大頁數(shù);
- bool: 是否使用高質(zhì)量嵌入 SVG。
以下是具體操作步驟的示例:
- 導(dǎo)入所需模塊。
- 創(chuàng)建
PdfDocument
實(shí)例,并使用PdfDocument.LoadFromFile()
方法從文件載入PDF文檔。 - 訪問文檔的
PdfDocument.ConvertOptions
屬性獲取PdfConvertOptions
實(shí)例。 - 調(diào)用
PdfConvertOptions.SetPdfToHtmlOptions()
方法設(shè)置轉(zhuǎn)換選項(xiàng)。 - 使用
PdfDocument.SaveToFile(string: fileName, FileFormat.HTML)
方法將PDF文檔轉(zhuǎn)換為HTML格式并保存到文件。 - 釋放資源。
代碼示例
using Spire.Pdf; namespace PDFToHTML { class Program { static void Main(string[] args) { // 創(chuàng)建PdfDocument實(shí)例 PdfDocument pdf = new PdfDocument(); // 載入PDF文件 pdf.LoadFromFile("Sample.pdf"); // 訪問ConvertOptions屬性 PdfConvertOptions toHtmlOptions = pdf.ConvertOptions; // 設(shè)置轉(zhuǎn)換HTML選項(xiàng) toHtmlOptions.SetPdfToHtmlOptions(false, true, 5, false); // 將PDF轉(zhuǎn)換為HTML并保存 pdf.SaveToFile("output/PDFToHTML.html", FileFormat.HTML); // 釋放資源 pdf.Dispose(); } } }
運(yùn)行結(jié)果
在字節(jié)流中實(shí)現(xiàn)PDF到HTML的轉(zhuǎn)換
除了從磁盤載入PDF文件轉(zhuǎn)換為HTML格式外,我們還可以使用PdfDocument.LoadFromStream()
方法直接載入流中的PDF文檔,然后使用PdfDocument.SaveToStream(Stream: stream, FileFormat.HTML)
將PDF文檔轉(zhuǎn)換為HTML文件流。以下是操作步驟示例:
- 導(dǎo)入所需模塊。
- 創(chuàng)建
MemoryStream
實(shí)例或使用現(xiàn)有實(shí)例。 - 創(chuàng)建
PdfDocument
實(shí)例,使用PdfDocument.LoadFromStream()
從流載入PDF文檔。 - 使用
PdfDocument.SaveToStream(Stream: stream, FileFormat.HTML)
將PDF文檔轉(zhuǎn)換為HTML文件流。 - 將流寫入文件或根據(jù)需要進(jìn)行其他操作。
- 釋放資源。
代碼示例
using Spire.Pdf; namespace PDFToHTML { class Program { static void Main(string[] args) { // 創(chuàng)建Stream實(shí)例或使用現(xiàn)有實(shí)例 MemoryStream stream = new MemoryStream(); File.OpenRead("Sample.pdf").CopyTo(stream); // 創(chuàng)建PdfDocument實(shí)例 PdfDocument pdf = new PdfDocument(); // 從流中載入PDF文件 pdf.LoadFromStream(stream); // 將PDF轉(zhuǎn)換為HTML并保存到流 pdf.SaveToStream(stream, FileFormat.HTML); // 將流寫入文件或根據(jù)需要進(jìn)行其他操作 File.WriteAllBytes("output/PDFToHTMLStream.html", stream.ToArray()); // 釋放資源 pdf.Dispose(); } } }
運(yùn)行結(jié)果
本文介紹如何在.NET框架使用C#將PDF轉(zhuǎn)換為HTML格式,提供步驟介紹及代碼示例。
到此這篇關(guān)于在.NET框架使用C#實(shí)現(xiàn)PDF文件轉(zhuǎn)為HTML格式的步驟的文章就介紹到這了,更多相關(guān).NET C#實(shí)現(xiàn)PDF轉(zhuǎn)HTML內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
詳解如何利用C#實(shí)現(xiàn)漢字轉(zhuǎn)拼音功能
這篇文章主要為大家詳細(xì)介紹了如何利用C#實(shí)現(xiàn)漢字轉(zhuǎn)拼音的功能,文中的示例代碼講解詳細(xì),對我們學(xué)習(xí)C#有一定的幫助,感興趣的小伙伴可以跟隨小編一起了解一下2022-12-12c# openxml 刪除xlsx、xls的外鏈?zhǔn)纠a
要?jiǎng)h除一個(gè) Excel 文件(.xlsx)中的外部鏈接(external links),你可以使用 OpenXML SDK,本文演示如何使用 OpenXML SDK 刪除外部鏈接,感興趣的朋友一起看看吧2024-01-01WCF實(shí)現(xiàn)的計(jì)算器功能實(shí)例
這篇文章主要介紹了WCF實(shí)現(xiàn)的計(jì)算器功能,結(jié)合具體實(shí)例形式較為詳細(xì)的分析了WCF實(shí)現(xiàn)計(jì)算器功能的具體步驟與相關(guān)操作技巧,需要的朋友可以參考下2017-06-06Unity實(shí)現(xiàn)簡單換裝系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了Unity實(shí)現(xiàn)簡單換裝系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-04-04基于NET?Core?的Nuget包制作、發(fā)布和運(yùn)用流程解析(完整過程)
這篇文章主要介紹了基于NET?Core?的Nuget包制作、發(fā)布和運(yùn)用流程,本文通過圖文并茂的形式給大家介紹了Nuget包制作過程,感興趣的朋友跟隨小編一起看看吧2022-02-02WPF實(shí)現(xiàn)動(dòng)畫效果(二)之From/To/By動(dòng)畫
這篇文章介紹了WPF實(shí)現(xiàn)動(dòng)畫效果之From/To/By動(dòng)畫,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-06-06