欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Java 讀取PDF中的文本和圖片的方法

 更新時間:2019年07月18日 11:55:57   作者:E-iceblue  
本文將介紹通過Java程序來讀取PDF文檔中的文本和圖片的方法。分別調(diào)用方法extractText()和extractImages()來讀取,需要的朋友可以參考下

本文將介紹通過Java程序來讀取PDF文檔中的文本和圖片的方法。分別調(diào)用方法extractText()和extractImages()來讀取。

使用工具:Free Spire.PDF for Java(免費版)

Jar文件獲取導(dǎo)入:

方法1:通過官網(wǎng)下載jar文件包。下載后,解壓文件,并將lib文件夾下的Spire.Pdf.jar文件導(dǎo)入java程序。導(dǎo)入后如下圖:

方法2: 可通過maven倉庫安裝導(dǎo)入。

Java代碼示例

import com.spire.pdf.*;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
public class ExtractText {
  public static void main(String[]args) throws Exception {
    //加載測試文檔
    PdfDocument pdf = new PdfDocument("sample.pdf");
    //實例化StringBuilder類
    StringBuilder sb = new StringBuilder();
    //定義一個int型變量
    int index = 0;
    //遍歷PDF文檔中每頁
    PdfPageBase page;
    for (int i= 0; i<pdf.getPages().getCount();i++) {
      page = pdf.getPages().get(i);
      //調(diào)用extractText()方法提取文本
      sb.append(page.extractText(true));
      FileWriter writer;
      try {
        //將StringBuilder對象中的文本寫入到txt
        writer = new FileWriter("ExtractText.txt");
        writer.write(sb.toString());
        writer.flush();
      } catch (IOException e) {
        e.printStackTrace();
      }
      //調(diào)用extractImages方法獲取圖片
      for (BufferedImage image : page.extractImages()) {
          //指定輸出圖片名,指定圖片格式
          File output = new File(String.format("Image_%d.png", index++));
          ImageIO.write(image, "PNG", output);
      }
    }
    pdf.close();
  }
}

文本和圖片讀取效果:

總結(jié)

以上所述是小編給大家介紹的Java 讀取PDF中的文本和圖片的方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!

相關(guān)文章

  • SpringBoot利用注解來實現(xiàn)Redis分布式鎖

    SpringBoot利用注解來實現(xiàn)Redis分布式鎖

    有些業(yè)務(wù)請求,屬于耗時操作,需要加鎖,防止后續(xù)的并發(fā)操作,同時對數(shù)據(jù)庫的數(shù)據(jù)進行操作,需要避免對之前的業(yè)務(wù)造成影響。本文將利用注解來實現(xiàn)Redis分布式鎖,需要的可以參考一下
    2022-09-09
  • Java多線程與優(yōu)先級詳細解讀

    Java多線程與優(yōu)先級詳細解讀

    這篇文章主要給大家介紹了關(guān)于Java中方法使用的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-08-08
  • MyBatis?和?jeesite多表查詢示例詳解

    MyBatis?和?jeesite多表查詢示例詳解

    這篇文章主要介紹了MyBatis?和?jeesite多表查詢,本文通過示例代碼給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-04-04
  • Java控制語句之if、switch語句

    Java控制語句之if、switch語句

    這篇文章主要介紹了Java控制語句之if、switch語句的相關(guān)資料,需要的朋友可以參考下
    2016-01-01
  • 查看import的類是出自哪個jar包的方法

    查看import的類是出自哪個jar包的方法

    下面小編就為大家?guī)硪黄榭磇mport的類是出自哪個jar包的方法。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-03-03
  • 用java將GBK工程轉(zhuǎn)為uft8的方法實例

    用java將GBK工程轉(zhuǎn)為uft8的方法實例

    本篇文章主要介紹了用java將GBK工程轉(zhuǎn)為uft8的方法實例,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-08-08
  • 詳解Java創(chuàng)建多線程的四種方式以及優(yōu)缺點

    詳解Java創(chuàng)建多線程的四種方式以及優(yōu)缺點

    這篇文章主要介紹了Java創(chuàng)建多線程的四種方式以及優(yōu)缺點,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-11-11
  • Java反射技術(shù)詳解及實例解析

    Java反射技術(shù)詳解及實例解析

    這篇文章主要介紹了Java反射技術(shù)詳解及實例解析,反射可以說是Java中最強大的技術(shù)了,它可以做的事情太多太多,很多優(yōu)秀的開源框架都是通過反射完成的。如果對JAVA感興趣來可以學(xué)習(xí)一下
    2020-07-07
  • springboot?vue接口測試定義編輯功能的實現(xiàn)

    springboot?vue接口測試定義編輯功能的實現(xiàn)

    這篇文章主要為大家介紹了springboot?vue接口測試定義編輯功能的實現(xiàn),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-05-05
  • @JsonFormat 實現(xiàn)日期格式自動格式化

    @JsonFormat 實現(xiàn)日期格式自動格式化

    這篇文章主要介紹了@JsonFormat 實現(xiàn)日期格式自動格式化,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-08-08

最新評論