欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Java實(shí)現(xiàn)Word/Pdf/TXT轉(zhuǎn)html的實(shí)例代碼

 更新時(shí)間:2020年02月27日 15:09:12   作者:By admin  
本文主要介紹了Java實(shí)現(xiàn)Word/Pdf/TXT轉(zhuǎn)html的實(shí)例代碼,代碼簡(jiǎn)單易懂,非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下

引言:

最近公司在做一個(gè)教育培訓(xùn)學(xué)習(xí)及在線考試的項(xiàng)目,本人主要從事網(wǎng)絡(luò)課程模塊,主要做課程分類(lèi),課程,課件的創(chuàng)建及在線學(xué)習(xí)和統(tǒng)計(jì)的功能,因?yàn)檎n件涉及到多種類(lèi)型,像視頻,音頻,圖文,外部鏈接及文檔類(lèi)型.其中就涉及到一個(gè)問(wèn)題,就是文檔型課件課程在網(wǎng)頁(yè)上的展示和學(xué)習(xí)問(wèn)題,因?yàn)橐诰€統(tǒng)計(jì)學(xué)習(xí)的課程,學(xué)習(xí)的人員,學(xué)習(xí)的時(shí)長(zhǎng),所以不能像傳統(tǒng)做法將文檔下載到本地學(xué)習(xí),那樣就不受系統(tǒng)控制了,所以最終的方案是,在上傳文檔型課件的時(shí)候,將其文件對(duì)應(yīng)的轉(zhuǎn)換成HTML文件,以便在網(wǎng)頁(yè)上能夠?yàn)g覽學(xué)習(xí)

下邊主要針對(duì)word,pdf和txt文本文件進(jìn)行轉(zhuǎn)換

一:Java實(shí)現(xiàn)將word轉(zhuǎn)換為html

1:引入依賴(lài)

 <dependency>
  <groupId>fr.opensagres.xdocreport</groupId>
  <artifactId>fr.opensagres.xdocreport.document</artifactId>
  <version>1.0.5</version>
 </dependency>
 <dependency> 
  <groupId>fr.opensagres.xdocreport</groupId> 
  <artifactId>org.apache.poi.xwpf.converter.xhtml</artifactId> 
  <version>1.0.5</version> 
 </dependency>
  <dependency>
  <groupId>org.apache.poi</groupId>
  <artifactId>poi</artifactId>
  <version>3.12</version>
 </dependency>
 <dependency>
  <groupId>org.apache.poi</groupId>
  <artifactId>poi-scratchpad</artifactId>
  <version>3.12</version>
 </dependency>

2:代碼demo

package com.svse.controller;
  
  import javax.xml.parsers.DocumentBuilderFactory;
  import javax.xml.parsers.ParserConfigurationException;
  import javax.xml.transform.OutputKeys;
  import javax.xml.transform.Transformer;
  import javax.xml.transform.TransformerException;
  import javax.xml.transform.TransformerFactory;
  import javax.xml.transform.dom.DOMSource;
 import javax.xml.transform.stream.StreamResult;
 
 import org.apache.poi.hwpf.HWPFDocument;
 import org.apache.poi.hwpf.converter.PicturesManager;
 import org.apache.poi.hwpf.converter.WordToHtmlConverter;
 import org.apache.poi.hwpf.usermodel.PictureType;
 import org.apache.poi.xwpf.converter.core.BasicURIResolver;
 import org.apache.poi.xwpf.converter.core.FileImageExtractor;
 import org.apache.poi.xwpf.converter.core.FileURIResolver;
 import org.apache.poi.xwpf.converter.core.IURIResolver;
 import org.apache.poi.xwpf.converter.core.IXWPFConverter;
 import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter;
 import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions;
 import org.apache.poi.xwpf.usermodel.XWPFDocument;
 /**
 * word 轉(zhuǎn)換成html
 */
public class TestWordToHtml {
 
  public static final String STORAGEPATH="C://works//files//";
   public static final String IP="192.168.30.222";
   public static final String PORT="8010";
  public static void main(String[] args) throws IOException, TransformerException, ParserConfigurationException {
   TestWordToHtml wt=new TestWordToHtml();
    //wt.Word2003ToHtml("甲骨文考證.doc");
    wt.Word2007ToHtml("甲骨文考證.docx");

  }
    
   /**
   * 2003版本word轉(zhuǎn)換成html
   * @throws IOException
   * @throws TransformerException
   * @throws ParserConfigurationException
    */
  public void Word2003ToHtml(String fileName) throws IOException, TransformerException, ParserConfigurationException {
    
     final String imagepath = STORAGEPATH+"fileImage/";//解析時(shí)候如果doc文件中有圖片 圖片會(huì)保存在此路徑
    final String strRanString=getRandomNum();
    String filepath =STORAGEPATH;
    String htmlName =fileName.substring(0, fileName.indexOf("."))+ "2003.html";
    final String file = filepath + fileName;
    InputStream input = new FileInputStream(new File(file));
    HWPFDocument wordDocument = new HWPFDocument(input);
    WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
    //設(shè)置圖片存放的位置
    wordToHtmlConverter.setPicturesManager(new PicturesManager() {
       public String savePicture(byte[] content, PictureType pictureType, String suggestedName, float widthInches, float heightInches) {
        File imgPath = new File(imagepath);
        if(!imgPath.exists()){//圖片目錄不存在則創(chuàng)建
          imgPath.mkdirs();
        }
         
        File file = new File(imagepath +strRanString+suggestedName);
        try {
           OutputStream os = new FileOutputStream(file);
           os.write(content);
           os.close();
        } catch (FileNotFoundException e) {
           e.printStackTrace();
         } catch (IOException e) {
           e.printStackTrace();
        }
         
        return "http://"+IP+":"+PORT+"http://uploadFile/fileImage/"+strRanString+suggestedName;
       // return imagepath +strRanString+suggestedName;
      }
    });
    
     //解析word文檔
    wordToHtmlConverter.processDocument(wordDocument);
     Document htmlDocument = wordToHtmlConverter.getDocument();
     
     File htmlFile = new File(filepath +strRanString+htmlName);
    OutputStream outStream = new FileOutputStream(htmlFile);
     

     DOMSource domSource = new DOMSource(htmlDocument);
    StreamResult streamResult = new StreamResult(outStream);
 
    TransformerFactory factory = TransformerFactory.newInstance();
     Transformer serializer = factory.newTransformer();
    serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
    serializer.setOutputProperty(OutputKeys.INDENT, "yes");
    serializer.setOutputProperty(OutputKeys.METHOD, "html");
    
    serializer.transform(domSource, streamResult);
     outStream.close();
     
    System.out.println("生成html文件路徑:"+ "http://"+IP+":"+PORT+"http://uploadFile/"+strRanString+htmlName);
   }
   /**
   * 2007版本word轉(zhuǎn)換成html
   * @throws IOException
   */
   public void Word2007ToHtml(String fileName) throws IOException {
    final String strRanString=getRandomNum();
     String filepath = STORAGEPATH+strRanString;
     String htmlName =fileName.substring(0, fileName.indexOf("."))+ "2007.html";
     File f = new File(STORAGEPATH+fileName); 
     if (!f.exists()) { 
       System.out.println("Sorry File does not Exists!"); 
     } else { 
       if (f.getName().endsWith(".docx") || f.getName().endsWith(".DOCX")) { 
         try {
           // 1) 加載word文檔生成 XWPFDocument對(duì)象 
           InputStream in = new FileInputStream(f); 
           XWPFDocument document = new XWPFDocument(in); 
           // 2) 解析 XHTML配置 (這里設(shè)置IURIResolver來(lái)設(shè)置圖片存放的目錄) 
           File imageFolderFile = new File(filepath); 
           XHTMLOptions options = XHTMLOptions.create().URIResolver(new FileURIResolver(imageFolderFile)); 
           options.setExtractor(new FileImageExtractor(imageFolderFile)); 
           options.URIResolver(new IURIResolver() {
             public String resolve(String uri) {
               //http://192.168.30.222:8010//uploadFile/....
               return "http://"+IP+":"+PORT+"http://uploadFile/"+strRanString +"/"+ uri;
             }
           });
           options.setIgnoreStylesIfUnused(false); 
           options.setFragment(true); 
           // 3) 將 XWPFDocument轉(zhuǎn)換成XHTML 
           OutputStream out = new FileOutputStream(new File(filepath + htmlName)); 
           IXWPFConverter<XHTMLOptions> converter = XHTMLConverter.getInstance();
           converter.convert(document,out, options);
           //XHTMLConverter.getInstance().convert(document, out, options); 
           System.out.println("html路徑:"+"http://"+IP+":"+PORT+"http://uploadFile/"+strRanString+htmlName);
         } catch (Exception e) {
           e.printStackTrace();
         }
       } else { 
         System.out.println("Enter only MS Office 2007+ files"); 
       } 
     } 
   } 
   /**
   *功能說(shuō)明:生成時(shí)間戳
   *創(chuàng)建人:zsq
   *創(chuàng)建時(shí)間:2019年12月7日 下午2:37:09
   *
   */
   public static String getRandomNum(){
     Date dt = new Date();
     SimpleDateFormat sdf = new SimpleDateFormat("yyyyMMddHHmmss"); 
     String str=sdf.format(dt);
     return str;
   }
  }

二:Java實(shí)現(xiàn)將Pdf轉(zhuǎn)換為html

1: 引入依賴(lài)

 <dependency>
       <groupId>net.sf.cssbox</groupId>
       <artifactId>pdf2dom</artifactId>
       <version>1.7</version>
     </dependency> 
     <dependency>
       <groupId>org.apache.pdfbox</groupId>
       <artifactId>pdfbox</artifactId>
       <version>2.0.12</version>
     </dependency>
     <dependency>
       <groupId>org.apache.pdfbox</groupId>
       <artifactId>pdfbox-tools</artifactId>
       <version>2.0.12</version>
 </dependency>

2:代碼Demo

 public class PdfToHtml { 
  /*
   pdf轉(zhuǎn)換html
   */
   public void pdfToHtmlTest(String inPdfPath,String outputHtmlPath) {
     // String outputPath = "C:\\works\\files\\ZSQ保密知識(shí)測(cè)試題庫(kù).html";
       //try() 寫(xiě)在()里面會(huì)自動(dòng)關(guān)閉流
     try{
       BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(new File(outputHtmlPath)),"utf-8"));
       //加載PDF文檔
       //PDDocument document = PDDocument.load(bytes);
       PDDocument document = PDDocument.load(new File(inPdfPath));
       PDFDomTree pdfDomTree = new PDFDomTree();
       pdfDomTree.writeText(document,out);
     } catch (Exception e) {
       e.printStackTrace();
     }
   }
   public static void main(String[] args) throws IOException {
     PdfToHtml ph=new PdfToHtml();
     String pdfPath="C:\\works\\files\\武研中心行政考勤制度.pdf";
     String outputPath="C:\\works\\files\\武研中心行政考勤制度.html";
     ph.pdfToHtmlTest(pdfPath,outputPath);
  }
 }

三:Java實(shí)現(xiàn)將TXT轉(zhuǎn)換為html

 /*
    * txt文檔轉(zhuǎn)html
     filePath:txt原文件路徑
     htmlPosition:轉(zhuǎn)化后生成的html路徑
   */
   public static void txtToHtml(String filePath, String htmlPosition) {
     try {
       //String encoding = "GBK";
       File file = new File(filePath);
       if (file.isFile() && file.exists()) { // 判斷文件是否存在
         InputStreamReader read = new InputStreamReader(new FileInputStream(file), "GBK");
         // 考慮到編碼格式
         BufferedReader bufferedReader = new BufferedReader(read);
         // 寫(xiě)文件
         FileOutputStream fos = new FileOutputStream(new File(htmlPosition));
         OutputStreamWriter osw = new OutputStreamWriter(fos, "GBK");
         BufferedWriter bw = new BufferedWriter(osw);
         String lineTxt = null;
         while ((lineTxt = bufferedReader.readLine()) != null) {
           bw.write("  "+lineTxt + "</br>");
         }
         bw.close();
         osw.close();
         fos.close();
         read.close();
       } else {
         System.out.println("找不到指定的文件");
       }
     } catch (Exception e) {
       System.out.println("讀取文件內(nèi)容出錯(cuò)");
       e.printStackTrace();
     }
   }

總結(jié)

到此這篇關(guān)于Java實(shí)現(xiàn)Word/Pdf/TXT轉(zhuǎn)html的實(shí)例代碼的文章就介紹到這了,更多相關(guān)java word pdf txt 轉(zhuǎn)html內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 新手學(xué)習(xí)Java對(duì)Redis簡(jiǎn)單操作

    新手學(xué)習(xí)Java對(duì)Redis簡(jiǎn)單操作

    這篇文章主要介紹了新手學(xué)習(xí)Java對(duì)Redis簡(jiǎn)單操作,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-04-04
  • maven中自定義MavenArchetype的實(shí)現(xiàn)

    maven中自定義MavenArchetype的實(shí)現(xiàn)

    Maven自身提供了許多Archetype來(lái)方便用戶(hù)創(chuàng)建Project,為了避免在創(chuàng)建project時(shí)重復(fù)的拷貝和修改,我們通過(guò)自定義Archetype來(lái)規(guī)范顯得還蠻有必要,下面就來(lái)介紹一下,感興趣的可以了解一下
    2025-01-01
  • JAVA+Hibernate 無(wú)限級(jí)分類(lèi)

    JAVA+Hibernate 無(wú)限級(jí)分類(lèi)

    主要看menu_id和parent_id這兩個(gè)字段。 Eclipse生成的表持久映射:(說(shuō)明:自己加level屬性,作用:為了記錄種類(lèi)所在深度)
    2008-07-07
  • Java設(shè)計(jì)模式之觀察者模式詳解

    Java設(shè)計(jì)模式之觀察者模式詳解

    這篇文章主要介紹了Java設(shè)計(jì)模式之觀察者模式詳解,對(duì)象之間的多對(duì)一依賴(lài)的一種設(shè)計(jì)方案,被依賴(lài)的對(duì)象為Subject,依賴(lài)的對(duì)象為Observer,Subject通知Observer變化,需要的朋友可以參考下
    2023-12-12
  • Java vector的詳解及實(shí)例

    Java vector的詳解及實(shí)例

    這篇文章主要介紹了Java vector的詳解及實(shí)例的相關(guān)資料,需要的朋友可以參考下
    2017-03-03
  • Java Class 加密工具 ClassFinal詳解

    Java Class 加密工具 ClassFinal詳解

    ClassFinal 是一款 java class 文件安全加密工具,支持直接加密jar包或war包,無(wú)需修改任何項(xiàng)目代碼,兼容spring-framework;可避免源碼泄漏或字節(jié)碼被反編譯,這篇文章主要介紹了Java Class 加密工具 ClassFinal,需要的朋友可以參考下
    2023-03-03
  • Java集合類(lèi)中文介紹

    Java集合類(lèi)中文介紹

    本文首先對(duì)Java集合類(lèi)框架做了簡(jiǎn)單說(shuō)明,之后對(duì)主要類(lèi)和為API做了介紹:Collection、List、Set、AbstractCollection、AbstractList、AbstractSet、Iterator、ListIterator。
    2013-11-11
  • mybatis快速上手并運(yùn)行程序

    mybatis快速上手并運(yùn)行程序

    MyBatis 是一款優(yōu)秀的持久層框架,它支持自定義 SQL、存儲(chǔ)過(guò)程以及高級(jí)映射。MyBatis 免除了幾乎所有的 JDBC 代碼以及設(shè)置參數(shù)和獲取結(jié)果集的工作。MyBatis 可以通過(guò)簡(jiǎn)單的 XML 或注解來(lái)配置和映射原始類(lèi)型、接口和 Java POJO為數(shù)據(jù)庫(kù)中的記錄
    2022-01-01
  • Java實(shí)現(xiàn)多線程的上下文切換

    Java實(shí)現(xiàn)多線程的上下文切換

    這篇文章主要介紹了Java實(shí)現(xiàn)多線程的上下文切換操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-09-09
  • 50 道Java 線程面試題(經(jīng)典)

    50 道Java 線程面試題(經(jīng)典)

    java 線程面試題是比較熱門(mén)的面試題,下面小編給大家分享了50道java線程面試題必掌握,大家來(lái)一起學(xué)習(xí)吧為面試好好準(zhǔn)備吧
    2016-11-11

最新評(píng)論