java實(shí)現(xiàn)word文件轉(zhuǎn)html文件
最近在項(xiàng)目開發(fā)中用戶提出要在電腦上沒有裝office時(shí)在瀏覽器中打開word文件,最后確定的邏輯:用戶選擇想要查看的文件,頁(yè)面js判斷文件是否為word。不是執(zhí)行下載,是后端根據(jù)word文件后綴訪問對(duì)應(yīng)轉(zhuǎn)換方法。文件已存在對(duì)應(yīng)html文件直接返回html文件地址,不存在先生成對(duì)應(yīng)html文件再返回地址。js直接通過(guò)open()打開新的頁(yè)簽,展示word文件內(nèi)容。新人一枚,如果代碼中存在錯(cuò)誤或有更好的實(shí)現(xiàn)萬(wàn)望指正!
相關(guān)jar包
代碼
import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import javax.xml.transform.OutputKeys; import javax.xml.transform.Transformer; import javax.xml.transform.TransformerException; import javax.xml.transform.TransformerFactory; import javax.xml.transform.dom.DOMSource; import javax.xml.transform.stream.StreamResult; import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.converter.PicturesManager; import org.apache.poi.hwpf.converter.WordToHtmlConverter; import org.apache.poi.hwpf.usermodel.PictureType; import org.apache.poi.xwpf.converter.core.BasicURIResolver; import org.apache.poi.xwpf.converter.core.FileImageExtractor; import org.apache.poi.xwpf.converter.core.FileURIResolver; import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter; import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions; import org.apache.poi.xwpf.usermodel.XWPFDocument; import org.w3c.dom.Document; /** * word 轉(zhuǎn)換成html 2017-2-27 */ public class WordToHtml { /** * 將word2003轉(zhuǎn)換為html文件 2017-2-27 * @param wordPath word文件路徑 * @param wordName word文件名稱無(wú)后綴 * @param suffix word文件后綴 * @throws IOException * @throws TransformerException * @throws ParserConfigurationException */ public String Word2003ToHtml(String wordPath,String wordName,String suffix) throws IOException, TransformerException, ParserConfigurationException { String htmlPath = wordPath + File.separator + wordName + "_show" + File.separator; String htmlName = wordName + ".html"; final String imagePath = htmlPath + "image" + File.separator; //判斷html文件是否存在 File htmlFile = new File(htmlPath + htmlName); if(htmlFile.exists()){ return htmlFile.getAbsolutePath(); } //原word文檔 final String file = wordPath + File.separator + wordName + suffix; InputStream input = new FileInputStream(new File(file)); HWPFDocument wordDocument = new HWPFDocument(input); WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument()); //設(shè)置圖片存放的位置 wordToHtmlConverter.setPicturesManager(new PicturesManager() { public String savePicture(byte[] content, PictureType pictureType, String suggestedName, float widthInches, float heightInches) { File imgPath = new File(imagePath); if(!imgPath.exists()){//圖片目錄不存在則創(chuàng)建 imgPath.mkdirs(); } File file = new File(imagePath + suggestedName); try { OutputStream os = new FileOutputStream(file); os.write(content); os.close(); } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } //圖片在html文件上的路徑 相對(duì)路徑 return "image/" + suggestedName; } }); //解析word文檔 wordToHtmlConverter.processDocument(wordDocument); Document htmlDocument = wordToHtmlConverter.getDocument(); //生成html文件上級(jí)文件夾 File folder = new File(htmlPath); if(!folder.exists()){ folder.mkdirs(); } //生成html文件地址 OutputStream outStream = new FileOutputStream(htmlFile); DOMSource domSource = new DOMSource(htmlDocument); StreamResult streamResult = new StreamResult(outStream); TransformerFactory factory = TransformerFactory.newInstance(); Transformer serializer = factory.newTransformer(); serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8"); serializer.setOutputProperty(OutputKeys.INDENT, "yes"); serializer.setOutputProperty(OutputKeys.METHOD, "html"); serializer.transform(domSource, streamResult); outStream.close(); return htmlFile.getAbsolutePath(); } /** * 2007版本word轉(zhuǎn)換成html 2017-2-27 * @param wordPath word文件路徑 * @param wordName word文件名稱無(wú)后綴 * @param suffix word文件后綴 * @return * @throws IOException */ public String Word2007ToHtml(String wordPath,String wordName,String suffix) throws IOException { String htmlPath = wordPath + File.separator + wordName + "_show" + File.separator; String htmlName = wordName + ".html"; String imagePath = htmlPath + "image" + File.separator; //判斷html文件是否存在 File htmlFile = new File(htmlPath + htmlName); if(htmlFile.exists()){ return htmlFile.getAbsolutePath(); } //word文件 File wordFile = new File(wordPath + File.separator + wordName + suffix); // 1) 加載word文檔生成 XWPFDocument對(duì)象 InputStream in = new FileInputStream(wordFile); XWPFDocument document = new XWPFDocument(in); // 2) 解析 XHTML配置 (這里設(shè)置IURIResolver來(lái)設(shè)置圖片存放的目錄) File imgFolder = new File(imagePath); XHTMLOptions options = XHTMLOptions.create(); options.setExtractor(new FileImageExtractor(imgFolder)); //html中圖片的路徑 相對(duì)路徑 options.URIResolver(new BasicURIResolver("image")); options.setIgnoreStylesIfUnused(false); options.setFragment(true); // 3) 將 XWPFDocument轉(zhuǎn)換成XHTML //生成html文件上級(jí)文件夾 File folder = new File(htmlPath); if(!folder.exists()){ folder.mkdirs(); } OutputStream out = new FileOutputStream(htmlFile); XHTMLConverter.getInstance().convert(document, out, options); return htmlFile.getAbsolutePath(); } }
文件目錄:
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- Java實(shí)現(xiàn)將word轉(zhuǎn)換為html的方法示例【doc與docx格式】
- Java實(shí)現(xiàn)將Word轉(zhuǎn)換成Html的示例代碼
- Java實(shí)現(xiàn)word/pdf轉(zhuǎn)html并在線預(yù)覽
- Java實(shí)現(xiàn)HTML轉(zhuǎn)為Word的示例代碼
- Java 將Word轉(zhuǎn)為HTML的方法
- Java實(shí)現(xiàn)Word/Pdf/TXT轉(zhuǎn)html的實(shí)例代碼
- java實(shí)現(xiàn)在線預(yù)覽--poi實(shí)現(xiàn)word、excel、ppt轉(zhuǎn)html的方法
- 關(guān)于Java實(shí)現(xiàn)word(docx、doc)轉(zhuǎn)html的完美解決方案
相關(guān)文章
Java中HashTable和HashMap的區(qū)別_動(dòng)力節(jié)點(diǎn)Java學(xué)院整理
HashTable和HashMap主要的區(qū)別有:線程安全性,同步(synchronization),以及速度。接下來(lái)通過(guò)本文給大家簡(jiǎn)單介紹下HashTable和HashMap的區(qū)別,需要的的朋友參考下吧2017-04-04Java實(shí)現(xiàn)圖章或簽名插在pdf的固定位置
使用Java技術(shù)在word轉(zhuǎn)換成pdf過(guò)程中實(shí)現(xiàn)將圖章或者簽名插入在pdf中,并生成帶圖章或者簽名的pdf,來(lái)完成某些特定場(chǎng)景的需求,文中有詳細(xì)的代碼示例,需要的朋友可以參考下2023-10-10談?wù)凷pring 注入properties文件總結(jié)
本篇談?wù)凷pring 注入properties文件總結(jié),小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-01-01java正則表達(dá)式處理花括號(hào)內(nèi)容替換賦值問題
這篇文章主要介紹了java正則表達(dá)式處理花括號(hào)內(nèi)容替換賦值問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05mybatis新增save結(jié)束后自動(dòng)返回主鍵id詳解
這篇文章主要介紹了mybatis新增save結(jié)束后自動(dòng)返回主鍵id詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-12-12