詳解Java生成PDF文檔方法
最近項(xiàng)目需要實(shí)現(xiàn)PDF下載的功能,由于沒有這方面的經(jīng)驗(yàn),從網(wǎng)上花了很長時(shí)間才找到相關(guān)的資料。整理之后,發(fā)現(xiàn)有如下幾個(gè)框架可以實(shí)現(xiàn)這個(gè)功能。
1. 開源框架支持
- iText,生成PDF文檔,還支持將XML、Html文件轉(zhuǎn)化為PDF文件;
- Apache PDFBox,生成、合并PDF文檔;
- docx4j,生成docx、pptx、xlsx文檔,支持轉(zhuǎn)換為PDF格式。
比較:
- iText開源協(xié)議為AGPL,而其他兩個(gè)框架協(xié)議均為Apache License v2.0。
- 使用PDFBox生成PDF就像畫圖似的,文字和圖像根據(jù)頁面坐標(biāo)畫上去的,需要根據(jù)字?jǐn)?shù)手動(dòng)換行。
- docx4j用來生成docx文檔,提供了將WORD文檔轉(zhuǎn)換為PDF文檔的功能,并不能直接生成PDF文檔。
2. 實(shí)現(xiàn)方案
— | 格式復(fù)雜 | 格式簡單 |
---|---|---|
數(shù)據(jù)量大 | docx4j+freemarker | docx4j或PDFBox |
數(shù)據(jù)量小 | docx4j | PDFBox |
2.1 純數(shù)據(jù)生成PDF
1.docx4j,適用于生成格式簡單或格式復(fù)雜且數(shù)據(jù)量小的PDF文檔; 2.Apache PDFBox,適用于生成格式簡單且數(shù)據(jù)量小的PDF文檔。
1.docx4j
docx4j是一個(gè)開源Java庫,用于創(chuàng)建和操作Microsoft Open XML(Word docx,Powerpoint pptx和Excel xlsx)文件。它類似于Microsoft的OpenXML SDK,但適用于Java。docx4j使用JAXB來創(chuàng)建內(nèi)存中的對(duì)象表示,程序員需要花時(shí)間了解JAXB和Open XML文件結(jié)構(gòu) 。
// word對(duì)象 WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage(); // 文檔主體 MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart(); // 換行符 Br br = objectFactory.createBr(); // 段落 P p = objectFactory.createP(); // 段落設(shè)置 PPr ppr = objectFactory.createPPr(); // 文字位置 Jc jc = new Jc(); jc.setVal(je); ppr.setJc(jc); // 行設(shè)置 RPr rpr = objectFactory.createRPr(); // 字體設(shè)置 RFonts rFonts = objectFactory.createRFonts(); rFonts.setAscii("Times New Roman"); rFonts.setEastAsia("宋體"); rpr.setRFonts(rFonts); // 行 R r = objectFactory.createR(); // 文本 Text text = objectFactory.createText(); text.setValue("這是一段普通文本"); r.setRPr(rpr); r.getContent().add(br); r.getContent().add(text); p.getContent().add(r); p.setPPr(ppr); // 添加到正文中 mainDocumentPart.addObject(p); // 導(dǎo)出 //..
2.Apache PDFBox Apache PDFBox是處理PDF文檔的一個(gè)開源的Java工具。該項(xiàng)目允許創(chuàng)建新的PDF文檔,處理現(xiàn)有文檔以及從文檔中提取內(nèi)容的功能。Apache PDFBox還包括幾個(gè)命令行實(shí)用程序。
String formTemplate = "/Users/xiaoming/Desktop/test_pdfbox.pdf"; // 定義文檔對(duì)象 PDDocument document = new PDDocument(); // 定義一頁,大小A4 PDPage page = new PDPage(PDRectangle.A4); document.addPage(page); // 獲取字體 PDType0Font font = PDType0Font.load(document, new File("/Users/xiaoming/work/tmp/simsun.ttf")); // 定義頁面內(nèi)容流 PDPageContentStream stream = new PDPageContentStream(document, page); // 設(shè)置字體及文字大小 stream.setFont(font, 12); // 設(shè)置畫筆顏色 stream.setNonStrokingColor(Color.BLACK); // 添加矩形 stream.addRect(29, 797, 100, 14); // 填充矩形 stream.fill(); stream.setNonStrokingColor(Color.BLACK); // 文本填充開始 stream.beginText(); // 設(shè)置行距 stream.setLeading(18f); // 設(shè)置文字位置 stream.newLineAtOffset(30, 800); // 填充文字 stream.showText("呵呵"); // 換行 stream.newLine(); stream.showText("哈哈"); stream.newLine(); stream.showText("嘻嘻"); // 文本填充結(jié)束 stream.endText(); // 關(guān)閉流 stream.close(); // 保存 document.save(formTemplate); // 釋放資源 document.close();
2.2 模版+數(shù)據(jù)生成PDF
FreeMarker+docx4j,適用于生成格式復(fù)雜且數(shù)據(jù)量大的PDF文檔
Apache FreeMarker是一個(gè)模板引擎,用于根據(jù)模板和更改數(shù)據(jù)生成文本輸出(HTML網(wǎng)頁,電子郵件,配置文件,源代碼等)。模板是用FreeMarker模板語言(FTL)編寫的,是一種簡單的專用語言。
Office2003以上,Word是可以以XML文本格式存儲(chǔ)的。先將要生成的PDF轉(zhuǎn)換為Word文檔 ,再將其保存為XML文本,通過模版引擎將數(shù)據(jù)填充到XML文本中,最后再反向轉(zhuǎn)換為PDF文檔。簡單來說就是PDF->Word->XML->Word->PDF的流程。
步驟 | 描述 | 工具 |
---|---|---|
1 | word -> xml | 手動(dòng) |
2 | xml -> ftl | 手動(dòng),參考《XML格式Word文檔常用標(biāo)簽介紹》 |
3 | ftl + obj = xml | freemarker |
4 | xml -> pdf | docx4j |
步驟
1 把pdf文檔對(duì)應(yīng)的word(docx)制作出來
2 把word文檔另存為xml文件
3 將xml文件制作為freemarker模版(ftl)文件
4 將數(shù)據(jù)和ftl文件組裝為xml文本
Map<String, Object> map = new HashMap<>(); map.put("name", "小明"); map.put("address", "北京市朝陽區(qū)"); map.put("email", "xiaoming@abc.com"); StringWriter stringWriter = new StringWriter(); BufferedWriter writer = new BufferedWriter(stringWriter); template.process(map, writer); String xmlStr = stringWriter.toString();
5 使用docx4j將xml文本加載為word文檔對(duì)象
ByteArrayInputStream in = new ByteArrayInputStream(xmlStr.getBytes()); WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(in);
6 使用docx4j將word文檔轉(zhuǎn)存為pdf文檔
String outputfilepath = "/Users/xiaoming/簡歷.pdf"; FileOutputStream os = new FileOutputStream(new File(outputFilePath)); FOSettings foSettings = Docx4J.createFOSettings(); foSettings.setWmlPackage(wordMLPackage); Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL); // Docx4J.toPDF(wordMLPackage, new FileOutputStream(new File(outputfilepath)));
2.3 Word轉(zhuǎn)PDF
docx4j
WordprocessingMLPackage mlPackage = WordprocessingMLPackage.load(new File("abc.docx")); Mapper fontMapper = new IdentityPlusMapper(); // fontMapper.put("華文行楷", PhysicalFonts.get("STXingkai")); mlPackage.setFontMapper(fontMapper); OutputStream os = new java.io.FileOutputStream("abc.pdf"); FOSettings foSettings = Docx4J.createFOSettings(); foSettings.setWmlPackage(mlPackage); Docx4J.toFO(foSettings, os, Docx4J.FLAG_EXPORT_PREFER_XSL);
2.4 合并多個(gè)PDF
Apache PDFBox,將多個(gè)PDF文檔合并
String folderName = "/Users/xiaoming/pdfs"; String destPath = "/Users/xiaoming/all.pdf"; PDFMergerUtility mergePdf = new PDFMergerUtility(); String[] filesInFolder = getFiles(folderName); Arrays.sort(filesInFolder, new Comparator<String>() { @Override public int compare(String o1, String o2) { return o1.compareTo(o2); } }); for (int i = 0; i < filesInFolder.length; i++) { mergePdf.addSource(folderName + File.separator + filesInFolder[i]); } mergePdf.setDestinationFileName(destPath); mergePdf.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());
示例代碼
以上所述是小編給大家介紹的Java生成PDF文檔方法詳解整合,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
相關(guān)文章
Java 數(shù)據(jù)庫連接池詳解及簡單實(shí)例
這篇文章主要介紹了Java 數(shù)據(jù)庫連接池詳解及簡單實(shí)例的相關(guān)資料,需要的朋友可以參考下2016-12-12java.util.NoSuchElementException原因及兩種解決方法
本文主要介紹了java.util.NoSuchElementException原因及兩種解決方法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-06-06Java SE使用數(shù)組實(shí)現(xiàn)高速數(shù)字轉(zhuǎn)換功能
隨著大數(shù)據(jù)時(shí)代的到來,數(shù)字轉(zhuǎn)換功能變得越來越重要,在Java開發(fā)中,數(shù)字轉(zhuǎn)換功能也是經(jīng)常用到的,下面我們就來學(xué)習(xí)一下如何使用Java SE數(shù)組實(shí)現(xiàn)高速的數(shù)字轉(zhuǎn)換功能吧2023-11-11mybatis中insert返回值為1,但數(shù)據(jù)庫卻沒有數(shù)據(jù)
這篇文章主要介紹了mybatis中insert返回值為1,但數(shù)據(jù)庫卻沒有數(shù)據(jù),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-10-10JavaWeb實(shí)現(xiàn)簡單的自動(dòng)登錄功能
這篇文章主要為大家詳細(xì)介紹了JavaWeb實(shí)現(xiàn)簡單的自動(dòng)登錄功能,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-08-08關(guān)于BeanUtils.copyProperties(source, target)的使用
這篇文章主要介紹了關(guān)于BeanUtils.copyProperties(source, target)的使用說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-06-06Java定義棧結(jié)構(gòu),并實(shí)現(xiàn)入棧、出棧操作完整示例
這篇文章主要介紹了Java定義棧結(jié)構(gòu),并實(shí)現(xiàn)入棧、出棧操作,結(jié)合完整實(shí)例形式分析了java數(shù)據(jù)結(jié)構(gòu)中棧的定義、以及入棧、出棧、棧是否為空判斷、棧大小計(jì)算、打印棧元素等相關(guān)操作技巧,需要的朋友可以參考下2020-02-02