html转pdf（总结五种方法Java）

java html pdf 2023-08-31 17:08:27 108人浏览安东尼

摘要

html转pdf（总结五种方法Java） Java 实现html转pdf，总结五种方法。推荐使用wkhtmltopdf,Itext 方法一：使用wkhtmltopdf 1、下载插件wkhtmlto

html转pdf（总结五种方法Java）

Java 实现html转pdf，总结五种方法。
推荐使用wkhtmltopdf,Itext
(img-M4kXdzcT-1669887116934)(_v_images/20221201165346879_22464.png)]

方法一：使用wkhtmltopdf

1、下载插件wkhtmltopdf
https://wkhtmltopdf.org/downloads.html (img-lzLsty7k-1669887116935)(_v_images/20221201163606556_16343.png)]

2、本机测试
本目录下cmd进入
输入命令 wkhtmltopdf.exe ‪E:\学习文档\百度常用标签.html ‪E:\学习文档\百度常用标签.pdf
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fPVH6Enr-1669887116935)(_v_images/20221201164132812_15695.png)]

3、java代码实现
HtmlToPdf类

import java.io.File; public class HtmlToPdf {     //    wkhtmltopdf在系统中的路径    private static final String toPdfTool = "‪D:\\wkhtmltopdf\\bin\\wkhtmltopdf.exe";         public static boolean convert(String srcPath, String destPath,String toPdfTool){        File file = new File(destPath);        File parent = file.getParentFile();        //如果pdf保存路径不存在，则创建路径        if(!parent.exists()){            parent.mkdirs();        }        StringBuilder cmd = new StringBuilder();        cmd.append(toPdfTool);        cmd.append(" ");        cmd.append(" --header-line");//页眉下面的线        cmd.append(" --margin-top 3cm ");//设置页面上边距 (default 10mm)        // cmd.append(" --header-html file:///"+WEBUtil.getServletContext().getRealPath("")+FileUtil.convertSystemFilePath("\\style\\pdf\\head.html"));// (添加一个HTML页眉,后面是网址)        cmd.append(" --header-spacing 5 ");// (设置页眉和内容的距离,默认0)        //cmd.append(" --footer-center (设置在中心位置的页脚内容)");//设置在中心位置的页脚内容        //cmd.append(" --footer-html file:///"+WebUtil.getServletContext().getRealPath("")+FileUtil.convertSystemFilePath("\\style\\pdf\\foter.html"));// (添加一个HTML页脚,后面是网址)        cmd.append(" --footer-line");/public class WaterMarkEventHandler implements IEventHandler {        private String waterMarkContent;        private int waterMarkX;        private int waterMarkY;    public WaterMarkEventHandler(String waterMarkContent) {        this(waterMarkContent, 5, 5);    }    public WaterMarkEventHandler(String waterMarkContent, int waterMarkX, int waterMarkY) {        this.waterMarkContent = waterMarkContent;        this.waterMarkX = waterMarkX;        this.waterMarkY = waterMarkY;    }    @Override    public void handleEvent(Event event) {        PdfDocumentEvent documentEvent = (PdfDocumentEvent) event;        PdfDocument document = documentEvent.getDocument();        PdfPage page = documentEvent.getPage();        Rectangle pageSize = page.getPageSize();        PdfFont pdfFont = null;        try {            pdfFont = PdfFontFactory.createFont("STSongStd-Light", "UniGB-UCS2-H", false);        } catch (IOException e) {            e.printStackTrace();        }        Pdfcanvas pdfCanvas = new PdfCanvas(page.newContentStreamAfter(), page.getResources(), document);        Paragraph waterMark = new Paragraph(waterMarkContent).setOpacity(0.5f);        Canvas canvas = new Canvas(pdfCanvas, pageSize)            .setFontColor(WebColors.getRGBColor("lightgray"))            .setFontSize(16)            .setFont(pdfFont);        for (int i = 0; i < waterMarkX; i++) {            for (int j = 0; j < waterMarkY; j++) {                canvas.showTextAligned(waterMark, (150 + i * 300), (160 + j * 150), document.getNumberOfPages(), TextAlignment.CENTER, VerticalAlignment.BOTTOM, 120);            }        }        canvas.close();    }}

public class PageEventHandler implements IEventHandler {    @Override    public void handleEvent(Event event) {        PdfDocumentEvent documentEvent = (PdfDocumentEvent) event;        PdfDocument document = documentEvent.getDocument();        PdfPage page = documentEvent.getPage();        Rectangle pageSize = page.getPageSize();        PdfFont pdfFont = null;        try {            pdfFont = PdfFontFactory.createFont("STSongStd-Light", "UniGB-UCS2-H", false);        } catch (IOException e) {            e.printStackTrace();        }        PdfCanvas pdfCanvas = new PdfCanvas(page.getLastContentStream(), page.getResources(), document);        Canvas canvas = new Canvas(pdfCanvas, pageSize);        float  x = (pageSize.getLeft() + pageSize.getRight()) / 2;        float  y = pageSize.getBottom() + 15;        Paragraph paragraph = new Paragraph("第" + document.getPageNumber(page) + "页/共" + document.getNumberOfPages() + "页")            .setFontSize(10)            .setFont(pdfFont);        canvas.showTextAligned(paragraph, x, y, TextAlignment.CENTER);        canvas.close();    }}

3、转换工具类

@Slf4jpublic class HtmlToPdfUtils {        public static void convertToPdf(InputStream inputStream, String waterMark, String fontPath, OutputStream outputStream) throws IOException {        PdfWriter pdfWriter = new PdfWriter(outputStream);        PdfDocument pdfDocument = new PdfDocument(pdfWriter);        //设置为A4大小        pdfDocument.setDefaultPageSize(PageSize.A4);        //添加水印        pdfDocument.addEventHandler(PdfDocumentEvent.END_PAGE, new WaterMarkEventHandler(waterMark));        //添加中文字体支持        ConverterProperties properties = new ConverterProperties();        FontProvider fontProvider = new FontProvider();        //        设置字体                //添加自定义字体，例如微软雅黑        if (StringUtils.isNotBlank(fontPath)) {            PdfFont microsoft = PdfFontFactory.createFont(fontPath, PdfEncodings.IDENTITY_H, false);            fontProvider.addFont(microsoft.getFontProgram(), PdfEncodings.IDENTITY_H);        }        properties.setFontProvider(fontProvider);        //        读取Html文件流，查找出当中的 或出现类似的符号空格字符        inputStream = readInputStrem(inputStream);        if (inputStream != null) {            //        生成pdf文档            HtmlConverter.convertToPdf(inputStream, pdfDocument, properties);            pdfWriter.close();            pdfDocument.close();            return;        } else {            log.error("转换失败！");        }    }        private static InputStream readInputStrem(InputStream inputStream) {        // 定义一些特殊字符的正则表达式 如：        String regEx_special = "\\&[a-zA-Z]{1,10};";        try {            //<1>创建字节数组输出流，用来输出读取到的内容            ByteArrayOutputStream baos = new ByteArrayOutputStream();            //<2>创建缓存大小            byte[] buffer = new byte[1024]; // 1KB            //每次读取到内容的长度            int len = -1;            //<3>开始读取输入流中的内容            while ((len = inputStream.read(buffer)) != -1) { //当等于-1说明没有数据可以读取了                baos.write(buffer, 0, len);   //把读取到的内容写到输出流中            }            //<4> 把字节数组转换为字符串            String content = baos.toString();            //<5>关闭输入流和输出流            //            inputStream.close();            baos.close();            //            log.info("读取的内容：{}", content);            //            判断HTML内容是否具有HTML的特殊字符标记            Pattern compile = Pattern.compile(regEx_special, Pattern.CASE_INSENSITIVE);            Matcher matcher = compile.matcher(content);            String replaceAll = matcher.replaceAll("");            //            log.info("替换后的内容：{}", replaceAll);            //            将字符串转化为输入流返回            InputStream stringStream = getStringStream(replaceAll);            //<6>返回结果            return stringStream;        } catch (Exception e) {            e.printStackTrace();            log.error("错误信息：{}", e.getMessage());            return null;        }    }        public static InputStream getStringStream(String sInputString) {        if (sInputString != null && !sInputString.trim().equals("")) {            try {                ByteArrayInputStream tInputStringStream = new ByteArrayInputStream(sInputString.getBytes());                return tInputStringStream;            } catch (Exception e) {                e.printStackTrace();            }        }        return null;    }}

4、测试

@Slf4jpublic class Test {    public static void main(String[] args) throws IOException {        long startTime = System.currentTimeMillis();        //       html文件所在相对路径        String htmlFile = "src/main/resources/html/index2.html";        //       pdf文件存储相对路径        String pdfFile = "src/main/resources/x6.pdf";        //        自定义水印        String waterMarkText =  "";        InputStream inputStream = new FileInputStream(htmlFile);        OutputStream outputStream = new FileOutputStream(pdfFile);        //微软雅黑在windows系统里的位置如下，linux系统直接拷贝该文件放在linux目录下即可        //        String fontPath = "src/main/resources/font/STHeiti Light.ttc,0";        String fontPath = "src/main/resources/font/simsun.ttc,0";        HtmlToPdfUtils.convertToPdf(inputStream, waterMarkText, fontPath, outputStream);        log.info("转换结束，耗时：{}ms",System.currentTimeMillis()-startTime);    }}

注意事项

页面中不能出现html的特殊字符标记，如等（代码中已经处理，所有都替换为空）可忽略
页面中的图片路径，必须是在项目根路径后面的所有地址（相对路径）
页面中的标签要符合规范，必须都具有结束标签等

方法三：使用Spire.Doc

将文档从一种格式转换为另一种格式是Spire.Doc的主要功能之一。这种转换只不过是加载和保存操作的组合。因此，使用Spire.DOC可以将文档从任何受支持的加载格式转换为任何受支持的保存格式。spire.doc分为商业版和免费版，免费版只支持转换前3页，以免费版为例

1、增加一个maven仓库路径

            com.e-iceblue        Http://repo.e-iceblue.cn/repository/Maven-public/

依赖

    e-iceblue    spire.doc.free    3.9.0

2、转换工具类

public class Html3Pdf {    public static void main(String[] args) throws IOException {    }        public void  spireDoc(String inputHtml,String pdfName) throws IOException {        inputHtml = "src/main/resources/html/index2.html";        //新建Document对象        Document doc = new Document();        //添加section        Section sec = doc.addSection();//        将html转化为流字符串        String htmlText = readTextFromFile(inputHtml);        //添加段落并写入HTML文本        sec.addParagraph().appendHTML(htmlText);        pdfName = "src/main/resources/x4.pdf";        //将文档另存为PDF        doc.saveToFile(pdfName, FileFORMat.PDF);        doc.dispose();    }        public static String readTextFromFile(String fileName) throws IOException {        StringBuffer sb = new StringBuffer();        BufferedReader br = new BufferedReader(new FileReader(fileName));        String content;        while ((content = br.readLine()) != null) {            sb.append(content);        }        return sb.toString();    }}

可参考：https://blog.csdn.net/csdnerM/article/details/120649237

方法四：使用Flying Sauser(技术老旧，对样式不支持)

Flying Sauser实现html2pdf，纠错能力差，支持中文、支持简单的页面和样式，开源
对html代码要求很严格。极易出现中文乱码问题

实现：

public class Html2Pdf {          public static void parsePdf(String content, String storagePath) {         FileOutputStream os = null;         try {             File file = new File(storagePath);             if(!file.exists()) {                 file.createNewFile();             }             os = new FileOutputStream(file);               ITextRenderer renderer = new ITextRenderer(); //解决中文支持问题 //            ITextFontResolver resolver = renderer.getFontResolver(); //            resolver.addFont("simhei.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); //            resolver.addFont("simhei.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);             renderer.setDocumentFromString(content); // 解决图片的相对路径问题,图片路径必须以file开头 // renderer.getSharedContext().setBaseURL("file:/");             renderer.layout();             renderer.createPDF(os);           } catch (DocumentException e) {             e.printStackTrace();         } catch (IOException e) {             e.printStackTrace();         }finally {             if(null != os) {                 try {                     os.close();                 } catch (IOException e) {                     e.printStackTrace();                 }             }         }     }            public static void main(String[] args) throws IOException {         String htmlFilePath = "";         htmlFilePath = "F:/pdf/IText实现对PDF文档属性的基本设置 - 半亩池光 - 博客园.html";         StringBuilder content = new StringBuilder();         BufferedInputStream in;         byte[] bys = new byte[1024];         int len;         in = new BufferedInputStream(new FileInputStream(htmlFilePath));         while ((len = in.read(bys)) != -1) {             content.append(new String(bys, 0, len));         }         String html = closeHTML(content.toString());         html = html.replace(" "," ");           parsePdf(html,"F:/pdf/wahaha.pdf");       }       public static String closeHTML(String str){         List arrTags = new ArrayList();         arrTags.add("br");         arrTags.add("hr");         arrTags.add("link");         arrTags.add("meta");         arrTags.add("img");         arrTags.add("input");         for(int i=0;i=0){                     int tagEnd = str.indexOf(">",tagStart);                     j = tagEnd;                     String preCloseTag = str.substring(tagEnd-1,tagEnd);                     if(!"/".equals(preCloseTag)){                         String preStr = str.substring(0,tagEnd);                         String afterStr = str.substring(tagEnd);                         str = preStr + "/" + afterStr;                     }                 }else{                     break;                 }             }         }         return str;     }   }

方法五：使用PD4ML（样式有问题）

PD4ML是纯Java的类库，使用HTML、CSS作为页面布局和内容定义格式来生成PDF文档的强大工具，可以简化最终用户生成PDF的工作。参考网站：http://www.pd4ml.com
可参考：https://GitHub.com/linkamnal/Html2Pdf
工具类：

public class HtmlToPDFUtil {     public static void main(String[] args) throws Exception {         //HtmlToPDFUtil htmlToPDFUtil = new HtmlToPDFUtil();         HtmlToPDFUtil.generatePDF_2(new File("F:\pdf/demo_ch_pd4ml.pdf"),                 "F:\pdf/flying saucer 使用中的一些问题 (java导出pdf) - 真的勇士，敢于直面这扯淡的人生 - ITeye博客.htm");           //File pdfFile = new File("D:/Test/test3.pdf"); //        String pdfPath = "D:/Test1/mmt"; // //        File file = new File(pdfPath); //        if (!file.exists()) { //            file.mkdirs(); //        } //        String pdfName = "aa.pdf"; //        File pdfFile = new File(pdfPath+File.separator+pdfName); //        StringBuffer html = new StringBuffer(); //        html.append("") //                .append("") //                .append("") //                .append("").append("") //                //.append("") //                .append("") //                .append("显示中文aaaaaaaaaa") //                .append("").append(""); //        StringReader strReader = new StringReader(html.toString()); //        HtmlToPDFUtil.generatePDF_1(pdfFile, strReader);       }       // 手动构造HTML代码     public static void generatePDF_1(File outputPDFFile, StringReader strReader)             throws Exception {         FileOutputStream fos = new FileOutputStream(outputPDFFile);         PD4ML pd4ml = new PD4ML();         pd4ml.setPageInsets(new Insets(20, 10, 10, 10));         pd4ml.setHtmlWidth(950);         pd4ml.setPageSize(pd4ml.changePageOrientation(PD4Constants.A4));         pd4ml.useTTF("java:fonts", true);                 //pd4ml.setDefaultTTFs("KaiTi_GB2312", "KaiTi_GB2312", "KaiTi_GB2312");         pd4ml.setDefaultTTFs("KaiTi", "KaiTi", "KaiTi");         pd4ml.enableDebugInfo();         pd4ml.render(strReader, fos);     }       // HTML代码来自于HTML文件     public static void generatePDF_2(File outputPDFFile, String inputHTMLFileName)             throws Exception {         FileOutputStream fos = new FileOutputStream(outputPDFFile);         PD4ML pd4ml = new PD4ML();         pd4ml.setPageInsets(new Insets(20, 10, 10, 10));         pd4ml.setHtmlWidth(950);         pd4ml.setPageSize(pd4ml.changePageOrientation(PD4Constants.A4));           pd4ml.useTTF("java:fonts", true);         pd4ml.setDefaultTTFs("KaiTi", "KaiTi", "KaiTi");         pd4ml.enableDebugInfo();         pd4ml.render("file:" + inputHTMLFileName, fos);     }   }

来源地址：https://blog.csdn.net/weixin_43981813/article/details/128135730

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: html转pdf（总结五种方法Java）

本文链接: https://www.lsjlt.com/news/386366.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

html转pdf（总结五种方法Java）

html转pdf（总结五种方法Java） Java 实现html转pdf，总结五种方法。推荐使用wkhtmltopdf,Itext 方法一：使用wkhtmltopdf 1、下载插件wkhtmlto...

99+

2023-08-31

java html pdf
JavaScript实现树结构转换的五种方法总结

目录方法一：使用递归方法二：使用循环方法三：使用 reduce方法四：使用哈希表方法五：使用深度优先搜索总结在 JavaScript 编程中，将数组转换为树结构是一个常见的需求。本篇...

99+

2023-03-15

JavaScript树结构转换 JavaScript树结构
MySQL查看版本的五种方法总结

目录方法一：登录 mysql方法二：@@version 变量方法三：VERSION() 函数方法四：SHOW VARIABLES 语句方法五：STATUS 命令总结MySQL 提供了几种用于查看服务器版本的方法，本文给大...

99+

2023-02-28

mysql查看版本命令行 mysql数据库查看版本怎么查mysql的版本
几种常见的HTML与PDF转换方法

HTML与PDF是两种常见的文档格式，HTML用于在web浏览器中呈现内容，而PDF用于打印和文档共享。有时我们需要将HTML转换成PDF或将PDF转换成HTML以适应不同的需求。本文将介绍几种常见的HTML与PDF转换方法。一、使用在线转...

99+

2023-05-14
详解用Python把PDF转为Word方法总结

先讲一下为啥要写这个文章，网上其实很多这种PDF转化的代码和软件。我一直想用Python做，但是网上搜到的代码很多都不能用，很多是2.7版本的代码，再就是PDF需要用到的库在导入的时...

99+

2024-04-02
java字符转码的三种方法总结及实例

java字符转码:三种方法转码成功的前提:解码后无乱码转码流程:文件(gbk)-->解码-->编码--->文件(utf-8) 注:如有问题请留言下面具体的实例方法一:Java.lang.S...

99+

2023-05-31

java 字符转码 ava
Java实现单链表反转的多种方法总结

对于单链表不熟悉的可以看一下基于Java实现单链表的增删改查一、原地反转 1、新建一个哨兵节点下一结点指向头结点 2、把待反转链表的下一节点插入到哨兵节点的下一节点反转之前的链...

99+

2024-04-02
【Pandas总结】第五节 Pandas 数据查询方法总结_df.loc()总结

文章目录一、写在前面二、查询方法：`df.loc()`2.1 查询单个值2.2 查询列表对应的值2.3 查询区间内的结果2.4 条件查询2.5 按照函数要求查询三、写在最后 ...

99+

2023-09-26

pandas python 数据分析
将HTML转换为PDF的方法

HTML转化为PDF是在网页开发中常见的需求之一。下面将为您介绍如何使用特定的代码示例来实现这个功能。首先，需要介绍的是一个常用的开源库——pdfmake。pdfmake是用于生成P...

99+

2024-02-24

html pdf 转化
Python去除html标签的几种方法总结

目录Python去除html标签的方法python正则表达式去除html标签的属性总结Python去除html标签的方法最近小说看得比较多，但是很多小说网站都存在各种小广告，看起来...

99+

2023-01-03

Python去除html标签 Python html标签 html标签去除
Java实现Excel转PDF的两种方法详解

目录一、使用spire转化PDF1、使用spire将整个Excel文件转为PDF2、指定单个的sheet页转为PDF二、使用jacob实现Excel转PDF（推荐使用）1、环境准备2...

99+

2024-04-02
Python格式化输出字符串的五种方法总结

目录1. 引言2. 函数 center()3. 函数 ljust()4. 函数 rjust()5. 函数 zfill()6. 函数 title()7. 使用1. 引言 Python语...

99+

2024-04-02
vue多语言转换的几种方法总结

目录一、静态转换使用方式二、vue-i18n按字查询替换使用总结一、静态转换使用 Vue 插件 language-tw-loader在打包时把本地的文字转换成繁体，动态加...

99+

2023-02-18

vue多语言转换 vue多语言转换方法 vue语言转换
Python实现求解最大公约数的五种方法总结

目录方法一：短除法方法二：欧几里得算法（辗转相除法）方法三：更相减损术方法四：穷举法（枚举法）方法五：Stein算法求最大公约数是习题中比较常见的类型，下面小编会给大家提供五种比较常...

99+

2024-04-02
Python实现将内容写入文件的五种方法总结

目录一、write()方法二、writelines() 方法三、print() 函数四、使用 csv 模块五、使用 json 模块一、write()方法使用 write() 方法：...

99+

2023-05-17

Python实现内容写入文件 Python内容写入文件 Python 文件
微信小程序之五种页面跳转方法小结

目录第一种:<navigator></navigator>标签.第二种:wx.navigateTo.第三种:wx.redirectTo.第四种:wx.swit...

99+

2024-04-02
谈谈基于Java的PDF转HTML的方法和实现

Java 是一种跨平台的编程语言，广泛应用于软件开发领域。在 PDF 文档操作方面，Java 也提供了多种开源的库和工具，其中包括 PDF 转 HTML 的功能。在本文中，我们将介绍基于 Java 的 PDF 转 HTML 的方法和实现。一...

99+

2023-05-14
Python实现单例模式的五种写法总结

目录使用模块使用装饰器基于 __new__ 方法实现基于 metaclass 方式实现单例模式（Singleton Pattern）是一种常用的软件设计模式，该模式的主要目的是确保...

99+

2024-04-02
Java基础之详细总结五种常用运算符

目录一、算术运算符二、赋值运算符三、比较运算符四、逻辑运算符五、位运算符一、算术运算符算术运算符的符号通常为:加(+)、减(-)、乘(*)、除(/)、取余(%)、自增(++)、自减...

99+

2024-04-02
java调用WebService服务的四种方法总结

目录一、前言二、简介三、具体解析第一种方式，首先得下载axis2的jar包，Axis2提供了一个wsdl2java.bat命令可以根据WSDL文件自动产生调用WebService...

99+

2024-04-02