百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

如何在Java中将DOCX转换为PDF java word转pdf poi

lipiwang 2024-11-01 14:13 7 浏览 0 评论

自从Microsoft Word 2003中引入DOCX格式以来,由于其易于编辑和深入的设计选择,DOCX格式一直在全球各地的办公室中享有很高的知名度。但是9当涉及到兼容性,尤其是最终用户的查看一致性时,它的局限性开始显现出来。

它的复杂性很快就成为一种负担,兼容应用程序的不同版本会给您艰苦的设计带来意想不到的(通常是不幸的)后果。相反,无论设备,操作系统还是应用程序,PDF都具有无所不在的支持和无与伦比的一致显示保真度。但有啥用?,要进行编辑时,PDF也不实用。转换肯定冲会员。

由于这些优点和缺点,在两种格式之间进行转换仍然非常必要,而且在许多情况下通常很关键。手动将少量DOCX文件转换为PDF格式可能很简单,但工作中有很多呢?需要机械性重复呢?从程序角度看待这种转换,必须解决许多问题。

我们的主要问题是首先解析DOCX文件。这样做的主要原因是DOCX非常复杂。此格式的ECMA规范包括5000页,并定期添加新功能。另外,DOCX中的选择深度成为一把双刃剑。另一个问题是DOCX文件实际上是包含多个元数据和文档文件的压缩存档。使用“ rels”对这些文件之间的关系进行排序当然不是一件容易的事。而且,我们甚至还没有解决将所有解析后的数据转换成最终PDF的问题。

让我们假设没有开发时间或预算来从头开始研究整个过程。本教程将展示如何通过使用基于云的API来执行从DOCX到PDF的转换来解决这一难题。还将介绍如何使用此API对DOCX文件执行搜索和替换操作。

实际上,以编程方式对DOCX文件执行搜索和替换非常困难,因为它直接遇到了前面提到的解析问题。但还好的是,我们的API也可以为我们执行此任务。将所有这些放在一起,将使我们能够使用DOCX的编辑功能轻松地为报告,发票,邮件等创建富文本模板,并通过搜索和替换填充它们,然后将它们转换为PDF格式。因此,我们可以利用DOCX的优势来弥补PDF中缺少编辑选项。

在今天的演示中,我们的主要目标是在转换中保持最高的保真度。重要的设计选择(如页面布局,表格和注释)将保持不变。话虽如此,让我们开始设置过程。

我们的第一步包括安装API客户端。向我们的Maven POM文件添加一个存储库引用,如下所示:

XML格式

<repositories>
    <repository>
        <id>jitpack.io</id>
        <url>https://jitpack.io</url>
    </repository>
</repositories>


在添加以下依赖项引用之后,这将允许Jitpack动态编译我们的库:

XML格式

<dependencies>
<dependency>
    <groupId>com.github.Cloudmersive</groupId>
    <artifactId>Cloudmersive.APIClient.Java</artifactId>
    <version>v3.62</version>
</dependency>
</dependencies>


编译我们的库之后,我们现在可以将其实现到控制器中了。只需将这些导入命令添加到文件的开头即可。

// Import classes:
//import com.cloudmersive.client.invoker.ApiClient;
//import com.cloudmersive.client.invoker.ApiException;
//import com.cloudmersive.client.invoker.Configuration;
//import com.cloudmersive.client.invoker.auth.*;
//import com.cloudmersive.client.EditDocumentApi;


现在是时候调用我们的第一个函数,在本例中为convertDocumentDocxToPdf。下面是一些示例代码,演示了如何构造此代码。

piClient defaultClient = Configuration.getDefaultApiClient();
// Configure API key authorization: Apikey
ApiKeyAuth Apikey = (ApiKeyAuth) defaultClient.getAuthentication("Apikey");
Apikey.setApiKey("YOUR API KEY");
// Uncomment the following line to set a prefix for the API key, e.g. "Token" (defaults to null)
//Apikey.setApiKeyPrefix("Token");
EditDocumentApi apiInstance = new EditDocumentApi();
ReplaceStringRequest reqConfig = new ReplaceStringRequest(); // ReplaceStringRequest | Document string replacement configuration input
try {
    byte[] result = apiInstance.editDocumentDocxReplace(reqConfig);
    System.out.println(result);
} catch (ApiException e) {
    System.err.println("Exception when calling EditDocumentApi#editDocumentDocxReplace");
    e.printStackTrace();
}


尽管不是特别复杂,但必须遵循一些要求:

  • 有效的DOCX文档应用作我们的inputFile
  • 必须从API实例调用我们的函数
  • 使用API密钥,可以从Cloudmersive网站免费获得。该密钥是免费的,永久有效,将输入文件限制为4MB,并允许从任何Cloudmersive API调用1,000个API。

完成之后,就完成了DOCX to PDF的设置。如果进行测试运行,将看到我们已经可以开始实时转换文档。

现在让我们转向使用DOCX模板创建富文本PDF文档的问题。搜索和替换是动态替换字段以填充这些模板的理想工具。对于单个搜索和替换操作,可以使用editDocumentDocxReplace,它将接受ReplaceStringRequest对象。它由一个inputFile(通过字节数组或URL),要搜索的matchString,replaceString和matchCase bool组成,后者确定是否考虑字母大小写。这是一些示例代码,您可以将其用作参考:

ApiClient defaultClient = Configuration.getDefaultApiClient();
//配置API密钥授权:Apikey
ApiKeyAuth Apikey = (ApiKeyAuth) defaultClient.getAuthentication("Apikey");
Apikey.setApiKey("YOUR API KEY");
//取消注释以下行以设置API密钥的前缀,例如“ Token”(默认为null)
//Apikey.setApiKeyPrefix("Token“);
EditDocumentApi apiInstance = new EditDocumentApi();
ReplaceStringRequest reqConfig = new ReplaceStringRequest(); // ReplaceStringRequest | 文档字符串替换配置输入
try {
    byte[] result = apiInstance.editDocumentDocxReplace(reqConfig);
    System.out.println(result);
} catch (ApiException e) {
    System.err.println("Exception when calling EditDocumentApi#editDocumentDocxReplace");
    e.printStackTrace();
}

那么,如果需要一次替换大量字符串怎么办?不必重复调用前面提到的函数,我们可以改用editDocumentDocxReplaceMulti。此函数还接受一个请求对象,该对象包含一个单独的字符串替换请求数组,每个请求都有自己的matchString和replaceString。这样可以快速替换字符串,使其在与DOCX模板结合使用时特别有用。例如,可以通过单个函数实时地以诸如名称,地址和日期之类的值填充表单中的所有各个字段。

在该库中,还可以找到用于标识和填充PDF表单字段,检索和编辑元数据,文件验证以及多种流行文件格式之间的转换的功能。

相关推荐

ubuntu单机安装open-falcon极度详细操作

备注:以下操作均由本人实际操作并得到验证,喜欢的同学可尝试操作安装。步骤一1.1环境准备(使用系统:ubuntu18.04)1.1.1安装redisubuntu下安装(参考借鉴:https://...

Linux搭建promtail、loki、grafana轻量日志监控系统

一:简介日志监控告警系统,较为主流的是ELK(Elasticsearch、Logstash和Kibana核心套件构成),虽然优点是功能丰富,允许复杂的操作。但是,这些方案往往规模复杂,资源占用高,...

一文搞懂,WAF阻止恶意攻击的8种方法

WAF(Web应用程序防火墙)是应用程序和互联网流量之间的第一道防线,它监视和过滤Internet流量以阻止不良流量和恶意请求,WAF是确保Web服务的可用性和完整性的重要安全解决方案。它...

14配置appvolume(ios14.6配置文件)

使用AppVolumes应用程序功能,您可以管理应用程序的整个生命周期,包括打包、更新和停用应用程序。您还可以自定义应用程序分配,以向最终用户提供应用程序的特定版本14.1安装appvolume...

目前流行的缺陷管理工具(缺陷管理方式存在的优缺点)

摘自:https://blog.csdn.net/jasonteststudy/article/details/7090127?utm_medium=distribute.pc_relevant.no...

开源数字货币交易所开发学习笔记(2)——SpringCloud

前言码云(Gitee)上开源数字货币交易所源码CoinExchange的整体架构用了SpringCloud,对于经验丰富的Java程序员来说,可能很简单,但是对于我这种入门级程序员,还是有学习的必要的...

开发JAX-RPC Web Services for WebSphere(下)

在开发JAX-RPCWebServicesforWebSphere(上)一文中,小编为大家介绍了如何创建一个Web服务项目、如何创建一个服务类和Web服务,以及部署项目等内容。接下来小编将为大...

CXF学习笔记1(cxf client)

webservice是发布服务的简单并实用的一种技术了,个人学习了CXF这个框架,也比较简单,发布了一些笔记,希望对笔友收藏并有些作用哦1.什么是webServicewebService让一个程序可...

分布式RPC最全详解(图文全面总结)

分布式通信RPC是非常重要的分布式系统组件,大厂经常考察的Dubbo等RPC框架,下面我就全面来详解分布式通信RPC@mikechen本篇已收于mikechen原创超30万字《阿里架构师进阶专题合集》...

Oracle WebLogic远程命令执行0day漏洞(CVE-2019-2725补丁绕过)预警

概述近日,奇安信天眼与安服团队通过数据监控发现,野外出现OracleWebLogic远程命令执行漏洞最新利用代码,此攻击利用绕过了厂商今年4月底所发布的最新安全补丁(CVE-2019-2725)。由...

Spring IoC Container 原理解析(spring中ioc三种实现原理)

IoC、DI基础概念关于IoC和DI大家都不陌生,我们直接上martinfowler的原文,里面已经有DI的例子和spring的使用示例《InversionofControlContainer...

Arthas线上服务器问题排查(arthas部署)

1Arthas(阿尔萨斯)能为你做什么?这个类从哪个jar包加载的?为什么会报各种类相关的Exception?我改的代码为什么没有执行到?难道是我没commit?分支搞错了?遇到问题无法在...

工具篇之IDEA功能插件HTTP_CLENT(idea2021插件)

工具描述:Java开发人员通用的开发者工具IDEA集成了HTTPClient功能,之后可以无需单独安装使用PostMan用来模拟http请求。创建方式:1)简易模式Tools->HTTPCl...

RPC、Web Service等几种远程监控通信方式对比

几种远程监控通信方式的介绍一.RPCRPC使用C/S方式,采用http协议,发送请求到服务器,等待服务器返回结果。这个请求包括一个参数集和一个文本集,通常形成“classname.meth...

《github精选系列》——SpringBoot 全家桶

1简单总结1SpringBoot全家桶简介2项目简介3子项目列表4环境5运行6后续计划7问题反馈gitee地址:https://gitee.com/yidao620/springbo...

取消回复欢迎 发表评论: