由于项目需要解析文档,而且文档文档很多,所以在整个网络中找不到可靠的解析文档甚至将文档转换为TXT的解决方案。
Net和java有一个收费解决方案,但我真的没有钱
C#还有其他微软解决方案,比如微软Word XXXX 14.0(我忘了中间的内容),但它确实不匹配。有两个Java解决方案,一个是org.apache.poi,另一个是Com.jacob,我使用第二个,因为我只能找到第二个的代码。我对Java知之甚少。这并不是为了使图书馆易于使用。
正文开始
我的系统是 Windows10,java环境是 jdk 1.8.0_201
一、将 jacob-1.18-x64.dll/jacob-1.18-x86.dll到系统盘:\Windows\System32下,内容见压缩包
二、开始写代码测试(我用的是 Intellij IDEA)
新建工程(原谅我java不行,新建一个 maven 管理的项目)
然后将 jacob.jar 复制到 src\main\resources\lib 中,并在pom里面添加以下内容
(懒得维护git,代码乱了照图片敲一遍就好)
<dependencies>
<dependency>
<groupId>com.jacob</groupId>
<artifactId>jacob</artifactId>
<version>1.19</version>
<scope>system</scope>
<systemPath>
${basedir}/src/main/resources/lib/jacob.jar
</systemPath>
</dependency>
</dependencies>
如果你也用 idea 记得在右下角点击 import changes
开始写代码,在 src\main\java\ 中新建一个 Main.java
代码放在码云上
既然来了就将他改成一个命令行工具,jar以上传,在JavaConvertDocToDocx.zip
一、改主函数
二、配置打包
三、打包
四、测试(打包前我家里一句将会把xxx转化为xxx,懒得重新截图)
用到的内容如下:
参考文章如下: