Java-将doc文档转换为docx文档

由于项目需要解析文档,而且文档文档很多,所以在整个网络中找不到可靠的解析文档甚至将文档转换为TXT的解决方案。

Net和java有一个收费解决方案,但我真的没有钱

C#还有其他微软解决方案,比如微软Word XXXX 14.0(我忘了中间的内容),但它确实不匹配。有两个Java解决方案,一个是org.apache.poi,另一个是Com.jacob,我使用第二个,因为我只能找到第二个的代码。我对Java知之甚少。这并不是为了使图书馆易于使用。

正文开始

我的系统是 Windows10,java环境是 jdk 1.8.0_201

一、将 jacob-1.18-x64.dll/jacob-1.18-x86.dll到系统盘:\Windows\System32下,内容见压缩包

二、开始写代码测试(我用的是 Intellij IDEA)

新建工程(原谅我java不行,新建一个 maven 管理的项目)

然后将 jacob.jar 复制到 src\main\resources\lib 中,并在pom里面添加以下内容

(懒得维护git,代码乱了照图片敲一遍就好)

<dependencies>
  <dependency>
   <groupId>com.jacob</groupId>
   <artifactId>jacob</artifactId>
   <version>1.19</version>
   <scope>system</scope>
   <systemPath>
    ${basedir}/src/main/resources/lib/jacob.jar
   </systemPath>
  </dependency>
</dependencies>

如果你也用 idea 记得在右下角点击  import changes

开始写代码,在 src\main\java\ 中新建一个 Main.java

代码放在码云上

既然来了就将他改成一个命令行工具,jar以上传,在JavaConvertDocToDocx.zip

一、改主函数

二、配置打包

三、打包

四、测试(打包前我家里一句将会把xxx转化为xxx,懒得重新截图)

用到的内容如下:

参考文章如下:

资源下载: