PDF文件能够在不同的平台上呈现各种内容而不改变其外观,包括文字、图片、表格、动图等在内的内容都可以通过PDF文件进行保存、传输及展示。而HTML文件对于PDF文件展示的内容有比较好的支持,可以说拥有不输PDF文件的内容容纳能力,且HTML文件能够进行在线应用,主要用于传输和呈现网页内容。因此,如果需要将PDF文件的内容呈现于网页中,可以将PDF文件转换成HTML文件。本文将教大家如何编程将PDF文件转换为HTML文件。
本文所介绍的方法需要用到免费Office库Free Spire.PDF for Java。首先需要引入Jar文件。
1. 使用Maven
复制以下代码到项目文件夹下的“pom.xml“文件中,即可引入JAR文件。
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.com/nexus/content/groups/public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.pdf.free</artifactId>
<version>5.1.0</version>
</dependency>
</dependencies>
2. 手动添加
在Spire.Doc for Java免费版官网下载免费版,解压后,在“Project Structure“中,找到”Modules“,然后在其中的“Dependencies”中,添加解压出的“lib”文件夹下的Spire.Doc.jar文件。
将PDF文件转为HTML文件
转换操作非常简单,仅需三步,详细步骤如下:
- 创建PdfDocument类的对象。
- 用PdfDocument.loadFromFile()方法从磁盘加载PDF文档。
- 用PdfDocument.saveToFile()方法将PDF文件转换为HTML文件并保存。
代码示例:
Java
import com.spire.pdf.*;
public class PDFToHTML {
public static void main(String[] args) {
//创建Document类的对象
PdfDocument pdf = new PdfDocument();
//从磁盘加载PDF文档
pdf.loadFromFile(data/Sample.pdf");
//将PDF文档转换为HTML文件并保存
pdf.saveToFile("output/PDFToHTML.html", FileFormat.HTML);
}
}
转换效果:
以上引用的是免费的Free Spire.PDF for Java中的JAR文件。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。