PDF文件是一种用于储存和传输内容的文件格式,其传输内容的方式与操作系统、应用程序以及硬件无关,因此能够在各个平台进行内容传递并保持其显示效果。但PDF文件在编辑内容的时候不太方便,且支持编辑的应用大多收费。而Word文档是一种非常适合编辑及储存内容的文件,Word文档的编辑软件功能丰富、使用方便,是比较常见软件。如果我们可以将PDF文件转为Word文档,内容编辑就会变得非常方便。本文将介绍通过简单的编程,将PDF文件转为Word文档,包括Doc和Docx。
本文所使用的转换方法需要用到免费Office库Free Spire.PDF for .NET,首先需要引入dll文件。

1.使用Nuget

可在Nuget管理中搜索Free Spire.PDF安装,或在控制台输入以下代码安装:
PM> Install-Package FreeSpire.PDF

2.手动添加

Free Spire.PDF for .NET官网下载解压,将dll添加到依赖项中。

将PDF文档转换为Word文档

转换代码非常简单,仅需三个步骤:

  1. 创建 PdfDocument 类的对象。
  2. 使用 PdfDocument.LoadFromFile() 方法从磁盘加载PDF文档。
  3. 使用 PdfDocument.SaveToFile() 方法将PDF文档转换为Word文档并保存,可选择Word文档格式。

代码示例:

C#

using Spire.Pdf;

namespace PDFToWord
{
    class Program
    {
        static void Main(string[] args)
        {
            //创建PdfDocument类的对象
            PdfDocument pdf = new PdfDocument();

            //加载PDF文档
            pdf.LoadFromFile("Sample.pdf");

            //将PDF文档转为Word文档并保存,可选择格式
            pdf.SaveToFile("result.docx", FileFormat.Docx);
        }
    }
}

VB.NET

Imports Spire.Pdf

Namespace PDFToWord
    Class Program
        Private Shared Sub Main(args As String())
            '创建PdfDocument类的对象
            Dim pdf As New PdfDocument()

            '加载PDF文档
            pdf.LoadFromFile("Sample.pdf")

            '将PDF文档转换为Word文档并保存,可选择Word文档格式
            pdf.SaveToFile("result.docx", FileFormat.Docx)
        End Sub
    End Class
End Namespace

转换效果示例:
PDF转Word

以上引用的是免费的库Free Spire.PDF for .NET中的dll文件。


大丸子
12 声望3 粉丝