HTML是创建网页的标准标记语言,而HTML文件则是用于浏览器中展示各种内容的网页文件格式。HTML文件中通常包含有HTML标签、层叠样式表、JavaScript等Word文件无法兼容的内容,因此HTML文件通常无法直接精确转换为Word文档,只有非常简单的网页才能达到较好的效果。如果想要将HTML文件转为Word文档并且保留原始排版布局,就需要更改HTML代码,减少或去除Word不支持的内容。本文向大家介绍一个简单的方法将HTML文件转换为Word文档。
引入DLL
一、 通过NuGet安装
- 可右键单击解决方案中的依赖项,找到“管理NuGet包”,在其中搜索“FreeSpire.Doc”并添加到引用项中。
- 复制以下内容到控制台安装
PM> Install-Package FreeSpire.Doc
二、 手动添加DLL
可在在FreeSpire.Doc for .NET官网下载免费版后解压,在解决方案中找到依赖项,右键单击找到添加引用项,找到Spire.Doc.dll并添加到引用项中。
转换操作步骤
用Spire.Doc转换HTML文件为Word文档的操作十分简单,主要步骤如下:
- 创建 Document 对象。
- 用 Document.LoadFormFile() 从磁盘加载 HTML 文件。
- 用 Document.SaveToFile() 方法将HTML文件转为Word并保存。
C#
using System;
using Spire.Doc;
using Spire.Doc.Documents;
namespace ConvertHTMLtoWord
{
internal class Program
{
static void Main(string[] args)
{
//创建 Document 对象
Document document = new Document();
//从磁盘加载 HTML 文件
document.LoadFromFile(@"D:\testp\示例.html");
//将 HTML 文件转为 Word 并保存
String result = "HtmltoWord.docx";
document.SaveToFile(result, FileFormat.Html);
}
}
}
VB.NET
Imports System
Imports Spire.Doc
Imports Spire.Doc.Documents
Module Program
Sub Main(args As String())
'创建 Document 对象
Dim document As New Document()
'从磁盘加载 HTML 文件
document.LoadFromFile("D:\testp\示例.html")
'将 HTML 文件转为 Word 并保存
Dim result As String = "Html转Word.docx"
document.SaveToFile(result, FileFormat.Docx2013)
End Sub
End Module
转换效果展示:
以上代码中引入的是免费Word库Free Spire.Doc for .NET版本中的dll。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。