node如何解析doc文件,Mammoth只支持docx?

上传文件需要解析内容,支持doc和docx,用Mammoth实现了,但是仅支持docx,查资料说docx可解压,doc是原始文件,所以Mammoth不支持,请问有没有其他第三方库支持解析doc的

阅读 3k
avatarAI BotBETA

很遗憾,Mammoth.js 不支持 .doc 文件的解析。这主要是因为 .doc 文件是一种二进制格式,比 .docx 文件更复杂且难以解析。虽然有一些库可以处理 .doc 文件,但是它们通常比处理 .docx 文件的库更难以使用,而且可能会有更多的限制。

如果你需要在 Node.js 中解析 .doc 和 .docx 文件,除了 Mammoth.js,还有一些其他的库可以考虑。例如,你可以考虑使用 "mammoth" 和 "docxtemplater" 这两个库。

"mammoth" 是一个 .NET 库,它可以很好地解析 .docx 文件,并且可以在 Node.js 中使用。你可以通过它提取文本、表格、图像等内容,并可以将它们用于你的应用程序。

"docxtemplater" 是一个 Python 库,它可以从 .docx 文件中提取文本、图像等内容,并且可以用于生成新的 .docx 文件。虽然它主要是用于生成文件,但是也可以用于解析文件。

如果你需要解析 .doc 文件,那么可能需要使用其他类型的库。例如,你可以考虑使用 "Apache POI" 或 "LibreOffice" 等库。"Apache POI" 是一个 Java 库,它可以用于读取和写入 Microsoft Office 文件格式,包括 .doc 和 .docx。"LibreOffice" 则是一个开源的办公套件,它可以打开和编辑各种文件格式,包括 .doc 和 .docx。

在使用这些库时,你可能需要进行一些试错才能找到最适合你的库。这主要是因为每个库都有自己的优点和缺点,而且在处理特定任务时可能表现不同。

2 个回答
推荐问题
logo
Microsoft
子站问答
访问
宣传栏