Python 模块 mammoth 怎么转换 docx 文件为html并保留图片的宽度和高度属性?

mammoth 模块,可以将 docx 文件转为 html,可以清理掉 html 代码中 word 的一些特定格式.也能输出 docx 文件中的图片.
在 windows 的 cmd 下,使用如下命令:
mammoth document.docx --output-dir=output-dir
则在 output-dir 目录下,输出 html 文件和图片文件. 但问题是:
html文件里图片文件的高度和宽度属性都删除掉了,图片元素的代码一般这样:

<img src="1.png" />

怎么做才能在html文件中保留图片元素的高度和宽度信息呢?
例如格式这样:

<img src="1.png" width="300" height="200" />

多谢您回复!

阅读 5.3k
1 个回答
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏