python 爬虫 文字和图片如何保存为一种文件格式

新手上路,请多包涵

大概设想是这样的
爬虫爬取的文字和图片一起保存为哪种格式,能看到文字和图片。
比如pdf 文字和图片共存,但是图片的位置如何控制,还请大神指点。
或者有其他更好的方法,欢迎指点。

阅读 8.2k
3 个回答

提供一个方式,使用html来展示。

可以试试这个,web-html-to-pdf-python

先保存成html,然后再转成pdf

你可能的意思是提取一些有用的信息和图片,然后转成pdf,这样的话可以先试试生成html,然后转成pdf。但是生成html的过程应该很麻烦。

爬下来先保存成 HTML,给 img 标签定义为 block 元素,这样在保证性能的同时基本能适应绝大部分情况。有了 HTML 想转成别的格式就很简单了。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题