有没有什么可以优化文段排版的Python第三方库?

我用爬虫在网上抓了一些招标信息的网页,然后用Beautiful Soup库提取出主体文本写入word,但是相应的网页上的排版格式也就没了
image.png
请问python有什么第三方库可以对这样的文本数据进行自动重拍格式吗?
又或者我想从源网页上爬取到带排版的文本写入到word中,有什么其他方法吗?

阅读 2.9k
2 个回答

如果这个招标信息是一个富文本的话,你可以直接把这个元素连同html内容爬下来然后转为word。

新手上路,请多包涵

抓下来的内容,要看你做什么用?
我一般是先以符号分割字符串,然后拼接几个句子一段。希望对你有所帮助

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题