我用爬虫在网上抓了一些招标信息的网页,然后用Beautiful Soup库提取出主体文本写入word,但是相应的网页上的排版格式也就没了
请问python有什么第三方库可以对这样的文本数据进行自动重拍格式吗?
又或者我想从源网页上爬取到带排版的文本写入到word中,有什么其他方法吗?
我用爬虫在网上抓了一些招标信息的网页,然后用Beautiful Soup库提取出主体文本写入word,但是相应的网页上的排版格式也就没了
请问python有什么第三方库可以对这样的文本数据进行自动重拍格式吗?
又或者我想从源网页上爬取到带排版的文本写入到word中,有什么其他方法吗?
4 回答4.5k 阅读✓ 已解决
1 回答3.4k 阅读✓ 已解决
4 回答3.9k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
2 回答467 阅读✓ 已解决
1 回答4k 阅读✓ 已解决
如果这个招标信息是一个富文本的话,你可以直接把这个元素连同html内容爬下来然后转为word。