用的是python,单位内网,现有一个网页,网页包含一个20000*34的巨型表格,这样的网页有几百个。我想把网页里的table导出到本地,尝试用逐行逐个单元格遍历的方式,虽然能做,但是真是龟速。请问有没有什么库能实现这个功能?t
able导出到 list 或者直接导出到 csv XLS都行,关键就是怎么样快速导出。
谢谢
用的是python,单位内网,现有一个网页,网页包含一个20000*34的巨型表格,这样的网页有几百个。我想把网页里的table导出到本地,尝试用逐行逐个单元格遍历的方式,虽然能做,但是真是龟速。请问有没有什么库能实现这个功能?t
able导出到 list 或者直接导出到 csv XLS都行,关键就是怎么样快速导出。
谢谢
2 回答4.3k 阅读✓ 已解决
2 回答863 阅读✓ 已解决
1 回答4.1k 阅读✓ 已解决
3 回答857 阅读✓ 已解决
2 回答2.2k 阅读✓ 已解决
4 回答2.6k 阅读
3 回答906 阅读✓ 已解决
只能提供个思路哈:
读取网页:
aiohttp
和asyncio
并发读取导出:使用多进程
multiprocessing
的pool