pandas.read_html(url) 有时很快，有时卡住一小时都没用结果，如何处理？

dailx

561764

发布于
2019-11-14

pandas.read_html(url) 有时很快，有时卡住一小时都没用结果，如何处理？
有没有设置超时的可能，看函数说明不支持超时设置

python pandas

阅读 5.3k

1 个回答

✓ 已被采纳

首先要排查哪个地方耗时最多，最可能的两个地方

网络或服务器原因，导致页面读取慢
网页内容多，pandas（实则 lxml）解析慢

设置超时可以改用 requests 库，如

import pandas as pd
import requests

url = 'http(s)://...'
arr = pd.read_html(requests.get(url, timeout=10).text)  # 超时时间为 10秒

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？
尝试一下字节的 trae AI IDE ([链接])安装后导入 vscode 的配置，好像一起把 vscode 的插件也导入了也能看到 vscode 之前配置的 ssh remote 但是连不上看到「输出」如下⬇️ {代码...}
2 回答5k 阅读✓ 已解决
DataCap 中验证码无法显示，后台出现 NullPointerException 错误?
2 回答1k 阅读✓ 已解决
发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？
发现深拷贝和浅拷贝效果一致： {代码...} 请问一下有什么区别呢？
4 回答916 阅读✓ 已解决
如何实现一个深拷贝函数？
在项目开发中，如何实现一个深拷贝函数？
3 回答1.1k 阅读✓ 已解决
Python 成员变量在多个子类实例间共享，如何避免？
请教一下，Python版本为3.9.6，然后运行如下的代码，为什么会出现SlaveTwo类的对象modelTwo打印自身的成员变量storeDataArr的结果是['data1', 'data2']，不应该是['data2']？
3 回答1.1k 阅读✓ 已解决
为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？
官方教程：[链接]且安装了最新的 modelscope 版本 {代码...} 运行官方文档中的 demo 代码 {代码...} 但是报错了 {代码...} 让我很是无语
1 回答1.7k 阅读✓ 已解决
Spark-TTS-0.5B 的 requirements.txt 在哪里？
[链接]我都真找不到这个 requirements.txt 文件在哪里
1 回答1.2k 阅读✓ 已解决

相似问题

从 Pandas Timedelta 获取总小时数？
2 回答1.2k 阅读✓ 已解决
AttributeError: 模块 'pandas' 没有属性 'read_csv' Python3.5
1 回答3.2k 阅读
pandas read_sql速度太慢 10W行数据大概需要10秒请问下有没有优化方案
1 回答7.8k 阅读
pandas read文件时出现了MemeryError，在不shutdown当前jupyter文件的情况下如何回收内存？
1 回答6.3k 阅读✓ 已解决
使用python的pandas模块时，查找和修改dataFrame中的值速度非常慢，请问是什么原因，有什么好办法解决吗？
6 回答20.1k 阅读

找不到问题？创建新问题

pandas.read_html(url) 有时很快，有时卡住一小时都没用结果，如何处理？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？