我希望我的 Python 脚本从此 法兰克福证券交易所网页 下载 主数据(下载,XLSX) Excel 文件。
当使用 urrlib
和 wget
检索它时,结果是 URL 指向一个 Blob ,下载的文件只有 289 字节且不可读。
我完全不熟悉 Blob 并有以下问题:
可以使用 Python 成功检索“Blob 后面”的文件吗?
如果是这样,是否有必要揭开 Blob 背后的“真实”URL——如果有这样的东西——以及如何揭开?我在这里担心的是上面的链接不会是静态的,但实际上会经常变化。
原文由 P A N 发布,翻译遵循 CC BY-SA 4.0 许可协议
那个 289 字节长的东西可能是
403 forbidden
页面的 HTML 代码。发生这种情况是因为服务器很聪明,如果您的代码未指定用户代理,则会拒绝。蟒蛇3
蟒蛇2