通过命令行 ./wget.exe http://www.czce.com.cn/cn/DFS... -O downloaded.htm
报错412,下载得到的downloaded.htm文件大小0字节
同样的网址,通过chrome或者其他浏览器打开,没有问题
chrome中F12跟踪(打开Preserve log开关),发现chrome下载经过了多次下载,按顺序如下
- FutureDataDaily.html (这一次返回错误412)
- http://www.czce.com.cn/cZD7JR...
- FutureDataDaily.html (这一次得到了正确的返回数据)
期待哪位大佬了解http,爬虫和反爬虫,帮忙看看
你直接下载excel不就好了?
http://www.czce.com.cn/cn/DFSStaticFiles/Future/2022/20220214/FutureDataDaily.xls