在学习爬虫过程中我发现了一个问题。
我使用的系统是windows10,虚拟机用的ubuntu15.10。开始学习requests库
代码:
# coding:utf-8
import requests
r = requests.get("http://movie.douban.com/subject/24751756/")
print(r.text)
在ubuntu下会正常的出现当前的界面,windows下是403错误。
我觉得在ubuntu下不正常,因为我没有填加http的头。
希望大家可以帮忙解释一下。
在我的机器下(OS X)跑,也是403,
由send的header头里面可以看出来User-Agent是python-requests,所以把User-Agent改成
再次请求就成功了。
试着用httplib打印出调试信息,对比下两个平台的发送请求的数据是否一样