关于豆瓣爬虫在ubuntu系统与windows上不同的问题。

Question

关于豆瓣爬虫在ubuntu系统与windows上不同的问题。

发布于
2016-01-01

更新于
2016-01-01

在学习爬虫过程中我发现了一个问题。
我使用的系统是windows10,虚拟机用的ubuntu15.10。开始学习requests库
代码：

# coding:utf-8

import requests

r = requests.get("http://movie.douban.com/subject/24751756/")
print(r.text)

在ubuntu下会正常的出现当前的界面，windows下是403错误。

我觉得在ubuntu下不正常，因为我没有填加http的头。
希望大家可以帮忙解释一下。

python 网页爬虫

阅读 4k

1 个回答

得票最新

xdd1874

53241529

发布于
2016-01-05

✓ 已被采纳

import requests
import httplib

httplib.HTTPConnecttion.debuglevel=1

r = requests.get("http://movie.douban.com/subject/24751756/")
print r.text

在我的机器下(OS X)跑，也是403，图片描述

由send的header头里面可以看出来User-Agent是python-requests，所以把User-Agent改成

headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_1) AppleWebKi \
                    t/537.36 (KHTML, like Gecko) Chrome/47.0.2526.73 Safari/537.36'
}

r = requests.get("http://movie.douban.com/subject/24751756/"， headers=headers)

再次请求就成功了。

试着用httplib打印出调试信息，对比下两个平台的发送请求的数据是否一样

查看全部 1 个回答

推荐问题

相似问题

找不到问题？创建新问题

关于豆瓣爬虫在ubuntu系统与windows上不同的问题。

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

关于豆瓣爬虫在ubuntu系统与windows上不同的问题。

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？