python、requests get知乎报500

Question

python、requests get知乎报500

发布于
2016-08-24

在终端中

import requests as rq
result = rq.get("https://www.zhihu.com")

返回500错误，网页可以正常访问

另外模拟登陆，返回登陆成功但rq.get('http://zhihu.com') 也还是会报500。求解

python3.x requests 知乎

阅读 6.3k

1 个回答

manong

✓ 已被采纳

嘿嘿，因为知乎想防爬虫，而你直接这样去get的话，user agent会是"python..."，知乎直接就挡掉了。但这种防爬虫太好破，你只要伪装一把user agent就行：

>>> import requests as rq
>>> result = rq.get("https://www.zhihu.com", headers = { 'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.20 (KHTML, like Gecko) Chrome/11.0.672.2 Safari/534.20' })
>>> result
<Response [200]>

当然了，知乎这样做只是防小白爬虫，他还有各种后招去对付伪装user agent等更高级别的爬虫

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

python、requests get知乎报500

你尚未登录，登录后可以

python的request库如何自动使用系统的代理？

whisper_model文件夹在哪里？