在终端中
import requests as rq
result = rq.get("https://www.zhihu.com")
返回500错误,网页可以正常访问
另外 模拟登陆,返回登陆成功 但rq.get('http://zhihu.com') 也还是会报500。求解
在终端中
import requests as rq
result = rq.get("https://www.zhihu.com")
返回500错误,网页可以正常访问
另外 模拟登陆,返回登陆成功 但rq.get('http://zhihu.com') 也还是会报500。求解
890 阅读
172 阅读
嘿嘿,因为知乎想防爬虫,而你直接这样去get的话,user agent会是"python...",知乎直接就挡掉了。但这种防爬虫太好破,你只要伪装一把user agent就行:
当然了,知乎这样做只是防小白爬虫,他还有各种后招去对付伪装user agent等更高级别的爬虫