用Python 采集为什么获取不到数据呢，谢谢?

Question

用Python 采集为什么获取不到数据呢，谢谢?

万事茹意

45

发布于
2018-01-07

dokelung

4.9k1516

更新于
2018-01-08

新手上路，请多包涵

import re
import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',
    'Referer': 'http://cq.jiaoyubao.cn/',
    'Host': 'cq.jiaoyubao.cn',
    'Upgrade-Insecure-Requests': '1',
}

r = requests.get('http://cq.jiaoyubao.cn/cn/xiaoxue/', headers=headers)

print(r.status_code)
print(r.text)

以上运行结果为:

</script></div><script src="http://chat.jiaoyubao.cn/js/mchat.js"></script><script src="http://chat.jiaoyubao.cn/js/online.js?style=1"></script><script type="text/javascript" src="http://static.jiaoyubao.cn/js/share4.js"></script><script src="/bottom/js/bottom.js"></script><script type="text/javascript" src="http://static.jiaoyubao.cn/js/p.js"></script></body></html>

并没有获得有用的内容，代码初步看没什么问题，请问如何解决，谢谢

python

阅读 2.1k

1 个回答

F_W_Yue

✓ 已被采纳

pip install bs4
pip install lxml

import re
import requests
from bs4 import BeautifulSoup
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',
    'Referer': 'http://cq.jiaoyubao.cn/',
    'Host': 'cq.jiaoyubao.cn',
    'Upgrade-Insecure-Requests': '1',
}

r = requests.get('http://cq.jiaoyubao.cn/cn/xiaoxue/', headers=headers)

soup = BeautifulSoup(r.content, 'lxml')
print(soup.prettify())

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

用Python 采集为什么获取不到数据呢，谢谢?

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？