Python requests爬取B站问题

Question

Python requests爬取B站问题

发布于
2017-12-13

使用requests+BS爬取B站视频名称时，提取不到想要的元素？

import requests
from bs4 import BeautifulSoup

url='https://search.bilibili.com/all?keyword=%E4%B8%AD%E5%9B%BD%E4%BA%A4%E9%80%9A%E4%BA%8B%E6%95%85%E5%90%88%E9%9B%86&page=1&order=pubdate'
headers={
    'Cookie':'fts=1508585882; sid=8qyd4ip9; buvid3=0980BD3F-2692-44C3-BD9F-2835C27D632326558infoc; UM_distinctid=15f3eb9d59010d-0f8304e5b36d25-791238-144000-15f3eb9d591219; pgv_pvi=1610170368; rpdid=olxqpxmpmmdoswqsqsqqw; finger=edc6ecda; fold=false',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36'
}
r=requests.get(url,headers=headers)
soup=BeautifulSoup(r.text,'lxml')
lis=soup.find_all('li',_class='video matrix ')
print(lis)

但打印soup.pretiffy()时是有class='video matrix '元素的？

python

阅读 3.3k

1 个回答

得票最新

Charles

64052836

发布于
2017-12-13

✓ 已被采纳

下划线放错位置了啊。。。。。

lis = soup.find_all('li', class_='video matrix')

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

Python requests爬取B站问题

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何使用 python 代码实现迅雷磁力链接资源的下载？

如何实现一个深拷贝函数？

请问，FastAPI如何获取到前端上传的二进制文件并且返回？

浏览器能请求到数据怎么换了api工具或是爬虫都没数据了呢？

Python 成员变量在多个子类实例间共享，如何避免？