Beautifulsoup 搜索

Question

Beautifulsoup 搜索

Hippie

426

发布于
2019-06-25

新手上路，请多包涵

在练习爬虫时，爬去豆瓣正在上映的电影。
如下图。bs思路是首先获取到整个正在上映的div，然后在获取下面的li标签元素。

li标签第一个是电影详情，下面还有四个子标签。我只想获取到电影内容这一恶搞标签。总是会获取到下面的子标签。试了calss=list-item 或者data-categeory=nowplaying 都不行
图片描述

图片描述

soup=BeautifulSoup(response.text,"lxml")
movies_lists=soup.find_all("div",class_="mod-bd")
nowplaying_infos=movies_lists[0].find_all("li",attrs={"class":"list-item"})
for movie in nowplaying_infos:
    print(movie.find("li"))

python

阅读 2.1k

1 个回答

得票最新

Shio

1.3k1514

发布于
2019-06-26

它是会选择你所指定的那个标签包含的所有内容的，你在选择了所有的ui-list-item那一层之后，筛选出你需要的字段就行了。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

Beautifulsoup 搜索

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Beautifulsoup 搜索

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？