xpath解析出问题

发布于
2018-04-20

爬取豆瓣的电影，讲每个电影的<li>标签解析到list中，但是在之后对这个list进行遍历时发现list中每个元素都是相同的

movies = selector.xpath('//*[@id="content"]/div/div[1]/ol/li') #讲html解析为多个li标签
        for movie in movies:
            print(movie.xpath('//span[@class="title"][1]/text()'))#根据每个li标签解析出该电影的信息

爬取的豆瓣页面

python xpath

阅读 3.3k

4 个回答

得票最新

勤奋的懒人

727139

发布于
2018-04-21

✓ 已被采纳

//span前加个.

prolifes

11.2k51537

发布于
2018-04-20

import requests
from pyquery import PyQuery as Q

r = requests.get('https://movie.douban.com/')
for _ in Q(r.text).find('.ui-slide-item'):
    print Q(_).find('.title').text()

PurityZw

发布于
2018-04-21

更新于
2018-04-21

新手上路，请多包涵

你爬的网址可以给下吗?没找到你爬的这个页面

thechosenone

86411326

发布于
2018-04-21

用selenium写的，但是xpath一样，楼主可以改改试试

driver = webdriver.PhantomJS()
driver.get("https://movie.douban.com/top250")
print driver.find_elements_by_xpath('//tbody/tr/td[2]/div/p')
moves = driver.find_elements_by_xpath(".//*[@id='content']/div/div[1]/ol/li/div/div[2]/div[2]/p")
for move in moves:
    print move.text

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

xpath解析出问题

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？