xpath解析出问题

爬取豆瓣的电影,讲每个电影的<li>标签解析到list中,但是在之后对这个list进行遍历时发现list中每个元素都是相同的

movies = selector.xpath('//*[@id="content"]/div/div[1]/ol/li') #讲html解析为多个li标签
        for movie in movies:
            print(movie.xpath('//span[@class="title"][1]/text()'))#根据每个li标签解析出该电影的信息

爬取的豆瓣页面

结果

阅读 3.2k
4 个回答

//span前加个.

import requests
from pyquery import PyQuery as Q

r = requests.get('https://movie.douban.com/')
for _ in Q(r.text).find('.ui-slide-item'):
    print Q(_).find('.title').text()

你爬的网址可以给下吗?没找到你爬的这个页面

用selenium写的,但是xpath一样,楼主可以改改试试

driver = webdriver.PhantomJS()
driver.get("https://movie.douban.com/top250")
print driver.find_elements_by_xpath('//tbody/tr/td[2]/div/p')
moves = driver.find_elements_by_xpath(".//*[@id='content']/div/div[1]/ol/li/div/div[2]/div[2]/p")
for move in moves:
    print move.text
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题