目的是是打算抓取未来40天的天气预报的最高最低温度,要抓取的目标内容如图:
尝试的代码为:item['temp_H']=response.xpath("//div[@class='city_40']/div[@class='W_left']/table/tbody/tr/td/div[@class='w_xian']/p/span[@class='max']")
但是返回的结果始终为空
用scrapy shell 了原始网页
发现就没有预期应该出现的33°和25°出现,新手可能有些东西没说清楚,但是真诚的求指导!
1.
首先禁用javascript然后查看你要的信息是否还在。
可以看到,信息并不是在html页面里面的。
reload好像并没有发现什么。
比如我发现了在
里面有
success
函数,进入后发现了一个请求,url为"http://d1.weather.com.cn/calendar_new/2017/101300501_201709.html",数据类型为script
,那么此时便可以在network选项卡中查看js filter里面的这个请求。