original code :
<div class="left">
<div class="i1 cur" data-key="招标公告">招标公告<span data-key="招标公告"></span></div>
<div class="i2" data-key="在线质疑" style="display:none">在线质疑<span data-key="在线质疑"></span></div>
<div class="i0" data-key="控制价" style="display:none">控制价<span data-key="控制价"></span></div>
<div class="i3" data-key="答疑">答疑<span data-key="答疑"></span></div>
<div class="i4" data-key="补充通知">补充通知<span data-key="补充通知"></span></div>
<div class="i5" data-key="中标公示">中标公示<span data-key="中标公示"></span></div>
</div>
xpath("//div[@class='left']/div[@data-key]").extract()
这样写怎么爬的是整个div scope的代码?
我只想爬date-key 对应的汉字部分?谁能解决?
试试
"//div[@class='left']/div[@data-key]/@data-key"
,参考stackoverflow,不过我不知道xpath和extract这个方法,不知道是不是引用了别的库,不过上面那个xpath的写法应该是没问题的。