Python 爬虫中如何按要求,提取两个属性下的文本

我想提取的内容,是在属性为lang_id为“”和“en”下的字符串。我写的代码为

names= html.xpath('//div/a[@class="smallV110 snowplow-full-record"]/value[contains(@lang_id,None) or contains(@lang_id,"en")]')

但是运行后,发现将其他lang_id其他属性值下的字符串也读取出来了,请问各位大神,我该怎么修改呢?

阅读 2.4k
2 个回答

value[@lang_id="" or @lang_id="en"] 取代 value[contains(@lang_id,None) or contains(@lang_id,"en")]

试试这样

# 假如ele是`xpath`规则获取到的元素
ele.get("lang_id")
ele.get("en")
推荐问题