Python 爬虫中如何按要求，提取两个属性下的文本

我想提取的内容，是在属性为lang_id为“”和“en”下的字符串。我写的代码为

names= html.xpath('//div/a[@class="smallV110 snowplow-full-record"]/value[contains(@lang_id,None) or contains(@lang_id,"en")]')

但是运行后，发现将其他lang_id其他属性值下的字符串也读取出来了，请问各位大神，我该怎么修改呢？

阅读 2.4k

2 个回答

得票最新

✓ 已被采纳

用 value[@lang_id="" or @lang_id="en"] 取代 value[contains(@lang_id,None) or contains(@lang_id,"en")]

# 假如ele是`xpath`规则获取到的元素
ele.get("lang_id")
ele.get("en")

撰写回答

推荐问题

相似问题

找不到问题？创建新问题