Python 爬虫中如何按要求,提取两个属性下的文本

我想提取的内容,是在属性为lang_id为“”和“en”下的字符串。我写的代码为

names= html.xpath('//div/a[@class="smallV110 snowplow-full-record"]/value[contains(@lang_id,None) or contains(@lang_id,"en")]')

但是运行后,发现将其他lang_id其他属性值下的字符串也读取出来了,请问各位大神,我该怎么修改呢?

阅读 2.4k
2 个回答

value[@lang_id="" or @lang_id="en"] 取代 value[contains(@lang_id,None) or contains(@lang_id,"en")]

试试这样

# 假如ele是`xpath`规则获取到的元素
ele.get("lang_id")
ele.get("en")
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题