python 爬虫的xpath 问题

image.png

我用xpath 这样写

leftData=htmlResult.xpath('//td[contains(@align,"left")]/text()')

最后的结果是这样 :

['\r\n\t\t\t\t\t\t\t  21060\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t    \r\n\t\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t  \r\n\t\t\t\t\t\t\t  \t\t\t', '\r\n\t\t\t\t\t\t\t  乙烯基乙炔\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  Vinyl acetylene;Buten-3-yne\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  \t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  \r\n          C', 'H', ';CH', '\r\n\t\t\t\t\t\t\t  52.04\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  -118℃  沸点:5℃\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  相对密度(水=1)0.71;\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  \r\n\t\t\t\t\t  ', '\r\n\t\t\t\t\t\t\t  \t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  稳定\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  气态(常温)\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  4(易燃气体)\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  在工业上是很需要的烯炔烃化合物,用于制备合成橡胶的单体2-氯丁二燃-[1,3]等\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  ']

根本没有这个"<-5℃" 这个数据集,求人指教,谢谢!

我觉得我写的没有问题,但是这个数据没有匹配到,不知道为啥!

网址 :https://china.guidechem.com/datacenter/msds/c/733.html

阅读 2.1k
2 个回答

/html/body/div[2]/div[4]/div[2]/table/tbody/tr/td[3]/table/tbody/tr[10]/td[2]

你应该查看xpath解析器版本,早期版本类似大小于号这种可能被xpath解析引擎当作html标签容错给忽略掉,从而导致你按照正常的xpath搜索有可能查找不到,请翻阅对应版本的官方指引,一般作特殊处理。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题