代码:
abstract =sel.xpath('//div[@id="abstractBox"]/p/text()').extract()
我想获取<p>
和</p>
之间的html文本。
但是里面含有html符号,类似Fe<sub>3</sub>
,按照以上代码,只能获取Fe
,得不到<sub>3</sub>
。
如何解决?
谢谢!!
代码:
abstract =sel.xpath('//div[@id="abstractBox"]/p/text()').extract()
我想获取<p>
和</p>
之间的html文本。
但是里面含有html符号,类似Fe<sub>3</sub>
,按照以上代码,只能获取Fe
,得不到<sub>3</sub>
。
如何解决?
谢谢!!
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
1 回答3.8k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决
2 回答1.9k 阅读✓ 已解决
没猜错的话
用的Scrapy?
sel.xpath() 得到的依旧是一个SelectorList
参看原文档
那么实际上就是去看Selector 相关的函数了。
————————————————
对于上述例子,其实可以考虑获取到p之后,对其内容再进行一次查找,即可获得 1 、2 、3的内容。
另外
提问的话把自己的环境、代码描述全一点会对自己更有帮助