Python Xpath、css选择器,获取的数据不完整?

如图,Xpath取得值只有一半,完整的网址被截断了。

clipboard.png
如图,css选择器也只取到了一半的网址,被截断了。

clipboard.png
代码如下:

class FspiderSpider(Spider):
    name = 'FSpider'
    allowed_domains = ['eastmoney.com']
    start_urls = ['http://finance.eastmoney.com/news/cgnjj_2.html']

    def parse(self, response):
        con_url = response.Xpath('/html/body/div[1]/div/div[2]/div[1]/div[2]/ul/li[20]/div/p[1]/a')
        print(con_url)
        pass
阅读 4.2k
2 个回答

并不是被截断了,而是只显示这么多。你要提取url,应该这么写:

con_url = response.xpath('/html/body/div[1]/div/div[2]/div[1]/div[2]/ul/li[20]/div/p[1]/a/@href').extract_first()

'/html/body/div[1]/div/div[2]/div[1]/div[2]/ul/li[20]/div/p[1]/a/@href'
完整的网址是什么样的呢

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题