scrapy链式调用正则表达式问题

HTML:

    <html>
     <head>
      <base href='http://example.com/' />
      <title>Example website</title>
     </head>
     <body>
      <div id='demo'>
     <div>
     &nbsp;&nbsp;&nbsp;&nbsp;美国国家航空航天局(NASA)与英国著名物理学家霍金携手,将共同打造微型星际飞船“纳米飞行器”。\r\n该飞行器将以五分之一光速飞行,并用<span>20</span>年时间飞到距太阳系最近的恒星之一比邻星,帮助人类尽早找到下一个适合居住的星体。
    
     </div>
      </div>
     </body>
    </html>

要获取整段文字并去掉空格,如果分两步的话,可以这样:

a=response.xpath('//div[@id="demo"]/div/text()').extract_first()
b = re.sub(r'\s+','', a) 

问题:
上面的两个步骤可不可以链式调用使两步合成一步?

response.xpath('//div[@id="demo"]/div/text()').re() //如果可以的话re()里面怎么写呢?
阅读 2.4k
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题