在scrapy中使用正则表达式匹配“xa0”的问题:
html是这样的
<div>数量:100-200个 </div>
要取出100-200个
,其他不要。
解析:
response.xpath('/html/body/div/text()').re_first('数量:(.+)\s$')
解析结果是:
100-200个\xa0\xa0\xa0
xa0
对应html中的 
,html中有4个 
,解析结果有3个xa0
,怎么修改正则表达式可以去掉解析结果的3个xa0
?
用strip()去掉首尾空格