对抓取的内容去掉 \xa0
和 \n
,脑洞一开想到下面的方法:
[ re.sub('\xa0|\n','',x) for x in ele.select("div.subject.clearfix > div#info")[0].contents if x!='\n' ]
然后就报了个错:
expected string or bytes-like object
若是按照:
[ x for x in ele.select("div.subject.clearfix > div#info")[0].contents if x!='\n' ]
来则正常. 难不成 for
前面的地方不能对 x
进行一道处理吗? 应该是可以的
将x改成str(x)就好了