这篇问题已被关闭，原因：问题质量差 - 问题太水、伸手党

正则表达式抓取

stephen2017

发布于
2018-02-09

更新于
2018-02-09

>>> str=''' <td>
...                                     
...                                         
...                                         应用推广
...                                     
...                                 </td>
...                                 <td>
...                                     
...                                         大图广告
...                                         
...                                         
...                                         
...                                     
...                                 </td>
...                                 <td>
...                                     信息流大图D16
...                                 </td>'''


>>> s=re.search('<td>.*?</td>.*?<td>.*?</td>.*?<td>(.*?)</td>',str,re.S).group(1)
>>> a
Traceback (most recent call last):
  File "<input>", line 1, in <module>
NameError: name 'a' is not defined
>>> s
'\n\t\t\t\t\t\t\t\t\t\xe4\xbf\xa1\xe6\x81\xaf\xe6\xb5\x81\xe5\xa4\xa7\xe5\x9b\xbeD16\n\t\t\t\t\t\t\t\t'
>>> s.strip(" ")
'\n\t\t\t\t\t\t\t\t\t\xe4\xbf\xa1\xe6\x81\xaf\xe6\xb5\x81\xe5\xa4\xa7\xe5\x9b\xbeD16\n\t\t\t\t\t\t\t\t'

正则如何匹配里面 ”信息流大图D16”不要其他的空格t n ？

正则表达式网页爬虫

阅读 1.9k

2 个回答

得票最新