这句正则表达式怎么理解?

如下:
contents_pattern = re.compile('''d_post_content j_d_post_content ">(.*?)</div>''', re.S)
图片描述

阅读 2k
2 个回答

(.*?):非贪婪匹配任意文本,即找到满足该条件的最短的文本内容,你看下面的区别就明白了:

import re
contents_pattern = re.compile('''d_post_content j_d_post_content ">(.*?)</div>''', re.S)
rc = re.search(contents_pattern,'<div class="d_post_content j_d_post_content ">123</div><div>456</div>')
print(rc.group(1)) # 123

contents_pattern = re.compile('''d_post_content j_d_post_content ">(.*)</div>''', re.S)
rc = re.search(contents_pattern,'<div class="d_post_content j_d_post_content ">123</div><div>456</div>')
print(rc.group(1))# 123</div><div>456
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题