正则表达式非贪婪匹配多行

假设有这样一段代码,我想从中找出,#subprinttable1 {} .tab_3 大括号里的所有东西,其他除外

需要匹配的不只一行,所以要处理换行,又要非贪婪。

#subprinttable1 {
    background-color:#f0f7ff;
} .tab_3
#subprinttable1 {
    border: 1px solid;
} tr

#subprinttable1 {
    border: 1px solid #d3dffa;
    text-align:center;
} td
#subprinttable1 {
    background-color:#eaeffd;
} tab_3
#subprinttable1 {
    background-color:#b9cbfa;
    font: 宋体;
} td.tab_1  
#subprinttable1 {
    font-weight:bold;
    background-color:#eaeffd;
} .tab_3

非贪婪用(.+?),但是如果.tab_3在大括号之前的时候(.+?)就是正确的,而上面代码用(.+?)就不对。问题在哪里?

知道结果中还有 tr 和 td.tab1 这些在里面的原因了,因为是从第二个#subprinttable {处开始匹配到第二个.tab3,所以 tr项就匹配进去了。 那如何只匹配出相关 .tab3的大括号里面的东西呢?

或者如果想匹配acaxxxb中的xxx出来,而不包括ac?

或者有方法从后往前匹配?

阅读 8.5k
1 个回答
#subprinttable1\s*\{([^}]*)\}\s*\.tab_3

这里我用\s*代替了固定的空格,另外需要注意,这个正则表达式要带上Global参数(re.M)。
每一个匹配项的第一个子匹配即为你需要获取的内容。
clipboard.png
clipboard.png
clipboard.png

re.findall(ur"#subprinttable1\s*{([^}]*)}\s*\.tab_3", s, re.M)
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题