php正则匹配内容?

$s= <span class="atwho-inserted" data-atwho-at-query="#">#sayhi</span>‍
  &nbsp;aaa
   <span class="atwho-inserted" data-atwho-at-query="#">#牢骚</span>‍
    bbb 
    <span class="atwho-inserted" data-atwho-at-query="#">#test</span>
    ccc

想要匹配出

<span class="atwho-inserted" data-atwho-at-query="#">#sayhi</span>‍
 <span class="atwho-inserted" data-atwho-at-query="#">#牢骚</span>‍
 <span class="atwho-inserted" data-atwho-at-query="#">#test</span>

这种标签,
于是用:

preg_match_all("/<span class=\"atwho-inserted\" .*>#[a-zA-Z0-9\x{4e00}-\x{9fa5}]+<\\/span>/u", $s, $catspan);

匹配出的$catspan是

   Array ( [0] =>
      Array ( 
          [0] => <span class="atwho-inserted" data-atwho-at-query="#">#sayhi</span>‍
           &nbsp;aaa <span class="atwho-inserted" data-atwho-at-query="#">#牢骚</span>‍
            bbb <span class="atwho-inserted" data-atwho-at-query="#">#test</span> 
            ) 
         )
     
 
 

接下来该怎么办?

阅读 3.8k
4 个回答

preg_match_all("/<span class=&quot;atwho-inserted&quot; .*>#[a-zA-Z0-9x{4e00}-x{9fa5}]+<\/span>/u", $s, $catspan);

问题在这个.*上,正则默认是贪婪匹配,而.本身就代表所有字符,自然包括>在内,所以就把后面的内容都匹配进去了。
通过修改为.*?可以实现非贪婪匹配,这样就能正确结束于>上,获得你想要的结果。

$pattern = "/\<span [^\>]+\>[^\<]+\<\/span\>/";

解题步骤

结果打印

preg_match_all('/<span[^>]+>#[^<]+<\\/span>/', $s, $catspan);

我的正则会这么写:

<span class="atwho-inserted"[^<>]*?>#[\s\S]*?</span>

不清楚你的写法是什么情况。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题