PHP如何获取HTML一个元素里面的内容

目前我是通过从网上抄来的正则实现的,可是并不能达到我想要效果。

目前我的方案是:

 $text=file_get_contents('404.html');
 preg_match('/<time[^>]*itemprop=\"datePublished\".*?>.*?<\/time>/ism',$text,$match); 
print($match[0]); 

可是最终输出的内容是

<time datetime="2017-02-20T18:41:00+08:00" itemprop="datePublished">2017年2月20日</time>

我想要的是输出2017年2月20日,也就是原因里面的内容,可是对正则不了解,看了百科完全一脸懵逼。请问该如何实现?或是正则该怎么写才能输出里面的内容

阅读 11.7k
3 个回答

这个time就是类似html标签,你用php的去html标签函数,吧这个嵌套的标签去掉,就可以了呀,看一下下面的代码,用去标签函数strip_tags()试试。具体的更多用法,你可查手册。

$text=file_get_contents('404.html');
 preg_match('/<time[^>]*itemprop=\"datePublished\".*?>.*?<\/time>/ism',$text,$match); 
print(strip_tags($match[0])); 

strip_tags是php的一个函数,用来去除字符串里的html标签,所以你这里可以用strip_tags。既然你用了正则,也可以直接用正则完成,对程序更优化。请看下面正则

preg_match('/<time[^>]*itemprop=\"datePublished\".*?>(.*?)<\/time>/ism',$text,$match);
print_r($match); 
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题