php 如何不用框架完成正则表达式对html标签及内容抓取?

新手上路,请多包涵

例如网站源码为
<div id="txtlist">
<ul>
<li><span style="float:right;">2018-03-14 16:04:47</span>·内容</li>
<li><span style="float:right;">2018-03-13 09:04:38</span>·内容</li>
</ul><ul style="margin:30px auto;">

阅读 2.4k
1 个回答

先file_get_contents到网站html内容,然后使用preg_match,preg_match_all匹配就可以了。为什么需要框架。
比如抓微信文章(我随便敲的):

   $file = file_get_contents($url);
        $article = [];
        //文章标题
        preg_match('/<title>(.*?)<\/title>/', $file, $title);
        $article[ 'title' ] = $title ? $title[ 1 ] : '';
        //文章正文
        preg_match('/<div class="rich_media_content " id="js_content">[\s\S]*?<\/div>/', $file, $content);
        
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题