php 扒取网页数据

扒取方法

    public function index()
    {
        $url = 'http://www.dytt8.net/';
       // $url = 'Public/txt/movies.txt';
        $content = file_get_contents($url);
        $content = iconv("gb2312", "utf-8//IGNORE",$content);
        $reg = "|<div class=\"co_content2\">(.*?)<\/div>|is";//正则匹配div
        $res = preg_match_all($reg, $content, $match);
        $count = count($match[1]);
        //有数据
        if($count)
        {
            $arr = array();
            $array = array();
            for($i=0;$i<$count;$i++)
            {
                $a = "|<a[^>]*>(.*?)<\/a>|is"; //匹配value
                $patten="/<a href=[\'\"]?([^\'\" ]+).*?>/";//匹配href值
                preg_match_all($a, $match[1][$i], $mat);
                preg_match_all($patten, $match[1][$i], $href);
                foreach($mat[1] as $key=>$val){
                    $array = array(
                         'href'=>'http://www.dytt8.net/'.$href[1][$key],
                         'name'=>$val,
                         'ctime'=>time(),
                    );
                    array_push($arr,$array);
                }

            }
            $res = $this->Movies->addAll($arr);
            if($res)
            {
                echo '抓取成功！';
            }
            else
            {
                echo '抓取失败！';
            }
        }

    }

php 扒取网页数据

mmy123456

引用和评论

android 启动一个线程处理并计算进度（完成度）

在线考试答题系统（Web+H5+小程序）开发方案与实现附源代码

一个PHPer的偷懒哲学：如何用两套模板跳过重复造轮子

一文（加代码示例）说透在线客服系统技术难点

php+mysql 搭建一个在线游戏网站目前已有2000+游戏【代码解析一】

婚恋交友系统小程序+app+h5端多端同步 TP6+Uni-app框架

PHP-Casbin 在分布式服务中利用 Watcher 做策略同步

php 扒取网页数据

mmy123456

引用和评论

android 启动一个线程处理并计算进度（完成度）

在线考试答题系统（Web+H5+小程序）开发方案与实现附源代码

一个PHPer的偷懒哲学：如何用两套模板跳过重复造轮子

一文（加代码示例）说透在线客服系统技术难点

php+mysql 搭建一个在线游戏网站目前已有2000+游戏【代码解析 一】

婚恋交友系统 小程序+app+h5端多端同步 TP6+Uni-app框架

PHP-Casbin 在分布式服务中利用 Watcher 做策略同步

php+mysql 搭建一个在线游戏网站目前已有2000+游戏【代码解析一】

婚恋交友系统小程序+app+h5端多端同步 TP6+Uni-app框架