php curl实现模拟登陆,并获取登陆页的信息。
<?php
/**
* --------------------------------
* Curl模拟登陆操作
* --------------------------------
* @author Corwien
* @version 2017-01
* --------------------------------
*/
//模拟登录
function login_post($url, $cookie, $post) {
$curl = curl_init();//初始化curl模块
curl_setopt($curl, CURLOPT_URL, $url);//登录提交的地址
curl_setopt($curl, CURLOPT_HEADER, 0);//是否显示头信息
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 0);//是否自动显示返回的信息
curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie); //设置Cookie信息保存在指定的文件中
curl_setopt($curl, CURLOPT_POST, 1);//post方式提交
curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));//要提交的信息
curl_exec($curl);//执行cURL
curl_close($curl);//关闭cURL资源,并且释放系统资源
}
// 登录成功后获取数据
function get_content($url, $cookie) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
// 也可以copy cookie用curl_setopt($curl, CURLOPT_COOKIE, $cookie);
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie); //读取cookie
$rs = curl_exec($ch); //执行cURL抓取页面内容
curl_close($ch);
return $rs;
}
// 登录成功后模拟发帖
function post_thread($url, $cookie, $post)
{
$curl = curl_init();//初始化curl模块
curl_setopt($curl, CURLOPT_URL, $url);//登录提交的地址
curl_setopt($curl, CURLOPT_HEADER, 0);//是否显示头信息
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 0);//是否自动显示返回的信息
curl_setopt($curl, CURLOPT_COOKIEFILE, $cookie); //读取cookie
curl_setopt($curl, CURLOPT_POST, 1);//post方式提交
curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));//要提交的信息
curl_exec($curl);//执行cURL
curl_close($curl);//关闭cURL资源,并且释放系统资源
}
//设置post的数据
$post = array (
'user_id' => '123456@qq.com',
'password' => '123456',
'goto_page' => 'http://m.app.cn/index.php',
'act' => 'login',
't' => time(),
);
//登录地址
$url = "http://m.app.cn/account/login.php";
//设置cookie保存路径
$cookie = dirname(__FILE__) . '/cookie_curl.txt';
//登录后要获取信息的地址
$url2 = "http://m.app.cn/user/wap/my_index.php";
// 1.模拟登录
login_post($url, $cookie, $post);
// 2.获取登录页的信息
// $content = get_content($url2, $cookie);
//匹配页面信息
// $preg = "/<td class='portrait'>(.*)<\/td>/i";
// preg_match_all($preg, $content, $arr);
// $str = $arr[1][0];
//输出内容
// echo $content;
// 3.模拟发帖
$thread_info = array(
'action' => 'pub',
'title' => 'Test curl',
'content' => 'Hello, world.',
't' => time(),
);
$pub_thread_url = 'http://m.app.cn/thread/api/pub_thread.php';
$ret = post_thread($pub_thread_url, $cookie, $thread_info);
print_r($ret);
//删除cookie文件
@ unlink($cookie);
?>
相关文章:
用curl抓取网站数据,仿造IP、防屏蔽终极强悍解决方式
如何应对网站反爬虫策略?如何高效地爬大量数据?
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。