1

写微博爬虫还是比较麻烦的
一般来说使用cookie和模拟登陆的方式都可以来爬取数据
但是我只试用成功了模拟登陆的方式
基本的步骤如下:

1、在程序之初开启cookie功能
2、使用用户名和密码来获取cookie,这一步要用到api提供的一些方法来处理,然后登陆成功后就可以获取cookie
   而且相当于任何post和get请求都会带着这个cookie来进行
3、模拟登陆之后其他的就简单了,只要有weibo的地址就可以把页面内容抓取下来,不过这里抓取下来后会发现很
   多的内容是不需要的,还需要用正则表达式来匹配自己需要的东西
代码连接:http://lendfating.blog.163.com/blog/static/1820743672013285253844

dmlllll
47 声望6 粉丝