nodejs怎么爬post请求?

1、爬虫: nodejs怎么爬ajax的post请求的异步加载的内容?

一个页面异步加载新出的内容怎么抓取?
一般的get请求: www.xxxx.com/page=xxx
get请求可以通过page+1这样加。比如控制页数,抓10页
get异步请求
比如张大妈的发现

http://faxian.smzdm.com/json_more?type=new&timesort=1487861419

通过前几页,替换计算最后一个数字,实现抓取N页情况

2、post方式

而post请求,比如知乎的,一个问题下,‘更多’那个button是个post请求

https://www.zhihu.com/node/QuestionAnswerListV2

post也有url,但是无参数,直接访问可能就404。

我尝试过分析 response返回的 json字符,

{"r":0,
 "msg": (里面是新增的div的html代码,没有规律)
}

3、请问第2点说的post方式有没有办法抓?

阅读 4.2k
2 个回答
var superagent = require('superagent');

superagent.post(url).
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题