nodejs写爬虫做微博搜索有比较好的资源推荐吗?

nodejs写爬虫做微博搜索有比较好的资源推荐吗?

阅读 4.7k
2 个回答
  • 组织请求 request 首先你得模拟HTTP请求,偶尔还需要cookie容器来登录
  • 页面分析 cheerio 用熟悉的jQuery的美刀API来抓页面内容,无需gyp编译
  • 异步处理 bluebird 很多时候爬虫并不是一个请求就能拿到所有想要的数据,串行,并行,一个请求出发多个等等各种情况决定了一个异步库是必备的 promise风格的bluebird是更泛用的选择,单就爬虫的场景来说,async也不坏
  • 组织数据 lodash 如果数据复杂的话,lodash可以帮你理清整理数据结构的代码,但这不是必备,如果只是简单的数组操作,那原生的 map forEach等也足够好了

四大金刚,居家旅行,偷鸡摸狗必备佳品,直接npm install,文档都在一页之内

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题