nodejs爬取网站图片.....

2017-12-13
阅读 2 分钟
6.3k
nodejs来实现一个爬虫功能 ,爬取豆瓣图片 原理: 爬虫是最明显的IO密集型应用场景,显然用node,使得I/O等待开销小数据挖掘比较方便 借助express模块来搭建node服务 并使用request模块获取目标页面的html代码 下载cheerio模块对html代码做处理(cheerio类似jQuery的语法,所以好用又方便) 环境配置: {代码...} (1)引入各...