活到老学到老 - SegmentFault 思否

puppeteer_node爬虫分布式进阶

Taste

2018-03-08

阅读 5 分钟

4.9k

因为使用的是node，所以尽可能的寻找node支持的分布式框架ZooKeeper 和 RabbitMQ 的思想百度上有好多说明，读者可以自行搜索作更详细的了解node版的zookeepernode版的RabbitMQ

puppeteer部署问题

Taste

2018-02-02

阅读 1 分钟

5.9k

本地玩的贼六，服务器上一推傻眼了来看看这都是些啥说是无法启动，但是给出了解决地址，真棒了在看看地址 [链接]说是得安装必要的依赖关系那就来吧我用的是centOS，这样来你以为这就完了，哈哈，再来同样是有提示的，设置这个 --no-sandbox 那就搞呗根据提示和文档设置参数到这就搞定了，小伙伴们要是还有其他的...

puppeteer进阶版_爬取小说站

Taste

2018-01-30

阅读 4 分钟

13.8k

使用puppeteer抓取接口拦截ajax数据这里有小伙伴就要说了我都知道接口了直接去请求不就完了吗，python，node，axios，原生的ajax那个不行啊哈哈，那要是接口参数中有随机数呢，有随机时间点呢，有随机时间戳和uuid再混起来呢分分钟怀疑人生

puppeteer的简单使用_爬取页面信息

Taste

2018-01-29

阅读 3 分钟

14.7k

它是Node的一个用来操纵浏览器的API的库，对的你没看错，就是操作浏览器的，细思极恐啊简单说就是浏览器有的它都有了(当然有些功能也正在开发中)可以注册，模拟登陆，设置cookie操作dom事件，执行js脚本Chrome团队对其维护，厉害了吧文档地址:[链接]