现在上各种反爬策略的网站越来越多,如果想快速开发爬虫,还是驱动浏览器的方式比较好,我推荐用puppeteer+anyproxy,纯js环境,上手快,puppeteer直接驱动无头浏览器速度并不算慢如果遇到验证码识别等需要深度学习的,可以用python写这部分,然后nodejs和python进程间通信
现在上各种反爬策略的网站越来越多,如果想快速开发爬虫,还是驱动浏览器的方式比较好,我推荐用puppeteer+anyproxy,纯js环境,上手快,puppeteer直接驱动无头浏览器速度并不算慢
如果遇到验证码识别等需要深度学习的,可以用python写这部分,然后nodejs和python进程间通信