页面是js渲染的
这个是手机端的能获取到店铺的收藏数,数据源类似如下
https://api.m.taobao.com/h5/m...
我想最后打印出txt文件来。这个sign签名貌似无法破解,所以只能是希望等浏览器渲染好,再去抓取页面
刚接触爬虫,搜了一堆东西,目前的想法可能是 Splash with Scrapy。貌似还有一个phantomjs,但感觉好像太臃肿了,对计算机内存有要求,而且得linux系统更方便。
有没有什么方法,在windows平台就能轻松解决,而且不要打开浏览器解决,如果是你的话,你怎么解决这个问题?
这个是因为你访问得过于频繁过的反爬机制,让你去登录