2

1:基本

Middlewares.py(downloader)
clipboard.png

spider/xxx.py
clipboard.png

settings.py
clipboard.png


2:优化

为了不让chrome每次启动,添加它到Middleware定义类的初始方法中启动

Middlewares.py(downloader)
clipboard.png


3:优化(浏览器的自动开启与关闭)

clipboard.png

在spider/xxx.py中
clipboard.png

Middlewares.py(downloader)
clipboard.png

加入信号链dispatcher,signals
spider/xxx.py
clipboard.png

爬虫结束会输出
clipboard.png


lilied
17 声望1 粉丝

这家伙很懒