使用 scrapy.Request 方法来采集页面,但是却没有任何执行。
import scrapy
def ret(response):
print('start print')
print(response.body)
url = 'https://doc.scrapy.org/en/latest/intro/tutorial.html'
v = scrapy.http.Request(url=url, callback=ret)
print(url, v)
输出内容:
https://doc.scrapy.org/en/latest/intro/tutorial.html
<GET https://doc.scrapy.org/en/latest/intro/tutorial.html>
方法ret
完全就没有执行,无法打印出对应的内容
你只是定义了一个Request, 定义好的Request自己并不去去建立网络联接并下载, 而是能过scrapy的Downloader和Spider来完成.
参考官方文档:
如果想让他运行, 可以定义如下的spider
保存成文件
scrapy_cb.py
, 然后通过来运行