0
from scapy.all import *
sniff(
    iface='eth0',
    prn=GET_print,
    lfilter=lambda p: "GET" in str(p) ,
    filter="host xx.dingyuan.com or aa.dingyuan.com or code.dingyuan.com or file.dingyuan.com or kkd.dingyuan.com or www.dingyuan.com or user.dingyuan.com")
    

这里的sniff函数中的过滤能不能写成正则匹配,因为都是同一个主域名,如果以后域名越多,这个过滤列表会很长。

或者能不能直接写成类似 *.dingyuan.com。

2017-06-09 提问
1 个回答
0

已采纳

您可能誤會sniff filters的意思,具体的sniff filters範例在此,未必和域名相關。

若你是要爬特定或不爬特定網域的頁面,應該是使用如此處提供的代碼,用的就是正規表示

Rule(LinkExtractor(allow=('^http://example.com/category/\?.*?(?=page=\d+)', )), callback='parse_item'),

撰写答案

推广链接