由于采用了镜像存储,所以访问七牛提供的子域名,就会从源站抓取相对应的文件。
现在有个问题,有些蜘蛛会恶意扫描七牛子域名下面的网址,如
http://七牛子域名/account/forgot-password/
http://七牛子域名/admin.asp.ZIP
这个网址在我的源站是不存在的,但是在七牛的内容存储中就会储存一个名称为 account/forgot-password/ 和 admin.asp.ZIP 的垃圾文件。
恶意蜘蛛往往是大量扫描的,所以在我的七牛空间中会产生大量这样无用的文件。
请问,在使用镜像存储的情况下,如何如果禁止七牛自动储存源站不存在的文件?
这个应该是取决你源站的,举个栗子,假设蜘蛛扫了一下
http://七牛子域名/admin.asp.ZIP
那么七牛会将七牛子域名替换为你源站域名去访问你的源站,例如:
http://你的源站域名/admin.asp.ZIP
这时候,如果你源站没有这个资源,你要响应404,七牛那么自然会抓取失败
如果这个时候,你源站响应的是200,那么七牛应该会抓过来一个空文件,命名为 admin.asp.ZIP