没有办法防止,除非你的网站不是公开访问。只要浏览器能打开,也就能抓取,或者被搜索引擎爬虫抓取,或者被采集器采集。虽然不能完全防止,但是可以限制,比如UserAgent白名单、限制同一IP的访问频率等。抓取网站下载到的当然是静态资源,如果能下载后端的动态资源就很危险了,但是不必担心,只要你的后端解析器(比如php-fpm,HHVM)起作用,抓站工具抓到的,只是被解析之后的结果。
没有办法防止,除非你的网站不是公开访问。
只要浏览器能打开,也就能抓取,或者被搜索引擎爬虫抓取,或者被采集器采集。
虽然不能完全防止,但是可以限制,比如UserAgent白名单、限制同一IP的访问频率等。
抓取网站下载到的当然是静态资源,如果能下载后端的动态资源就很危险了,但是不必担心,只要你的后端解析器(比如
php-fpm
,HHVM
)起作用,抓站工具抓到的,只是被解析之后的结果。