常见的网站爬虫防范方案
可以将返回的数据赋值到js变量中,然后用js来循环输出到页面中。这样不利于百度
再就是还是赋值到js变量中,把一些其他的内容先循环到页面中,给特定的地方加上id标识
然后js循环的时候往那几个地方插入值就可以了。
比如:<div><span>物品</span><span id="money-物品id"></span></div>
js 部分
for(key in data){
$("#money-data[key][id]").html(data[key][money]);
}
温馨提示:对于我来说,不管网站怎么防采集都没用,我火车头什么都可以采集到,我玩的可6了。
1 回答4.1k 阅读✓ 已解决
3 回答1.8k 阅读✓ 已解决
2 回答2.2k 阅读✓ 已解决
1 回答1.6k 阅读✓ 已解决
2 回答2.2k 阅读
1 回答1.4k 阅读✓ 已解决
1 回答1.1k 阅读
很难完全避免,只能提高抓取难度
1、把价格生成图片
2、价格不直接跟页面输出,通过 js ajax 动态输出