怎样将网页中的某部分内容禁止搜索引擎抓取?

每个网页,都有一块区域的内容不希望被搜索引擎抓取,有什么好方法呢?

阅读 7.7k
6 个回答

拿js脚本来生成,脚本里面可以存放unicode转义形式,或者url编码过的文本。

ajax获取内容,然后在robots.txt里禁止搜索引擎抓取数据接口

google 也可以索引 ajax,swf的内容。我能想到的就是图片,然后根据referer 判断是否为机器人,再决定图片是否显示。

阴谋论:有的搜索引擎并非遵守robots.txt ,只是索引了,但是不现实搜索结果。

一般情况下,搜索引擎是(包括Google)不会抓取JS生成的内容的,想要Google抓取JS内容还是需要一些配置呢,Making AJAX Applications Crawlable(可能需翻墙),因此,我觉得使用JS生成内容可行。

生成图片输出,起点这些vip阅读章节就是这么做的吧

iframe 然后写robot.txt
robot.txt 指明指定的路径不希望被抓,然后在该页面引入
具体搜索引擎的robot说明,请去各自搜索引擎官方查看

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进