robots.txt文件怎么写能只允许爬首页和指定链接?

User-Agent: *
Disallow: /
Allow: /article

比如我这样写,他会爬取article目录下的网页,但是我还想蜘蛛爬取首页怎么办?除此以外的链接我不想让蜘蛛爬取到

阅读 3.9k
1 个回答
User-Agent: *
Disallow: /*
Allow: /$
Allow: /test.html

测试结果:

clipboard.png
clipboard.png
clipboard.png

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进