人工智能仇恨者构建陷阱以捕获和欺骗忽略 robots.txt 的人工智能抓取器

去年夏天，Anthropic 的 ClaudeBot AI 爬虫因每天被指对网站进行百万次以上的访问而引发了强烈反响。同时，不止 Anthropic 这一家人工智能公司因被指忽视 robots.txt 文件中的指令而成为头条新闻，Reddit 的 CEO 也指责了那些其爬虫被认为“难以阻止”的人工智能公司，尽管科技行业通常同意尊重“禁止抓取”的 robots.txt 规则。

一位软件开发者 Aaron 注意到 Facebook 的爬虫在他的网站上访问量超过 3000 万次后，开始策划一种针对“侵占”网站的爬虫的新攻击方式，并基于反垃圾邮件的网络安全策略创建了名为 Nepenthes 的恶意软件，它会像食肉植物一样“吞噬”进入的任何东西。Aaron 明确警告用户 Nepenthes 是攻击性恶意软件，不建议网站所有者使用它来困住 AI 爬虫，而是希望通过这种方式让 robots.txt 更有“威力”。

Tarpits 原本是为了浪费垃圾邮件发送者的时间和资源而设计的，现在像 Aaron 这样的人将其演变成了一种反 AI 武器，截至目前，Nepenthes 可以有效地困住所有主要的网络爬虫，只有 OpenAI 的爬虫成功逃脱。然而，目前尚不清楚 tarpits 或其他 AI 攻击最终能造成多大的损害。

Nepenthes 在 1 月中旬发布后迅速受到关注，引发了其他类似的 tarpit 工具的出现，如 Iocaine。Iocaine 从 Nepenthes 获得灵感，更侧重于用 tarpit 来毒害 AI 模型。

运行像 Nepenthes 这样的恶意软件会给服务器带来负担，有人担心广泛部署 Nepenthes 不仅会增加服务器负担，还会增加 AI 抓取的成本。但 Aaron 认为这可能会减缓 AI 投资，从而可能抑制一些能源消耗。

批评者认为 Nepenthes 这样的工具可能很容易被 AI 爬虫避开，而且攻击 AI 或浪费 AI 资源不仅会扰乱科技行业，还可能威胁到全球利用 AI 解决社会问题的进展。但 VanHoudnos 认为 tarpitting 是一个需要认真对待的工具，因为它在系统的整个生命周期中都是一个工具，没有万能的解决方案。

Aaron 表示他从未打算将 Nepenthes 作为一个主要项目，目前他预计 Nepenthes 对那些希望 AI 公司为抓取其数据付费的权利持有者最有吸引力，而 Geuter 认为 Nepenthes 更多是一种社会政治声明。随着 AI 的发展，攻击也在不断演变，tarpits 被视为 Aaron 和 Nagy 参与抵抗的“有力象征”，Nagy 希望让 AI 中毒成为常态。