主要观点:无法完全阻止网站的“AI”训练,可采取一些措施让 AI 业务的半吊子骗子离开。
关键信息:
- 2024 年 6 月 9 日及相关更新,如 2024 年 9 月 24 日关于 originality.ai 增加 AI 爬虫阻止趋势的页面,2024 年 6 月 14 日添加 darkvisitors.com API 和 GPC。
- robots.txt:可添加 Dark Visitors 提供的最新 AI 代理行到 robots.txt 文件,通过 Makefile 自动更新,清理脚本可处理过时文件,用 Pass 存储令牌。
- noai 元标签:在 HTML 头部添加 <meta name="robots" content="noai, noimageai">,此操作的退出机制在网站服务条款或用户协议支持下更有效。
- 新:服务器隐私退出,包含新的 SPC 元标签和 X-Robots-Tag 头,可从服务器向客户端的 AI 爬虫发送合法可执行的隐私信号,目前已有 X-Robots-Tag: noai, noimageai, SPC。
重要细节: - Dark Visitors - A List of Known AI Agents on the Internet是获取更新的 AI 代理行的来源。
- Raptive Support covers the noai meta tag介绍了 noai 元标签的相关内容。
- The Internet is a Series of Webs探讨了互联网的未来及相关问题。
- For tech CEOs, the dystopia is the point提到 CEO 对相关观点的看法。
- Apple Removes Nonconsensual AI Nude Apps Following 404 Media Investigation关于苹果删除非自愿 AI 裸照应用的报道。
- Amazon is filled with garbage ebooks. Here’s how they get made.介绍了亚马逊垃圾电子书的制作情况。
- “Pink slime” local news outlets erupt all over US as election nears提及选举临近时“粉红粘液”新闻的情况。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。