主要观点:以讽刺的方式讨论关于 AI 爬虫等网络行为的不良做法,包括无视robots.txt
、爬取表单、爬取 Git 仓库、不使用条件请求、不关闭连接、禁用“TCP sack”等,还提及因不良行为导致 startup 被各大云主机排斥,最后提出通过爬取邻居 wifi 来获取训练数据等。
关键信息:强调要以不良方式提升在网络中的表现,如对各种网络行为的不当操作及应对策略,以及因不良行为带来的后果等。
重要细节:详细描述了各种网络行为的不当做法,如爬取表单时生成数据发送、爬取 Git 仓库的方式、不关闭连接的理由等,还提到了 startup 因行为被排斥后的解决办法等。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。