主要观点:网络正在丢失部分内容,如每年大量旧网页消失,很多有价值的如老程序员的作品、90 年代的亚文化、个人博客、科研论文等都在逐渐流失;虽知道保存一切的做法因实际原因会失败,但认为大型语言模型(LLMs)压缩信息的能力虽有不足但仍比没有好,如 DeepSeek V3 就是互联网的有损压缩视图,同时应努力支持互联网档案馆等机构,也要确保 LLMs 的权重不丢失且档案馆成为预训练集的一部分。
关键信息:网络每年丢失旧网页;老程序员作品等在流失;个人博客等有价值内容丢失;保存一切因经济原因难实现;LLMs 压缩信息有作用;要支持互联网档案馆等。
重要细节:互联网档案馆总部曾在教堂;提及不同时期的网络相关内容如 90 年代亚文化等;强调确保 LLMs 权重和档案馆的重要性。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。