喝我：（滥用）使用大型语言模型压缩文本

发布于 7 月 24 日

主要观点：介绍了利用大型语言模型（LLM）进行文本压缩和解压缩的方法，通过特定代码实现，使用了llama.cpp及其python bindings，并对《爱丽丝梦游仙境》第一章等文本进行了测试，压缩效果明显，还探讨了该方法在不同方面的应用和思考。
关键信息：

介绍了load_document、generate_text、compress_text、decompress_text等关键函数的功能和作用。
测试中，对《爱丽丝梦游仙境》第一章进行压缩，原文本 11994 字符压缩为 986 字符，压缩比约 8%，对整个文件压缩，从 174355 字符减少到 25360 字符，压缩比 15%，且解压功能有效。
提到未在不同 GPU 上测试性能差异，未将脚本上传至 Github 但后续会发布，给出了压缩后的文章草稿。
思考了模型大小、用于压缩的训练模型、识别训练数据、不同模型效果及扩展到其他数据类型等问题。
重要细节：
代码中compress_text函数通过生成部分文本与源文本比较来实现压缩，decompress_text函数根据生成的计数生成文本或直接添加文本进行解压。
测试中展示了压缩过程的动画和压缩后的文本格式。
给出了相关代码的链接和演示。

阅读 34