压缩算法 LZW

LZW压缩算法的基本原理：提取原始文本文件数据中的不同字符，基于这些字符创建一个编译表，然后用编译表中的字符的索引来替代原始文本文件数据中的相应字符，减少原始数据大小
第一次实现的时候是用C# 和js用于数据压缩，当时刚毕业，是根据伪码写的，当时挺痛苦的，后来想想还是挺有意思的：）


#encoding = utf-8
import string

def lzw_compress(s="ababcbababaaaaaaa"):
    """
    进行lzw 压缩
    """
    dic = {}
    for i in string.ascii_letters:
        dic[i]=i

    result = ''
    key = s[0]
    #进行向后编码的起始值
    dic_index = 129
    for i in range(1,len(s)):
        v = s[i]
        key += v
        if dic.has_key(key):
            continue
        else:
            print key,
            dic[key] = unichr(dic_index)
            dic_index+=1
            result += dic.get(key[0:-1])
            #print key[0:-1],result.encode("utf-8")
            key = v
    return result

r = lzw_compress()
print "result is:" ,r.encode("utf-8")

ab ba abc cb bab baba aa aaa aaaa result is: ab*c**a**

感兴趣的同学，可以写个解压的算法，有点像破译密码，挺有意思的。注意基于编码表

压缩算法 LZW

edisonlz

引用和评论

优酷土豆移动自动部署工具

Anaconda安装教程以及Anaconda和pip配置国内镜像

科学计算编程涉及到的技术栈简介

Python3 格式化时间（qbit）

manus 的替代品有哪些？使用LLM大模型技术做手机/网页/浏览器自动化操作技术汇总

怎么判断自己下载的 trae 是国际版还是国内版？

如何系统地入门学习stm32？