生成文件的 MD5 校验和

是否有任何简单的方法可以在 Python 中生成（和检查）文件列表的 MD5 校验和？（我有一个正在开发的小程序，我想确认文件的校验和）。

原文由 Alexander 发布，翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.3k

import hashlib def md5(fname): hash_md5 = hashlib.md5() with open(fname, "rb") as f: for chunk in iter(lambda: f.read(4096), b""): hash_md5.update(chunk) return hash_md5.hexdigest()

有一种方法内存 效率很低。

单个文件：

 import hashlib
def file_as_bytes(file):
    with file:
        return file.read()

print hashlib.md5(file_as_bytes(open(full_path, 'rb'))).hexdigest()

文件清单：

 [(fname, hashlib.md5(file_as_bytes(open(fname, 'rb'))).digest()) for fname in fnamelst]

回想一下，已知 MD5 已损坏，不应将其用于任何目的，因为漏洞分析可能非常棘手，并且分析您的代码将来可能用于安全问题的任何可能用途是不可能的。恕我直言，它应该从库中完全删除，这样每个使用它的人都被迫更新。所以，这是你应该做的：

 [(fname, hashlib.sha256(file_as_bytes(open(fname, 'rb'))).digest()) for fname in fnamelst]

如果你只想要 128 位的摘要，你可以做 .digest()[:16] 。

这将为您提供一个元组列表，每个元组都包含其文件名及其哈希值。

我再次强烈质疑您对 MD5 的使用。您至少应该使用 SHA1，考虑到最近在 SHA1 中发现的缺陷，可能甚至不会。有些人认为只要您不将 MD5 用于“加密”目的，就可以了。但是事情往往会比你最初预期的范围更广，你随意的漏洞分析可能会被证明是完全有缺陷的。最好养成一开始就使用正确算法的习惯。只需输入一串不同的字母即可。这并不难。

这是一种更复杂但 内存效率更高 的方法：

 import hashlib

def hash_bytestr_iter(bytesiter, hasher, ashexstr=False):
    for block in bytesiter:
        hasher.update(block)
    return hasher.hexdigest() if ashexstr else hasher.digest()

def file_as_blockiter(afile, blocksize=65536):
    with afile:
        block = afile.read(blocksize)
        while len(block) > 0:
            yield block
            block = afile.read(blocksize)

[(fname, hash_bytestr_iter(file_as_blockiter(open(fname, 'rb')), hashlib.md5()))
    for fname in fnamelst]

而且，再一次，因为 MD5 已经损坏，不应该再使用了：

 [(fname, hash_bytestr_iter(file_as_blockiter(open(fname, 'rb')), hashlib.sha256()))
    for fname in fnamelst]

同样，如果您只想要 128 位的摘要，则可以在调用 hash_bytestr_iter(...) [:16] 之后放置 --- 。

原文由 Omnifarious 发布，翻译遵循 CC BY-SA 4.0 许可协议

生成文件的 MD5 校验和

你尚未登录，登录后可以

Qt中布局是否只有5种呢？

这段代码为什么不能获取到数据？

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

请问一下，如何理解reduce函数呢？

如何使用Python+Selenium爬取Goodreads上万条书评而不崩溃？

如何使用 python 代码实现迅雷磁力链接资源的下载？

在PyCharm开发不同python项目，如果每个项目使用自己的venv环境，是不是每次切换项目都需要修改python interpreter？

Stack Overflow 翻译