在 python 中,我试图找到最快的散列 pandas 数据框中的每个值。
我知道任何字符串都可以使用以下方法进行哈希处理:
hash('a string')
但是我如何将这个函数应用到 pandas 数据框的每个元素上呢?
这可能是一件非常简单的事情,但我才刚刚开始使用 python。
原文由 user3664020 发布,翻译遵循 CC BY-SA 4.0 许可协议
在 python 中,我试图找到最快的散列 pandas 数据框中的每个值。
我知道任何字符串都可以使用以下方法进行哈希处理:
hash('a string')
但是我如何将这个函数应用到 pandas 数据框的每个元素上呢?
这可能是一件非常简单的事情,但我才刚刚开始使用 python。
原文由 user3664020 发布,翻译遵循 CC BY-SA 4.0 许可协议
Pandas 还有一个函数可以在数组或列上应用哈希函数:
import pandas as pd
df = pd.DataFrame({'a':['asds','asdds','asdsadsdas']})
df["hash"] = pd.util.hash_array(df["a"].to_numpy())
原文由 bert wassink 发布,翻译遵循 CC BY-SA 4.0 许可协议
2 回答5.2k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
2 回答877 阅读✓ 已解决
1 回答1.8k 阅读✓ 已解决
将
hash
函数传递给apply
在str
列:如果您想对每个元素执行此操作,请调用
applymap
: