一个好的向量散列函数

Question

新手上路，请多包涵

我有一些整数向量，我想在 c++11 的 unordered_map 中有效地存储我的问题是：

如何最好地存储这些并针对 .find 查询进行优化？

我想出了以下哈希：

 class uint32_vector_hasher {
public:
  std::size_t operator()(std::vector<uint32_t> const& vec) const {
    std::size_t ret = 0;
    for(auto& i : vec) {
      ret ^= std::hash<uint32_t>()(i);
    }
    return ret;
  }
};

然后将对象存储在 unordered_map 但是我有几个问题

哈希多久计算一次，只有一个，一些随机数或次数？
使用 == 和散列函数创建一个包装器对象来记忆散列并避免它被计算多次是否有意义？

在进行分析时，我注意到我的大量 cpu 时间花在查找无序地图上，这并不是最佳的:(

原文由 Martin Kristiansen 发布，翻译遵循 CC BY-SA 4.0 许可协议

c++c++11 hash

阅读 515

1 个回答

得票最新

社区维基

1

发布于
2022-11-02

HolKann 目前投票率最高的答案中的哈希函数导致大量向量的冲突率很高，这些向量都包含来自小的连续分布的元素。

为了解决这个问题，每个元素的位均匀分布（算法取自 Thomas Mueller 的答案）。

 std::size_t operator()(std::vector<uint32_t> const& vec) const {
  std::size_t seed = vec.size();
  for(auto x : vec) {
    x = ((x >> 16) ^ x) * 0x45d9f3b;
    x = ((x >> 16) ^ x) * 0x45d9f3b;
    x = (x >> 16) ^ x;
    seed ^= x + 0x9e3779b9 + (seed << 6) + (seed >> 2);
  }
  return seed;
}

原文由 see 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

一个好的向量散列函数

你尚未登录，登录后可以

如何实现一个深拷贝函数？

C++是否有集中的点（比如一个网站），用于积累所有的C++使用的三方库？

关于new运算符重载的问题?

C++有关成员函数返回类的引用的一些问题？

迟到问题，知道其他解法，但是想探求为什么以下解法不行？

java、pyhton、c++这三者的区别是什么？

Java开发者转型C++，非业务方向应学习什么技术？

Stack Overflow 翻译