哈希表中hash函数中的%,&和^


MyHashMap

  return h % M;

为了避免hash碰撞,我们将M往往设置成质数,避免由于键在某一范围比较集中所致大量的hash碰撞
如:当h值集中100-120,但是M取了100,这样hash所得值集中在0-20。

HashMap中的indexFor(jdk1.7)

默认值M为16

  return h & (M - 1);
  • 等效取余
    M取值往往为2的幂次方,而M-1会产生低位全为1的情况,使得&运算结果小于M

  • 运算效率提高
    %运算的效率低于位运算

  • 碰撞问题
    产生大量碰撞的情况:
    二进制来看,参数key中M个低位常出现同一值。如M为4,而M-1其二进制为:1111
    参数key中的低位出现同一值,如:00001110,00101110,01001110
    但由此而言,产生hash碰撞的数据相差之间较大。

  • 2的幂次的原因
    保证小于M的每个值都可以取到

HashMap中的hash函数

static final int hash(Object key) {
     int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
  • hashCode()返回值是32位,>>>意为右移16位,即为去返回值中的高16位
  • ^:亦或运算,使用疑惑的原因是异或的真值表中1,0的比例相同为1/2,hash碰撞减少,更为散列
  • 注意:null的返回值是0,但只能存在一个键为null的键值对(非null的对象hash不一定不为0,f5a5a608的hash值为0)


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM