MyHashMap
return h % M;
为了避免hash碰撞,我们将M往往设置成质数,避免由于键在某一范围比较集中所致大量的hash碰撞
如:当h值集中100-120,但是M取了100,这样hash所得值集中在0-20。
HashMap中的indexFor(jdk1.7)
默认值M为16
return h & (M - 1);
-
等效取余
M取值往往为2的幂次方,而M-1会产生低位全为1的情况,使得&运算结果小于M -
运算效率提高
%运算的效率低于位运算 -
碰撞问题
产生大量碰撞的情况:
二进制来看,参数key中M个低位常出现同一值。如M为4,而M-1其二进制为:1111
参数key中的低位出现同一值,如:00001110,00101110,01001110
但由此而言,产生hash碰撞的数据相差之间较大。 -
2的幂次的原因
保证小于M的每个值都可以取到
HashMap中的hash函数
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
- hashCode()返回值是32位,>>>意为右移16位,即为去返回值中的高16位
- ^:亦或运算,使用疑惑的原因是异或的真值表中1,0的比例相同为1/2,hash碰撞减少,更为散列
- 注意:null的返回值是0,但只能存在一个键为null的键值对(非null的对象hash不一定不为0,f5a5a608的hash值为0)