散列函数

本文转载自查看原文 2021-11-11 20:57 123 算法

有哪些散列函数

直接定址法(指恒等转换)
平方取中法(取key平方的中间若干位作为hash值)
除留余数法(用除去一个数得到的余数作为hash值)

HashTable

HashMap

Question

hash函数为什么要选择对素数求余?

常用的hash函数是选一个数m取模（余数），这个数在课本中推荐m是素数，但是经常见到选择m=2^n，因为对2^n求余数更快，并认为在key分布均匀的情况下，key%m也是在[0,m-1]区间均匀分布的。但实际上，key%m的分布同m是有关的。

证明如下： key%m = key - xm，即key减掉m的某个倍数x，剩下比m小的部分就是key除以m的余数。显然，x等于key/m的整数部分，以floor(key/m)表示。假设key和m有公约数g，即key=ag, m=bg, 则 key - xm = key - floor(key/m)m = key - floor(a/b)m。由于0 <= a/b <= a，所以floor(a/b)只有a+1中取值可能，从而推导出key%m也只有a+1中取值可能。a+1个球放在m个盒子里面，显然不可能做到均匀。

由此可知，一组均匀分布的key，其中同m公约数为1的那部分，余数后在[0,m-1]上还是均匀分布的，但同m公约数不为1的那部分，余数在[0, m-1]上就不是均匀分布的了。把m选为素数，正是为了让所有key同m的公约数都为1，从而保证余数的均匀分布，降低冲突率。

解决hash冲突的几种的几种方法

1.线性探查法

2.平方探查法

3.链地址法

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 散列函数什么是哈希Hash(散列函数) Hash (散列函数) 常见的散列函数 hash(散列函数) 散列函数的构造方法数据结构之散列函数散列表、散列函数和散列冲突第六讲消息认证和散列函数浅析什么是哈希算法/散列函数/哈希函数