算法09 五大查找之:哈希查找


前面的幾篇文章分別總結了:順序查找二分查找索引查找二叉排序樹。這一篇文章要總結的是五大查找的最后一個:哈希查找(也稱為散列查找)。提起哈希,我的第一印象就是java中的Hashtable類,它是由 key/value 的鍵值對組成的集合,它就是應用了哈希技術。

那什么是哈希查找呢?在弄清楚什么是哈希查找之前,我們要弄清楚哈希技術,哈希技術是在記錄的存儲位置和記錄的 key 之間建立一個確定的映射 f(),使得每個 key 對應一個存儲位置 f(key)。若查找集合中存在這個記錄,則必定在 f(key) 的位置上。哈希技術既是一種存儲方法,也是一種查找方法。

六種哈希函數 f(key) 的構造方法:

1、直接定址法

哈希地址:f(key) = a*key+b  (a,b為常數)

這種方法的優點是:簡單,均勻,不會產生沖突。但是需要事先知道 key 的分布情況,適合查找表較小並且連續的情況。

 

2、數字分析法

比如我們的11位手機號碼“136xxxx5889”,其中前三位是接入號,一般對應不同運營公司的子品牌,如130是聯通如意通,136是移動神州行等等。中間四位表示歸屬地。最后四位才是用戶號。

若我們現在要存儲某家公司員工登記表,如果用手機號碼作為 key,那么極有可能前7位都是相同的,所以我們選擇最后四位作為 f(key) 就是不錯的選擇。

 

3、平方取中法

故名思義,比如 key 是1234,那么它的平方就是1522756,再抽取中間的3位就是227作為 f(key) 。

 

4、折疊法

折疊法是將 key 從左到右分割成位數相等的幾個部分(最后一部分位數不夠可以短些),然后將這幾部分疊加求和,並按哈希表的表長,取后幾位作為 f(key) 。

比如我們的 key 是 9876543210,哈希表的表長為3位,我們將 key 分為4組,987|654|321|0 ,然后將它們疊加求和 987+654+321+0=1962,再取后3位即得到 f(key) = 962 。

 

5、除留余數法

哈希地址:f(key) = key mod p (p<=m) m為哈希表表長。

這種方法是最常用的哈希函數構造方法。下面的代碼中也使用了這種方法。

 

6、隨機數法

哈希地址:f(key) = random(key)  

這里 random 是隨機函數,當 key 的長度不等時,采用這種方法比較合適。

 

哈希函數沖突的兩種解決方法:

我們設計得再好的哈希函數也不可能完全避免沖突,當我們使用哈希函數后發現有 key1 != key2,但卻有 f(key1) = f(key2) ,即發生沖突。

1、開放定址法:

開放定址法就是一旦發生了沖突,就去尋找下一個空的哈希地址,只要哈希表足夠大,空的哈希地址總是能找到,然后將記錄插入。這種方法是最常用的解決沖突的方法。下面的代碼中也使用了這種方法。

2、鏈地址法:

鏈地址法不做詳細展開。

 

代碼:

HashSearch.java

import java.io.IOException;
import java.util.Scanner;

public class HashSearch {
    // 初始化哈希表
    static int hashLength = 7;
    static int[] hashTable = new int[hashLength];

    // 原始數據
    static int[] list = new int[]{13, 29, 27, 28, 26, 30, 38};

    public static void main(String[] args) throws IOException {
        System.out.println("*******哈希查找*******");

        // 創建哈希表
        for (int i = 0; i < list.length; i++) {
            insert(hashTable, list[i]);
        }
        System.out.println("展示哈希表中的數據:" + display(hashTable));

        while (true) {
            // 哈希表查找
            System.out.print("請輸入要查找的數據:");
            int data = new Scanner(System.in).nextInt();
            int result = search(hashTable, data);
            if (result == -1) {
                System.out.println("對不起,沒有找到!");
            } else {
                System.out.println("數據的位置是:" + result);
            }
        }
    }

    /**
     * 方法:哈希表插入
     */
    public static void insert(int[] hashTable, int data) {
        // 哈希函數,除留余數法
        int hashAddress = hash(hashTable, data);

        // 如果不為0,則說明發生沖突
        while (hashTable[hashAddress] != 0) {
            // 利用 開放定址法 解決沖突
            hashAddress = (++hashAddress) % hashTable.length;
        }

        // 將待插入值存入字典中
        hashTable[hashAddress] = data;
    }

    /**
     * 方法:哈希表查找
     */
    public static int search(int[] hashTable, int data) {
        // 哈希函數,除留余數法
        int hashAddress = hash(hashTable, data);

        while (hashTable[hashAddress] != data) {
            // 利用 開放定址法 解決沖突
            hashAddress = (++hashAddress) % hashTable.length;
            // 查找到開放單元 或者 循環回到原點,表示查找失敗
            if (hashTable[hashAddress] == 0 || hashAddress == hash(hashTable, data)) {
                return -1;
            }
        }
        // 查找成功,返回下標
        return hashAddress;
    }

    /**
     * 方法:構建哈希函數(除留余數法)
     *
     * @param hashTable
     * @param data
     * @return
     */
    public static int hash(int[] hashTable, int data) {
        return data % hashTable.length;
    }

    /**
     * 方法:展示哈希表
     */
    public static String display(int[] hashTable) {
        StringBuffer stringBuffer = new StringBuffer();
        for (int i : hashTable) {
            stringBuffer = stringBuffer.append(i + " ");
        }
        return String.valueOf(stringBuffer);
    }
}

 

運行結果:

 

歡迎轉載,但請保留文章原始出處

本文地址:http://www.cnblogs.com/nnngu/p/8307743.html 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM