php底層HashTable的實現

本文轉載自查看原文 2015-03-06 17:19 4294 php

本文轉載自： http://segmentfault.com/blog/tree/1190000000718519

HashTable對PHP來說是一種非常重要的數據結構。很多PHP的內部實現（變量的作用域，函數表，類的屬性、方法，數組）就是通過HashTable來實現的。最近了解了一下PHP底層HashTable的實現。

PHP底層HashTable的實現有兩個非常重要的結構分別是:HashTable和Bucket。

先說一下HashTable結構:

HashTable的底層實現代碼如下:

typedef struct _hashtable{

uint nTableSize; // hash Bucket的大小，最小為8

uint nTableMask; //nTableSize - 1, 索引取值的優化

uint nNumofElements // bucket 里面存的總數

ulong nNextFreeElement //下一個數字索引的位置

Bucket *pInternalPointer //當前遍歷的指針(foreach比較快的原因)

Bucket *pListHead //整個hashtable的頭指針

Bucket *pListTail //整個hashTable的尾指針

Bucket **argBuckets // Buceket 數組，用來存儲數據

doctor_func_t pDestructor //刪除元素時的回調函數，用於資源的釋放

zend_bool persistent //Bucket的內存分配方式，true使用系統的分配函數，false 使用php的內存分配函數

unsigned char nApplyCount //標記當前hash bucket 被遞歸的次數

zend_bool bApplyProtection

#if ZEND_DEBUG

int inconsistent

#endif

}HashTable

建議不太了解hash數據結構的同學先簡單了解一下hash結構。

簡單說一下php中hashtable的初始化操作:

代碼如下：

ZEND_API int _zend_hash_init(HashTable *ht, uint nSize, hash_func_t pHashFunction, dtor_func_t pDestructor, zend_bool persistent ZEND_FILE_LINE_DC)

{

uint i = 3;

//...

if (nSize >= 0x80000000) {

/* prevent overflow */

ht->nTableSize = 0x80000000;

} else {

while ((1U << i) < nSize) {

i++;

}

ht->nTableSize = 1 << i;

}

// ...

ht->nTableMask = ht->nTableSize - 1;

/* Uses ecalloc() so that Bucket* == NULL */

if (persistent) {

tmp = (Bucket **) calloc(ht->nTableSize, sizeof(Bucket *));

if (!tmp) {

return FAILURE;

}

ht->arBuckets = tmp;

} else {

tmp = (Bucket **) ecalloc_rel(ht->nTableSize, sizeof(Bucket *));

if (tmp) {

ht->arBuckets = tmp;

}

return SUCCESS;

}

最開始判斷需要初始化的hashtable大小是不是超過了系統能使用的最大大小。下面是對tablesize大小的一個處理。將用戶自定義的大小改成需要的大小。例如:如果用戶定義的hashtable大小是6，那初始化時，就會將6變成8，如果用戶定義的大小為11，那初始化后的Hashtable的大小為16.

下面就是一個簡單的判斷，來決定是按照C語言本身的分配內存函數來分配內存，還是根據php封裝好的內存分配函數來分配內存。

再談一下 bucket的結構

typedef struct bucket{

ulong h; //對key索引以后的值，數字key不做kash

uint nKeyLength; //key的長度

void *pData;

void *pDataPtr; //指針數據，指向真實數據

struct bucket * pListNext; //整個hash表的下個元素

struct bucket *pListLast; //整個hash表的上個元素

struct bucket *pNext; //本bucket里面，下一個元素

struct bucket *pLast; //本bucket里面的上一個元素

char arKey[1];

}Bucket

這里用一張網絡上的很火的圖來說明(圖原地址沒找到，沒有做來源說明):

下面是引用了tipi里面的插入說明:

引用地址:tipi

如圖中左下角的假設，假設依次插入了Bucket1，Bucket2，Bucket3三個元素：

1、插入Bucket1時，哈希表為空，經過哈希后定位到索引為1的槽位。此時的1槽位只有一個元素Bucket1。其中Bucket1的pData或者pDataPtr指向的是Bucket1所存儲的數據。此時由於沒有鏈接關系。pNext， pLast，pListNext，pListLast指針均為空。同時在HashTable結構體中也保存了整個哈希表的第一個元素指針，和最后一個元素指針，此時HashTable的pListHead和pListTail指針均指向Bucket1。

2、插入Bucket2時，由於Bucket2的key和Bucket1的key出現沖突，此時將Bucket2放在雙鏈表的前面。由於Bucket2后插入並置於鏈表的前端，此時Bucket2.pNext指向Bucket1，由於Bucket2后插入。 Bucket1.pListNext指向Bucket2，這時Bucket2就是哈希表的最后一個元素，這是HashTable.pListTail指向Bucket2。\3、插入Bucket3，該key沒有哈希到槽位1，這時Bucket2.pListNext指向Bucket3，因為Bucket3后插入。同時HashTable.pListTail改為指向Bucket3。

簡單來說就是哈希表的Bucket結構維護了哈希表中插入元素的先后順序，哈希表結構維護了整個哈希表的頭和尾。在操作哈希表的過程中始終保持預算之間的關系。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 redis字典的底層實現hashTable HashMap 和HashTable的區別？底層實現是什么？ HashMap底層實現原理/HashMap與HashTable區別/HashMap與HashSet區別 java面試題之HashMap和HashTable底層實現的區別 HashMap底層實現原理/HashMap與HashTable區別/HashMap與HashSet區別 HashMap和HashTable的區別以及底層 PHP 數組底層實現原理（轉）HashMap底層實現原理/HashMap與HashTable區別/HashMap與HashSet區別介紹 PHP7 HashTable php中弱語言類型的底層實現