在分布式系統中,如果某業務可以由多個相同的節點處理,很容易想到用HASH的方式將業務請求分散到這些節點處理,比如memecache緩存等分 布式集群應用,如果只是簡單的使用,不涉及用戶用戶狀態等信息,則可以直接采用取模算法。正常情況下,取模算法好像也不錯,但是一旦增加節點或者其中一個 節點上宕機的話,命中率將會急劇降低,所以取模算法在這種情況下弊端很明顯,為此,在1997年由麻省理工學院提出的一種分布式哈希(DHT)實現算法。 具體的算法介紹我這里不多少了,需要了解的可以參見本文:http://www.cnblogs.com/haippy/archive/2011/12/10/2282943.html
下面貼一個用PHP對其進行的簡單實現
class Hash
{
//落點集合,可以緩存起來
private $_locations = array();
//虛擬節點數量
private $virtualNodeNum = 24;
//維護的另一種節點和虛擬節點對應關系,方便刪除
private $_nodes;
//將字符串轉成數字
private function _hash($str)
{
return sprintf('%u', crc32($str));
}
/**
* 尋找字符串所在的機器位置
* @param $str
* @return bool|mixed
*/
public function getLocation($str)
{
if(empty($this->_locations)){
return false;
}else{
$position = $this->_hash($str);
//默認取第一個節點
$node = current($this->_locations);
foreach($this->_locations as $k=>$v){
//如果當前的位置,小於或等於節點組中的一個節點,那么當前位置對應該節點
if($position <= $k){
$node = $v;
break;
}
}
return $node;
}
}
/**
* 添加一個節點
* @param $node
*/
public function addNode($node)
{
//生成虛擬節點
for($i=0;$i<$this->virtualNodeNum;$i++){
$tmp = $this->_hash($node.$i);
$this->_locations[$tmp] = $node;
$this->_nodes[$node][] = $tmp;
}
//對節點排序
ksort($this->_locations,SORT_NUMERIC);
}
/**
* 刪除一個節點
* @param $node
*/
public function deleteNode($node)
{
foreach($this->_nodes[$node] as $v){
unset($this->_locations[$v]);
}
}
}
