Go語言核心36講(Go語言實戰與應用十二)--學習筆記


34 | 並發安全字典sync.Map (上)

我們今天再來講一個並發安全的高級數據結構:sync.Map。眾所周知,Go 語言自帶的字典類型map並不是並發安全的。

前導知識:並發安全字典誕生史

換句話說,在同一時間段內,讓不同 goroutine 中的代碼,對同一個字典進行讀寫操作是不安全的。字典值本身可能會因這些操作而產生混亂,相關的程序也可能會因此發生不可預知的問題。

在sync.Map出現之前,我們如果要實現並發安全的字典,就只能自行構建。不過,這其實也不是什么麻煩事,使用 sync.Mutex或sync.RWMutex,再加上原生的map就可以輕松地做到。

GitHub 網站上已經有很多庫提供了類似的數據結構。我在《Go 並發編程實戰》的第 2 版中也提供了一個比較完整的並發安全字典的實現。它的性能比同類的數據結構還要好一些,因為它在很大程度上有效地避免了對鎖的依賴。

盡管已經有了不少的參考實現,Go 語言愛好者們還是希望 Go 語言官方能夠發布一個標准的並發安全字典。

經過大家多年的建議和吐槽,Go 語言官方終於在 2017 年發布的 Go 1.9 中,正式加入了並發安全的字典類型sync.Map。

這個字典類型提供了一些常用的鍵值存取操作方法,並保證了這些操作的並發安全。同時,它的存、取、刪等操作都可以基本保證在常數時間內執行完畢。換句話說,它們的算法復雜度與map類型一樣都是O(1)的。

在有些時候,與單純使用原生map和互斥鎖的方案相比,使用sync.Map可以顯著地減少鎖的爭用。sync.Map本身雖然也用到了鎖,但是,它其實在盡可能地避免使用鎖。

我們都知道,使用鎖就意味着要把一些並發的操作強制串行化。這往往會降低程序的性能,尤其是在計算機擁有多個 CPU 核心的情況下。

因此,我們常說,能用原子操作就不要用鎖,不過這很有局限性,畢竟原子只能對一些基本的數據類型提供支持。

無論在何種場景下使用sync.Map,我們都需要注意,與原生map明顯不同,它只是 Go 語言標准庫中的一員,而不是語言層面的東西。也正因為這一點,Go 語言的編譯器並不會對它的鍵和值,進行特殊的類型檢查。

如果你看過sync.Map的文檔或者實際使用過它,那么就一定會知道,它所有的方法涉及的鍵和值的類型都是interface{},也就是空接口,這意味着可以包羅萬象。所以,我們必須在程序中自行保證它的鍵類型和值類型的正確性。

好了,現在第一個問題來了。今天的問題是:並發安全字典對鍵的類型有要求嗎?

這道題的典型回答是:有要求。鍵的實際類型不能是函數類型、字典類型和切片類型。

解析一下這個問題。 我們都知道,Go 語言的原生字典的鍵類型不能是函數類型、字典類型和切片類型。

由於並發安全字典內部使用的存儲介質正是原生字典,又因為它使用的原生字典鍵類型也是可以包羅萬象的interface{};所以,我們絕對不能帶着任何實際類型為函數類型、字典類型或切片類型的鍵值去操作並發安全字典。

由於這些鍵值的實際類型只有在程序運行期間才能夠確定,所以 Go 語言編譯器是無法在編譯期對它們進行檢查的,不正確的鍵值實際類型肯定會引發 panic。

因此,我們在這里首先要做的一件事就是:一定不要違反上述規則。我們應該在每次操作並發安全字典的時候,都去顯式地檢查鍵值的實際類型。無論是存、取還是刪,都應該如此。

當然,更好的做法是,把針對同一個並發安全字典的這幾種操作都集中起來,然后統一地編寫檢查代碼。除此之外,把並發安全字典封裝在一個結構體類型中,往往是一個很好的選擇。

總之,我們必須保證鍵的類型是可比較的(或者說可判等的)。如果你實在拿不准,那么可以先通過調用reflect.TypeOf函數得到一個鍵值對應的反射類型值(即:reflect.Type類型的值),然后再調用這個值的Comparable方法,得到確切的判斷結果。

知識擴展

問題 1:怎樣保證並發安全字典中的鍵和值的類型正確性?(方案一)

簡單地說,可以使用類型斷言表達式或者反射操作來保證它們的類型正確性。

為了進一步明確並發安全字典中鍵值的實際類型,這里大致有兩種方案可選。

第一種方案是,讓並發安全字典只能存儲某個特定類型的鍵。

比如,指定這里的鍵只能是int類型的,或者只能是字符串,又或是某類結構體。一旦完全確定了鍵的類型,你就可以在進行存、取、刪操作的時候,使用類型斷言表達式去對鍵的類型做檢查了。

一般情況下,這種檢查並不繁瑣。而且,你要是把並發安全字典封裝在一個結構體類型里面,那就更加方便了。你這時完全可以讓 Go 語言編譯器幫助你做類型檢查。請看下面的代碼:

type IntStrMap struct {
 m sync.Map
}

func (iMap *IntStrMap) Delete(key int) {
 iMap.m.Delete(key)
}

func (iMap *IntStrMap) Load(key int) (value string, ok bool) {
 v, ok := iMap.m.Load(key)
 if v != nil {
  value = v.(string)
 }
 return
}

func (iMap *IntStrMap) LoadOrStore(key int, value string) (actual string, loaded bool) {
 a, loaded := iMap.m.LoadOrStore(key, value)
 actual = a.(string)
 return
}

func (iMap *IntStrMap) Range(f func(key int, value string) bool) {
 f1 := func(key, value interface{}) bool {
  return f(key.(int), value.(string))
 }
 iMap.m.Range(f1)
}

func (iMap *IntStrMap) Store(key int, value string) {
 iMap.m.Store(key, value)
}

如上所示,我編寫了一個名為IntStrMap的結構體類型,它代表了鍵類型為int、值類型為string的並發安全字典。在這個結構體類型中,只有一個sync.Map類型的字段m。並且,這個類型擁有的所有方法,都與sync.Map類型的方法非常類似。

兩者對應的方法名稱完全一致,方法簽名也非常相似,只不過,與鍵和值相關的那些參數和結果的類型不同而已。在IntStrMap類型的方法簽名中,明確了鍵的類型為int,且值的類型為string。

顯然,這些方法在接受鍵和值的時候,就不用再做類型檢查了。另外,這些方法在從m中取出鍵和值的時候,完全不用擔心它們的類型會不正確,因為它的正確性在當初存入的時候,就已經由 Go 語言編譯器保證了。

稍微總結一下。第一種方案適用於我們可以完全確定鍵和值的具體類型的情況。在這種情況下,我們可以利用 Go 語言編譯器去做類型檢查,並用類型斷言表達式作為輔助,就像IntStrMap那樣。

總結

我們今天討論的是sync.Map類型,它是一種並發安全的字典。它提供了一些常用的鍵、值存取操作方法,並保證了這些操作的並發安全。同時,它還保證了存、取、刪等操作的常數級執行時間。

與原生的字典相同,並發安全字典對鍵的類型也是有要求的。它們同樣不能是函數類型、字典類型和切片類型。

另外,由於並發安全字典提供的方法涉及的鍵和值的類型都是interface{},所以我們在調用這些方法的時候,往往還需要對鍵和值的實際類型進行檢查。

這里大致有兩個方案。我們今天主要提到了第一種方案,這是在編碼時就完全確定鍵和值的類型,然后利用 Go 語言的編譯器幫我們做檢查。

在下一次的文章中,我們會提到另外一種方案,並對比這兩種方案的優劣。除此之外,我會繼續探討並發安全字典的相關問題。

package main

import (
	"fmt"
	"sync"
)

// ConcurrentMap 代表自制的簡易並發安全字典。
type ConcurrentMap struct {
	m  map[interface{}]interface{}
	mu sync.RWMutex
}

func NewConcurrentMap() *ConcurrentMap {
	return &ConcurrentMap{
		m: make(map[interface{}]interface{}),
	}
}

func (cMap *ConcurrentMap) Delete(key interface{}) {
	cMap.mu.Lock()
	defer cMap.mu.Unlock()
	delete(cMap.m, key)
}

func (cMap *ConcurrentMap) Load(key interface{}) (value interface{}, ok bool) {
	cMap.mu.RLock()
	defer cMap.mu.RUnlock()
	value, ok = cMap.m[key]
	return
}

func (cMap *ConcurrentMap) LoadOrStore(key, value interface{}) (actual interface{}, loaded bool) {
	cMap.mu.Lock()
	defer cMap.mu.Unlock()
	actual, loaded = cMap.m[key]
	if loaded {
		return
	}
	cMap.m[key] = value
	actual = value
	return
}

func (cMap *ConcurrentMap) Range(f func(key, value interface{}) bool) {
	cMap.mu.RLock()
	defer cMap.mu.RUnlock()
	for k, v := range cMap.m {
		if !f(k, v) {
			break
		}
	}
}

func (cMap *ConcurrentMap) Store(key, value interface{}) {
	cMap.mu.Lock()
	defer cMap.mu.Unlock()
	cMap.m[key] = value
}

func main() {
	pairs := []struct {
		k int
		v string
	}{
		{k: 1, v: "a"},
		{k: 2, v: "b"},
		{k: 3, v: "c"},
		{k: 4, v: "d"},
	}

	// 示例1。
	{
		cMap := NewConcurrentMap()
		cMap.Store(pairs[0].k, pairs[0].v)
		cMap.Store(pairs[1].k, pairs[1].v)
		cMap.Store(pairs[2].k, pairs[2].v)
		fmt.Println("[Three pairs have been stored in the ConcurrentMap instance]")

		cMap.Range(func(key, value interface{}) bool {
			fmt.Printf("The result of an iteration in Range: %v, %v\n",
				key, value)
			return true
		})

		k0 := pairs[0].k
		v0, ok := cMap.Load(k0)
		fmt.Printf("The result of Load: %v, %v (key: %v)\n",
			v0, ok, k0)

		k3 := pairs[3].k
		v3, ok := cMap.Load(k3)
		fmt.Printf("The result of Load: %v, %v (key: %v)\n",
			v3, ok, k3)

		k2, v2 := pairs[2].k, pairs[2].v
		actual2, loaded2 := cMap.LoadOrStore(k2, v2)
		fmt.Printf("The result of LoadOrStore: %v, %v (key: %v, value: %v)\n",
			actual2, loaded2, k2, v2)
		v3 = pairs[3].v
		actual3, loaded3 := cMap.LoadOrStore(k3, v3)
		fmt.Printf("The result of LoadOrStore: %v, %v (key: %v, value: %v)\n",
			actual3, loaded3, k3, v3)

		k1 := pairs[1].k
		cMap.Delete(k1)
		fmt.Printf("[The pair with the key of %v has been removed from the ConcurrentMap instance]\n",
			k1)
		v1, ok := cMap.Load(k1)
		fmt.Printf("The result of Load: %v, %v (key: %v)\n",
			v1, ok, k1)
		v1 = pairs[1].v
		actual1, loaded1 := cMap.LoadOrStore(k1, v1)
		fmt.Printf("The result of LoadOrStore: %v, %v (key: %v, value: %v)\n",
			actual1, loaded1, k1, v1)

		cMap.Range(func(key, value interface{}) bool {
			fmt.Printf("The result of an iteration in Range: %v, %v\n",
				key, value)
			return true
		})
	}
	fmt.Println()

	// 示例2。
	{
		var sMap sync.Map
		sMap.Store(pairs[0].k, pairs[0].v)
		sMap.Store(pairs[1].k, pairs[1].v)
		sMap.Store(pairs[2].k, pairs[2].v)
		fmt.Println("[Three pairs have been stored in the sync.Map instance]")

		sMap.Range(func(key, value interface{}) bool {
			fmt.Printf("The result of an iteration in Range: %v, %v\n",
				key, value)
			return true
		})

		k0 := pairs[0].k
		v0, ok := sMap.Load(k0)
		fmt.Printf("The result of Load: %v, %v (key: %v)\n",
			v0, ok, k0)

		k3 := pairs[3].k
		v3, ok := sMap.Load(k3)
		fmt.Printf("The result of Load: %v, %v (key: %v)\n",
			v3, ok, k3)

		k2, v2 := pairs[2].k, pairs[2].v
		actual2, loaded2 := sMap.LoadOrStore(k2, v2)
		fmt.Printf("The result of LoadOrStore: %v, %v (key: %v, value: %v)\n",
			actual2, loaded2, k2, v2)
		v3 = pairs[3].v
		actual3, loaded3 := sMap.LoadOrStore(k3, v3)
		fmt.Printf("The result of LoadOrStore: %v, %v (key: %v, value: %v)\n",
			actual3, loaded3, k3, v3)

		k1 := pairs[1].k
		sMap.Delete(k1)
		fmt.Printf("[The pair with the key of %v has been removed from the sync.Map instance]\n",
			k1)
		v1, ok := sMap.Load(k1)
		fmt.Printf("The result of Load: %v, %v (key: %v)\n",
			v1, ok, k1)
		v1 = pairs[1].v
		actual1, loaded1 := sMap.LoadOrStore(k1, v1)
		fmt.Printf("The result of LoadOrStore: %v, %v (key: %v, value: %v)\n",
			actual1, loaded1, k1, v1)

		sMap.Range(func(key, value interface{}) bool {
			fmt.Printf("The result of an iteration in Range: %v, %v\n",
				key, value)
			return true
		})
	}

}

筆記源碼

https://github.com/MingsonZheng/go-core-demo

知識共享許可協議

本作品采用知識共享署名-非商業性使用-相同方式共享 4.0 國際許可協議進行許可。

歡迎轉載、使用、重新發布,但務必保留文章署名 鄭子銘 (包含鏈接: http://www.cnblogs.com/MingsonZheng/ ),不得用於商業目的,基於本文修改后的作品務必以相同的許可發布。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM