Go語言核心36講(Go語言實戰與應用八)--學習筆記


30 | 原子操作(下)

我們接着上一篇文章的內容繼續聊,上一篇我們提到了,sync/atomic包中的函數可以做的原子操作有:加法(add)、比較並交換(compare and swap,簡稱 CAS)、加載(load)、存儲(store)和交換(swap)。並且以此衍生出了兩個問題。

今天我們繼續來看第三個衍生問題: 比較並交換操作與交換操作相比有什么不同?優勢在哪里?

回答是:比較並交換操作即 CAS 操作,是有條件的交換操作,只有在條件滿足的情況下才會進行值的交換。

所謂的交換指的是,把新值賦給變量,並返回變量的舊值。

在進行 CAS 操作的時候,函數會先判斷被操作變量的當前值,是否與我們預期的舊值相等。如果相等,它就把新值賦給該變量,並返回true以表明交換操作已進行;否則就忽略交換操作,並返回false。

可以看到,CAS 操作並不是單一的操作,而是一種操作組合。這與其他的原子操作都不同。正因為如此,它的用途要更廣泛一些。例如,我們將它與for語句聯用就可以實現一種簡易的自旋鎖(spinlock)。

for {
 if atomic.CompareAndSwapInt32(&num2, 10, 0) {
  fmt.Println("The second number has gone to zero.")
  break
 }
 time.Sleep(time.Millisecond * 500)
}

在for語句中的 CAS 操作可以不停地檢查某個需要滿足的條件,一旦條件滿足就退出for循環。這就相當於,只要條件未被滿足,當前的流程就會被一直“阻塞”在這里。

這在效果上與互斥鎖有些類似。不過,它們的適用場景是不同的。我們在使用互斥鎖的時候,總是假設共享資源的狀態會被其他的 goroutine 頻繁地改變。

而for語句加 CAS 操作的假設往往是:共享資源狀態的改變並不頻繁,或者,它的狀態總會變成期望的那樣。這是一種更加樂觀,或者說更加寬松的做法。

package main

import (
	"fmt"
	"sync/atomic"
	"time"
)

func main() {
	// 第三個衍生問題的示例。
	forAndCAS1()
	fmt.Println()
	forAndCAS2()
}

// forAndCAS1 用於展示簡易的自旋鎖。
func forAndCAS1() {
	sign := make(chan struct{}, 2)
	num := int32(0)
	fmt.Printf("The number: %d\n", num)
	go func() { // 定時增加num的值。
		defer func() {
			sign <- struct{}{}
		}()
		for {
			time.Sleep(time.Millisecond * 500)
			newNum := atomic.AddInt32(&num, 2)
			fmt.Printf("The number: %d\n", newNum)
			if newNum == 10 {
				break
			}
		}
	}()
	go func() { // 定時檢查num的值,如果等於10就將其歸零。
		defer func() {
			sign <- struct{}{}
		}()
		for {
			if atomic.CompareAndSwapInt32(&num, 10, 0) {
				fmt.Println("The number has gone to zero.")
				break
			}
			time.Sleep(time.Millisecond * 500)
		}
	}()
	<-sign
	<-sign
}

// forAndCAS2 用於展示一種簡易的(且更加寬松的)互斥鎖的模擬。
func forAndCAS2() {
	sign := make(chan struct{}, 2)
	num := int32(0)
	fmt.Printf("The number: %d\n", num)
	max := int32(20)
	go func(id int, max int32) { // 定時增加num的值。
		defer func() {
			sign <- struct{}{}
		}()
		for i := 0; ; i++ {
			currNum := atomic.LoadInt32(&num)
			if currNum >= max {
				break
			}
			newNum := currNum + 2
			time.Sleep(time.Millisecond * 200)
			if atomic.CompareAndSwapInt32(&num, currNum, newNum) {
				fmt.Printf("The number: %d [%d-%d]\n", newNum, id, i)
			} else {
				fmt.Printf("The CAS operation failed. [%d-%d]\n", id, i)
			}
		}
	}(1, max)
	go func(id int, max int32) { // 定時增加num的值。
		defer func() {
			sign <- struct{}{}
		}()
		for j := 0; ; j++ {
			currNum := atomic.LoadInt32(&num)
			if currNum >= max {
				break
			}
			newNum := currNum + 2
			time.Sleep(time.Millisecond * 200)
			if atomic.CompareAndSwapInt32(&num, currNum, newNum) {
				fmt.Printf("The number: %d [%d-%d]\n", newNum, id, j)
			} else {
				fmt.Printf("The CAS operation failed. [%d-%d]\n", id, j)
			}
		}
	}(2, max)
	<-sign
	<-sign
}

第四個衍生問題:假設我已經保證了對一個變量的寫操作都是原子操作,比如:加或減、存儲、交換等等,那我對它進行讀操作的時候,還有必要使用原子操作嗎?

回答是:很有必要。其中的道理你可以對照一下讀寫鎖。為什么在讀寫鎖保護下的寫操作和讀操作之間是互斥的?這是為了防止讀操作讀到沒有被修改完的值,對嗎?

如果寫操作還沒有進行完,讀操作就來讀了,那么就只能讀到僅修改了一部分的值。這顯然破壞了值的完整性,讀出來的值也是完全錯誤的。

所以,一旦你決定了要對一個共享資源進行保護,那就要做到完全的保護。不完全的保護基本上與不保護沒有什么區別。

好了,上面的主問題以及相關的衍生問題涉及了原子操作函數的用法、原理、對比和一些最佳實踐,希望你已經理解了。

由於這里的原子操作函數只支持非常有限的數據類型,所以在很多應用場景下,互斥鎖往往是更加適合的。

不過,一旦我們確定了在某個場景下可以使用原子操作函數,比如:只涉及並發地讀寫單一的整數類型值,或者多個互不相關的整數類型值,那就不要再考慮互斥鎖了。

這主要是因為原子操作函數的執行速度要比互斥鎖快得多。而且,它們使用起來更加簡單,不會涉及臨界區的選擇,以及死鎖等問題。當然了,在使用 CAS 操作的時候,我們還是要多加注意的,因為它可以被用來模仿鎖,並有可能“阻塞”流程。

知識擴展

問題:怎樣用好sync/atomic.Value?

為了擴大原子操作的適用范圍,Go 語言在 1.4 版本發布的時候向sync/atomic包中添加了一個新的類型Value。此類型的值相當於一個容器,可以被用來“原子地”存儲和加載任意的值。

atomic.Value類型是開箱即用的,我們聲明一個該類型的變量(以下簡稱原子變量)之后就可以直接使用了。這個類型使用起來很簡單,它只有兩個指針方法:Store和Load。不過,雖然簡單,但還是有一些值得注意的地方的。

首先一點,一旦atomic.Value類型的值(以下簡稱原子值)被真正使用,它就不應該再被復制了。什么叫做“真正使用”呢?

我們只要用它來存儲值了,就相當於開始真正使用了。atomic.Value類型屬於結構體類型,而結構體類型屬於值類型。

所以,復制該類型的值會產生一個完全分離的新值。這個新值相當於被復制的那個值的一個快照。之后,不論后者存儲的值怎樣改變,都不會影響到前者,反之亦然。

另外,關於用原子值來存儲值,有兩條強制性的使用規則。第一條規則,不能用原子值存儲nil。

也就是說,我們不能把nil作為參數值傳入原子值的Store方法,否則就會引發一個 panic。

這里要注意,如果有一個接口類型的變量,它的動態值是nil,但動態類型卻不是nil,那么它的值就不等於nil。我在前面講接口的時候和你說明過這個問題。正因為如此,這樣一個變量的值是可以被存入原子值的。

第二條規則,我們向原子值存儲的第一個值,決定了它今后能且只能存儲哪一個類型的值。

例如,我第一次向一個原子值存儲了一個string類型的值,那我在后面就只能用該原子值來存儲字符串了。如果我又想用它存儲結構體,那么在調用它的Store方法的時候就會引發一個 panic。這個 panic 會告訴我,這次存儲的值的類型與之前的不一致。

你可能會想:我先存儲一個接口類型的值,然后再存儲這個接口的某個實現類型的值,這樣是不是可以呢?

很可惜,這樣是不可以的,同樣會引發一個 panic。因為原子值內部是依據被存儲值的實際類型來做判斷的。所以,即使是實現了同一個接口的不同類型,它們的值也不能被先后存儲到同一個原子值中。

遺憾的是,我們無法通過某個方法獲知一個原子值是否已經被真正使用,並且,也沒有辦法通過常規的途徑得到一個原子值可以存儲值的實際類型。這使得我們誤用原子值的可能性大大增加,尤其是在多個地方使用同一個原子值的時候。

下面,我給你幾條具體的使用建議。

1、不要把內部使用的原子值暴露給外界。比如,聲明一個全局的原子變量並不是一個正確的做法。這個變量的訪問權限最起碼也應該是包級私有的。

2、如果不得不讓包外,或模塊外的代碼使用你的原子值,那么可以聲明一個包級私有的原子變量,然后再通過一個或多個公開的函數,讓外界間接地使用到它。注意,這種情況下不要把原子值傳遞到外界,不論是傳遞原子值本身還是它的指針值。

3、如果通過某個函數可以向內部的原子值存儲值的話,那么就應該在這個函數中先判斷被存儲值類型的合法性。若不合法,則應該直接返回對應的錯誤值,從而避免 panic 的發生。

4、如果可能的話,我們可以把原子值封裝到一個數據類型中,比如一個結構體類型。這樣,我們既可以通過該類型的方法更加安全地存儲值,又可以在該類型中包含可存儲值的合法類型信息。

除了上述使用建議之外,我還要再特別強調一點:盡量不要向原子值中存儲引用類型的值。因為這很容易造成安全漏洞。請看下面的代碼:

var box6 atomic.Value
v6 := []int{1, 2, 3}
box6.Store(v6)
v6[1] = 4 // 注意,此處的操作不是並發安全的!

我把一個[]int類型的切片值v6, 存入了原子值box6。注意,切片類型屬於引用類型。所以,我在外面改動這個切片值,就等於修改了box6中存儲的那個值。這相當於繞過了原子值而進行了非並發安全的操作。那么,應該怎樣修補這個漏洞呢?可以這樣做:

store := func(v []int) {
 replica := make([]int, len(v))
 copy(replica, v)
 box6.Store(replica)
}
store(v6)
v6[2] = 5 // 此處的操作是安全的。

我先為切片值v6創建了一個完全的副本。這個副本涉及的數據已經與原值毫不相干了。然后,我再把這個副本存入box6。如此一來,無論我再對v6的值做怎樣的修改,都不會破壞box6提供的安全保護。

以上,就是我要告訴你的關於atomic.Value的注意事項和使用建議。你可以在 demo64.go 文件中看到相應的示例。

package main

import (
	"errors"
	"fmt"
	"io"
	"os"
	"reflect"
	"sync/atomic"
)

func main() {
	// 示例1。
	var box atomic.Value
	fmt.Println("Copy box to box2.")
	box2 := box // 原子值在真正使用前可以被復制。
	v1 := [...]int{1, 2, 3}
	fmt.Printf("Store %v to box.\n", v1)
	box.Store(v1)
	fmt.Printf("The value load from box is %v.\n", box.Load())
	fmt.Printf("The value load from box2 is %v.\n", box2.Load())
	fmt.Println()

	// 示例2。
	v2 := "123"
	fmt.Printf("Store %q to box2.\n", v2)
	box2.Store(v2) // 這里並不會引發panic。
	fmt.Printf("The value load from box is %v.\n", box.Load())
	fmt.Printf("The value load from box2 is %q.\n", box2.Load())
	fmt.Println()

	// 示例3。
	fmt.Println("Copy box to box3.")
	box3 := box // 原子值在真正使用后不應該被復制!
	fmt.Printf("The value load from box3 is %v.\n", box3.Load())
	v3 := 123
	fmt.Printf("Store %d to box3.\n", v3)
	//box3.Store(v3) // 這里會引發一個panic,報告存儲值的類型不一致。
	_ = box3
	fmt.Println()

	// 示例4。
	var box4 atomic.Value
	v4 := errors.New("something wrong")
	fmt.Printf("Store an error with message %q to box4.\n", v4)
	box4.Store(v4)
	v41 := io.EOF
	fmt.Println("Store a value of the same type to box4.")
	box4.Store(v41)
	v42, ok := interface{}(&os.PathError{}).(error)
	if ok {
		fmt.Printf("Store a value of type %T that implements error interface to box4.\n", v42)
		//box4.Store(v42) // 這里會引發一個panic,報告存儲值的類型不一致。
	}
	fmt.Println()

	// 示例5。
	box5, err := NewAtomicValue(v4)
	if err != nil {
		fmt.Printf("error: %s\n", err)
	}
	fmt.Printf("The legal type in box5 is %s.\n", box5.TypeOfValue())
	fmt.Println("Store a value of the same type to box5.")
	err = box5.Store(v41)
	if err != nil {
		fmt.Printf("error: %s\n", err)
	}
	fmt.Printf("Store a value of type %T that implements error interface to box5.\n", v42)
	err = box5.Store(v42)
	if err != nil {
		fmt.Printf("error: %s\n", err)
	}
	fmt.Println()

	// 示例6。
	var box6 atomic.Value
	v6 := []int{1, 2, 3}
	fmt.Printf("Store %v to box6.\n", v6)
	box6.Store(v6)
	v6[1] = 4 // 注意,此處的操作不是並發安全的!
	fmt.Printf("The value load from box6 is %v.\n", box6.Load())
	// 正確的做法如下。
	v6 = []int{1, 2, 3}
	store := func(v []int) {
		replica := make([]int, len(v))
		copy(replica, v)
		box6.Store(replica)
	}
	fmt.Printf("Store %v to box6.\n", v6)
	store(v6)
	v6[2] = 5 // 此處的操作是安全的。
	fmt.Printf("The value load from box6 is %v.\n", box6.Load())
}

type atomicValue struct {
	v atomic.Value
	t reflect.Type
}

func NewAtomicValue(example interface{}) (*atomicValue, error) {
	if example == nil {
		return nil, errors.New("atomic value: nil example")
	}
	return &atomicValue{
		t: reflect.TypeOf(example),
	}, nil
}

func (av *atomicValue) Store(v interface{}) error {
	if v == nil {
		return errors.New("atomic value: nil value")
	}
	t := reflect.TypeOf(v)
	if t != av.t {
		return fmt.Errorf("atomic value: wrong type: %s", t)
	}
	av.v.Store(v)
	return nil
}

func (av *atomicValue) Load() interface{} {
	return av.v.Load()
}

func (av *atomicValue) TypeOfValue() reflect.Type {
	return av.t
}

總結

我們把這兩篇文章一起總結一下。相對於原子操作函數,原子值類型的優勢很明顯,但它的使用規則也更多一些。首先,在首次真正使用后,原子值就不應該再被復制了。

其次,原子值的Store方法對其參數值(也就是被存儲值)有兩個強制的約束。一個約束是,參數值不能為nil。另一個約束是,參數值的類型不能與首個被存儲值的類型不同。也就是說,一旦一個原子值存儲了某個類型的值,那它以后就只能存儲這個類型的值了。

基於上面這幾個注意事項,我提出了幾條使用建議,包括:不要對外暴露原子變量、不要傳遞原子值及其指針值、盡量不要在原子值中存儲引用類型的值,等等。與之相關的一些解決方案我也一並提出了。希望你能夠受用。

原子操作明顯比互斥鎖要更加輕便,但是限制也同樣明顯。所以,我們在進行二選一的時候通常不會太困難。但是原子值與互斥鎖之間的選擇有時候就需要仔細的考量了。不過,如果你能牢記我今天講的這些內容的話,應該會有很大的助力。

思考題

今天的思考題只有一個,那就是:如果要對原子值和互斥鎖進行二選一,你認為最重要的三個決策條件應該是什么?

筆記源碼

https://github.com/MingsonZheng/go-core-demo

知識共享許可協議

本作品采用知識共享署名-非商業性使用-相同方式共享 4.0 國際許可協議進行許可。

歡迎轉載、使用、重新發布,但務必保留文章署名 鄭子銘 (包含鏈接: http://www.cnblogs.com/MingsonZheng/ ),不得用於商業目的,基於本文修改后的作品務必以相同的許可發布。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM