volatile實現之緩存鎖定


問題引出:

voliatile能保證數據的可見行與有序性,其實現基於兩條原則:

  1. Lock前綴指令會引起處理器緩存會寫到內存。

  2. 一個處理器的緩存回寫到內存會導致其他處理器的緩存無效,其他處理器下次請求該值時從內存讀取該值並做緩存。

 

實現方式:

在並發操作場景下,操作系統必須要有一些機制和原語,以保證某些基本操作的原子性,比如處理器需要保證讀一個字節或寫一個字節是原子的,那么它是如何實現的呢?有兩種機制:總線鎖定和緩存一致性。

  • 總線鎖定:

操作系統提供了總線鎖定的機制。前端總線(也叫CPU總線)是所有CPU與芯片組連接的主干道,負責CPU與外界所有部件的通信,包括高速緩存、內存、北橋,其控制總線向各個部件發送控制信號、通過地址總線發送地址信號指定其要訪問的部件、通過數據總線雙向傳輸。在CPU1要做 i++操作的時候,其在總線上發出一個LOCK#信號,其他處理器就不能操作緩存了該共享變量內存地址的緩存,也就是阻塞了其他CPU,使該處理器可以獨享此共享內存。但我們只需要對此共享變量的操作是原子就可以了,而總線鎖定把CPU和內存的通信給鎖住了,使得在鎖定期間,其他處理器不能操作其他內存地址的數據,從而開銷較大,所以后來的CPU都提供了緩存一致性機制,Intel的奔騰486之后就提供了這種優化。

  • 緩存鎖定:

緩存一致性機制就整體來說,是當某塊CPU對緩存中的數據進行操作了之后,就通知其他CPU放棄儲存在它們內部的緩存,從內存中重新讀取,用MESI闡述原理如下:

MESI協議:是以緩存行(緩存的基本數據單位,在Intel的CPU上一般是64字節)的幾個狀態來命名的(全名是Modified、Exclusive、 Share or Invalid)。該協議要求在每個緩存行上維護兩個狀態位,使得每個數據單位可能處於M、E、S和I這四種狀態之一,各種狀態含義如下:

M:被修改的。處於這一狀態的數據,只在本CPU中有緩存數據,而其他CPU中沒有。同時其狀態相對於內存中的值來說,是已經被修改的,且沒有更新到內存中。

E:獨占的。處於這一狀態的數據,只有在本CPU中有緩存,且其數據沒有修改,即與內存中一致。

S:共享的。處於這一狀態的數據在多個CPU中都有緩存,且與內存一致。

I:無效的。本CPU中的這份緩存已經無效。

 

  1. 一個處於M狀態的緩存行,必須時刻監聽所有試圖讀取該緩存行對應的主存地址的操作,如果監聽到,則必須在此操作執行前把其緩存行中的數據寫回CPU。

  2. 一個處於S狀態的緩存行,必須時刻監聽使該緩存行無效或者獨享該緩存行的請求,如果監聽到,則必須把其緩存行狀態設置為I。

  3. 一個處於E狀態的緩存行,必須時刻監聽其他試圖讀取該緩存行對應的主存地址的操作,如果監聽到,則必須把其緩存行狀態設置為S。

  4. 當CPU需要讀取數據時,如果其緩存行的狀態是I的,則需要從內存中讀取,並把自己狀態變成S,如果不是I,則可以直接讀取緩存中的值,但在此之前,必須要等待其他CPU的監聽結果,如其他CPU也有該數據的緩存且狀態是M,則需要等待其把緩存更新到內存之后,再讀取。

  5. 當CPU需要寫數據時,只有在其緩存行是M或者E的時候才能執行,否則需要發出特殊的RFO指令(Read Or Ownership,這是一種總線事務),通知其他CPU置緩存無效(I),這種情況下性能開銷是相對較大的。在寫入完成后,修改其緩存狀態為M。

總結:

  1. 所以如果一個變量在某段時間只被一個線程頻繁地修改,則使用其內部緩存就完全可以辦到,不涉及到總線事務,如果緩存一會被這個CPU獨占、一會被那個CPU 獨占,這時才會不斷產生RFO指令影響到並發性能。這里說的緩存頻繁被獨占並不是指線程越多越容易觸發,而是這里的CPU協調機制,這有點類似於有時多線程並不一定提高效率,原因是線程掛起、調度的開銷比執行任務的開銷還要大,這里的多CPU也是一樣,如果在CPU間調度不合理,也會形成RFO指令的開銷比任務開銷還要大。當然,這不是編程者需要考慮的事,操作系統會有相應的內存地址的相關判斷。

  2. 並非所有情況都會使用緩存一致性的,如被操作的數據不能被緩存在CPU內部或操作數據跨越多個緩存行(狀態無法標識),則處理器會調用總線鎖定;另外當CPU不支持緩存鎖定時,自然也只能用總線鎖定了,比如說奔騰486以及更老的CPU。 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM