內存是PC配件中結構最簡單的,但在BIOS中卻是最難調的,很多玩家超頻都卡在內存上。並且,內存的原理、結構與時序多年不會改變,無論將來內存技術如何進步,相信這篇文章的存在價值都不會打折扣。本文亦希望能通過對DRAM基本原理以及時序的介紹,在內存設置以及XMP的制作上有所幫助。
>>>目錄<<<
第一部分:工作原理
DRAM基本組成
內存地址
尋址
內存cell的基本操作
硅晶體中的“電容”
MOSFET的控制原理——水庫模型
儲存數據
寫入數據
讀取數據
第二部分:時序介紹
時序及相關概念
第一時序
第二時序
結語
第一部分:工作原理
DRAM基本組成
內存是由DRAM(動態隨機存儲器)芯片組成的。DRAM的內部結構可以說是PC芯片中最簡單的,是由許多重復的“單元”——cell組成,每一個cell由一個電容和一個晶體管(一般是N溝道MOSFET)構成,電容可儲存1bit數據量,充放電后電荷的多少(電勢高低)分別對應二進制數據0和1。由於電容會有漏電現象,因此過一段時間之后電荷會丟失,導致電勢不足而丟失數據,因此必須經常進行充電保持電勢,這個充電的動作叫做刷新,因此動態存儲器具有刷新特性,這個刷新的操作一直要持續到數據改變或者斷電。而MOSFET則是控制電容充放電的開關。DRAM由於結構簡單,可以做到面積很小,存儲容量很大。
內存地址
內存中的cell按矩陣形排列,每一行和每一列都會有一個對應的行地址線路(正規叫法叫做word line)和列地址線路(正規叫法是bit line),每個具體的cell就掛接在這樣的行地址線路和列地址線路上,對應一個唯一的行號和列號,把行號和列號組合在一起,就是內存的地址。
上圖是Thaiphoon Burner的一個SPD dump,每個地址是一個字節。不過我們可以把這些數據假設成只有一個bit,當成是一個簡單的內存地址表,左邊豎着的是行地址,上方橫着的是列地址。例如我們要找第七行、倒數第二列(地址為7E)的數據,它就只有一個對應的值:FD。當然了,在內存的cell中,它只能是0或者1。
尋址
數據要寫入內存的一個cell,或者從內存中的一個cell讀取數據,首先要完成對這個cell的尋址。尋址的過程,首先是將需要操作的cell的對應行地址信號和列地址信號輸入行/列地址緩沖器,然后先通過行解碼器(Row Decoder)選擇特定的行地址線路,以激活特定的行地址。每一條行地址線路會與多條列地址線路和cell相連接,為了偵測列地址線路上微弱的激活信號,還需要一個額外的感應放大器(Sense Amplifier)放大這個信號。當行激活之后,列地址緩沖器中的列地址信號通過列解碼器(Column Decoder)確定列地址,並被對應的感應放大器通過連接IO線路,這樣cell就被激活,並可供讀寫操作,尋址完成。從行地址激活,到找到列地址這段時間,就是tRCD。
 |
內存cell的基本操作
內存中的cell可以分為3個基本操作,數據的儲存、寫入與讀取。為了便於理解,我不打算直接從電路控制上對cell操作進行說明,而是希望通過模型類比來達到說明問題的目的,如有不嚴謹之處,高手勿怪。要對內存cell進行讀寫操作,首先要完成上述尋址過程,並且電容的充電狀態信號要被感應放大器感應到,並且放大,然后MOSFET打開,電容放電,產生電勢變化,把電荷輸送到IO線路,導致線路的電勢也變化。當然,這只是個簡單的描述,以下我們先來了解硅晶體中“電容”的結構和MOSFET的控制原理。
硅晶體中的“電容”
這里之所以“電容”兩個字被打上引號,是因為硅晶體中並沒有真正意義上的電容。硅晶體中的電容是由兩個對置的觸發器組成的等效電容。例如兩個非門(Nor Gate)用如下圖的方式對接。它可以通過周期性施加特定的輸入信號,以把電荷保留在電路中,充當電容的作用。如下圖,兩個非門的輸入端R和S互相交替做0和1輸入,就可以把電荷儲存在電路中。整個動態過程就是這樣:

而R和S的波形就是如下圖所示,剛好互為反相,差半個周期:

要讓電容放電,我們只需要把R和S同時輸入1或者0即可。因此這種電容的邏輯關系很簡單:在同一時刻R和S輸入狀態不同(即存在電勢差)時,電容為充電狀態;在同一時刻R和S輸入狀態相同(即電勢差為0)時,電容為放電狀態。

MOSFET的控制原理——水庫模型
要說明這個MOSFET的控制原理,我們借助一個水庫的模型來說明。MOSFET有三個極,分別是源極(Source)、漏極(Drain)和柵極(Gate)。下圖左邊就是一個MOSFET的電路圖,右邊是我們畫出的一個水庫模型。

圖中S為源極,D為漏極,G為柵極。S極連接着電容,D級連接列地址線路,並接到數據IO,G則是控制電荷流出的閥門,連接行地址線路。電容在充電后電勢會改變,這樣S極的電勢就會跟着改變,與D極形成電勢差,而G極的電勢,就決定了S極有多少電荷可以流入D極。由於電子是帶負電荷,因此電子越多電勢就越低。為了不至於混淆概念,我們把水池頂部電勢定為0V,水池底部電勢定為5V(僅舉例說明,DRAM中的電容實際電壓未必是5V)。當電子數量越多時,電勢越低,接近0V,電子數量越少時,電勢越高,接近5V。

用水庫模型說明,就是左邊的水池水量升高(電容充電后),當閥門關閉時,左邊的水是不會往右邊流的。然后閥門打開(降低,電勢升高),左邊的水就可以往右邊流,閥門的高度就決定了有多少水能流去右邊的水道(但是在數字電路中,MOSFET只有開和關兩種狀態,因此下文提到的打開MOSFET就是全開);同樣道理如果右邊水多,閥門打開之后也可以向左邊流。因此在水庫模型中,電容就充當了左邊的水池,而MOSFET的柵極就充當了閥門,列地址線路和IO則充當了右邊的水道。
儲存數據
MOSFET柵極電勢為0V時,電容的電荷不會流出,因此數據就可以保存我們可以用2.5V為參考分界線,電容電勢低於2.5V時,表示數據0,電勢高於2.5V時,表示數據1。例如上一樓水庫模型的左圖,電容中儲存的電子數高於一半的高度,電勢低於2.5V,因此可以表示數據0。但以上只是理論情況,實際上電容會自然漏電,電子數量會逐漸減少,電勢就會逐漸升高,當電勢升高到2.5V以上時,數據就會出錯,因此每隔一段時間必須打開MOSFET往電容中充電,以保持電勢,這就是刷新。因此,數據的儲存主要就是對電容中電勢的保持操作。
寫入數據
數據寫入的操作分為寫入0和寫入1兩種情況。寫入前,電容原有的情況可能是高電勢與低電勢的狀態,我們不用管它。寫入0和寫入1對cell的操作不盡相同,我們分別來看。
先來看寫入0的操作。寫入開始時,IO線路上電勢為0(水道處於水位最高點),MOSFET柵極電勢升高到5V(水庫閥門降到最低),閥門打開,電容中的電勢就跟着降低(水位升高),直到接近0V(水池被灌滿),寫入0完成,柵極電勢降回0V,閥門關閉。

再看寫入1的操作。寫入開始時,IO線路上的電勢為5V(水道水位為最低點),MOSFET柵極電勢升高到5V(水庫閥門降到最低),閥門打開,電容中的電勢跟着升高(水流出並降低水位)到接近5V,寫入1完成,柵極電勢回到0V,閥門關閉。

讀取數據
讀取的時候,對漏極的電壓操作跟寫入有些不同。因為水道中的水比水池中的多,或者說水道的容量比水池要大得多。如果水道(漏極)的水為滿或者空,在閥門打開的時候很容易出現水道的水倒灌進水池的現象,或是水池的水全部流去水道,這樣就有可能導致電容中的電勢狀態改變,電容對應儲存的0或者1也會改變。所以讀取數據的時候,IO線路的電壓應為1/2的滿電勢,即2.5V。
讀取也同樣分讀取0和1兩種情況。在讀取之前,電容中的電勢應該是大於或者小於2.5V的,分別代表存儲了1和0。由於刷新機制的存在,應該不會允許出現等於2.5V的情況。
首先看讀取0操作。電容中為低電勢(假設為0V,水池為高水位),IO線路上電勢升高至2.5V(這時水道水位比水池低),MOSFET柵極電勢升高到5V(水庫閥門降到最低),閥門打開,電容中電勢升高(水位降低),但由於水道容量較大,因此水位不會升高太多,但是總歸也會有個電勢的變低,最終電容與IO線路上的電勢都變成0-2.5V的一個中間值,並且接近2.5V(假設為2.3V)。這時候感應放大器檢測到IO線路上電勢低於2.5V,因此識別出0讀出。

再看讀取1操作。電容中為高電勢(假設為5V,水池空),IO線路上電勢升高至2.5V(這時候水道水位比水池高),MOSFET柵極電勢升高到5V(水庫閥門降到最低),閥門打開,電容中電勢降低(水位升高),但由於水道容量較大,水位不會降低太多,不過多少也會降低一點(電勢會升高),假設升高到2.7V。這時候感應放大器檢測到IO線路的電勢高於2.5V,識別出1讀出。

以上講述的只是從cell到內存IO線路的讀寫操作,至於CPU-IMC-內存的讀寫操作,不在本文討論范圍。
第二部分:時序介紹
時序及相關概念
以下我把時序分為兩部分,只是為了下文介紹起來作為歸類,非官方分類方法。 第一時序:CL-tRCD-tRP-tRAS-CR,就是我們常說的5個主要時序。 第二時序:(包含所有XMP時序)
在講時序之前,我想先讓大家明白一些概念。內存時鍾信號是方波,DDR內存在時鍾信號上升和下降時各進行一次數據傳輸,所以會有等效兩倍傳輸率的關系。例如DDR3-1333的實際工作頻率是666.7MHz,每秒傳輸數據666.7*2=1333百萬次,即1333MT/s,也就是我們說的等效頻率1333MHz,再由每條內存位寬是64bit,那么它的帶寬就是:1333MT/s*64bit/8(8bit是一字節)=10667MB/s。所謂時序,就是內存的時鍾周期數值,脈沖信號經過上升再下降,到下一次上升之前叫做一個時鍾周期,隨着內存頻率提升,這個周期會變短。例如CL9的意思就是CL這個操作的時間是9個時鍾周期。
另外還要搞清楚一些基本術語: Cell:顆粒中的一個數據存儲單元叫做一個Cell,由一個電容和一個N溝道MOSFET組成。 Bank:8bit的內存顆粒,一個顆粒叫做一個bank,4bit的顆粒,正反兩個顆粒合起來叫做一個bank。一根內存是64bit,如果是單面就是8個8bit顆粒,如果是雙面,那就是16個4bit的顆粒分別在兩面,不算ECC顆粒。 Rank:內存PCB的一面所有顆粒叫做一個rank,目前在Unbuffered台式機內存上,通常一面是8個顆粒,所以單面內存就是1個rank,8個bank,雙面內存就是2個rank,8個bank。Bank與rank的定義是SPD信息的一部分,在AIDA64中SPD一欄可以看到。 DIMM:指一條可傳輸64bit數據的內存PCB,也就是內存顆粒的載體,算上ECC芯片,一條DIMM PCB最多可以容納18個芯片。 第一時序
CAS Latency(CL):CAS即Column Address Strobe,列地址信號,它定義了在讀取命令發出后到數據讀出到IO接口的間隔時間。由於CAS在幾乎所有的內存讀取操作中都會生效(除非是讀取到同一行地址中連續的數據,4bit顆粒直接讀取間隔3個地址,8bit顆粒直接讀取間隔7個地址,這時候CAS不生效),因此它是對內存讀取性能影響最強的。如下圖,藍色的Read表示讀取命令,綠色的方塊表示數據讀出IO,中間間隔的時間就是CL。

已知CL時鍾周期值CAS,我們可以使用以下公式來計算實際延遲時間tCAS: tCAS(ns)=(CAS*2000)/內存等效頻率 例如,DDR3-1333 CL9內存實際CAS延遲時間=(9*2000)/1333=13.50 ns 或者反過來算,假如已知你的內存可以在7.5ns延遲下穩定工作,並且你想要DDR3-2000的頻率,那么你可以把CL值設為8T(實際上8ns,大於7.5ns即可),如果你想要DDR3-1600的頻率,那么你的CL值可以設到6T(實際7.5ns)。 這個公式對於所有用時鍾周期表示延遲的內存時序都可以用。
說到這個公式,我想順便說說大家對頻率和時序的糾結問題。首先來回顧一下DDR一代到三代的一些典型的JEDEC規范,並按照上邊那個公式算一下它的CL延遲時間: DDR-400 3-3-3-8:(3*2000)/400=15 ns DDR2-800 6-6-6-18:(6*2000)/800=15 ns DDR3-1333 9-9-9-24:剛才算了是13.5 ns
再來看看每一代的超頻內存的最佳表現(平民級,非世界紀錄): DDR1 Winbond BH-5 DDR-500 CL1.5:(1.5*2000)/500=6 ns DDR2 Micron D9GMH DDR2-1400 CL4:(4*2000)/1400=5.71 ns DDR3 PSC A3G-A DDR3-2133 CL6:(6*2000)/2133=5.63 ns
發現什么?不管是哪一代內存,隨着頻率提升,CL周期也同步提升,但是最后算出來的CL延遲時間卻差不多。那么到了DDR4,JEDEC規范頻率去到DDR4-4266,如果按照差不多的延遲,那么按照13ns多一些來算,那么CL值將達到28T!如果按照我們的極限超頻延遲來算,DDR4-4266下的延遲也將達到12T。所以到了下一代DDR4,兩位數的時鍾周期將不可避免。
所以,我想說的是,不要再去想什么DDR3的頻率,DDR2的時序,在頻寬嚴重過剩,IMC成為瓶頸的今天,它對性能沒太多的提升。
DRAM RAS to CAS Delay(tRCD):RAS的含義與CAS類似,就是行(Row)地址信號。它定義的是在內存的一個rank(內存的一面)之中,行地址激活(Active)命令發出之后,內存對行地址的操作所需要的時間。每一個內存cell就是一個可存儲數據的地址,每個地址都有對應的行號和列號,每一行包含1024個列地址,當某一行地址被激活后,多個CAS請求會被發送以進行讀寫操作。簡單的說,已知行地址位置,在這一行中找到相應的列地址,就可以完成尋址,進行讀寫操作,從已知行地址到找到列地址過去的時間就是tRCD。當內存中某一行地址被激活時,我們稱它為“open page”。在同一時刻,同一個rank可以打開8個行地址(8個bank,也就是8個顆粒各一個)。下圖顯示一個行地址激活命令發出,到尋找列地址並發出讀取指令,中間間隔的時間就是tRCD。tRCD值由於是最關鍵的尋址時間,它對內存最大頻率影響最大,一般想要上高頻,在加電壓和放寬CL值不奏效的時候,我們都要放寬這個延遲。

DRAM RAS Precharge Time(tRP):RAS預充電時間。它定義的是前一個行地址操作完成並在行地址關閉(page close)命令發出之后,准備對同一個bank中下一個行地址進行操作,tRP就是下一個行地址激活信號發出前對其進行的預充電時間。由於在行地址關閉命令發出之前,一個rank中的多個行地址可能正在被讀寫,tRP對內存性能影響不如CL和tRCD。雖然tRP的影響會隨着多個行地址激活與關閉信號頻繁操作一個bank而加大,但是它的影響會被bank interleaving(bank交叉操作)和command scheduling(命令調配)所削弱。交叉讀寫會交替使用不同的bank進行讀寫,減少對一個bank的操作頻率;命令調配則是由CPU多線程訪問不同的內存地址,同樣是減少對一個bank的頻繁操作次數。例如SNB CPU的內存控制器可以對讀寫操作命令進行有效地重新分配,以使得行地址激活命中率最大化(如果重復激活一個已經處於激活狀態的行地址,那就是RAS激活命令未命中),所以tRP在SNB平台對性能的影響不大,並且放寬它有可能可以幫助提升穩定性。下圖顯示的是一個即將被激活的行地址開始預充電,到它被激活間隔的時間,就是tRP。

DRAM RAS Active Time(tRAS):行地址激活的時間。它其實就是從一個行地址預充電之后,從激活到尋址再到讀取完成所經過的整個時間,也就是tRCD+tCL的意思。這個操作並不會頻繁發生,只有在空閑的內存新建數據的時候才會使用它。太緊的tRAS值,有可能會導致數據丟失或不完整,太寬的值則會影響內存性能,尤其是在內存使用量增加的時候。所以一般為了穩定性,我們設置tRAS≥tRTP+tRCD+CL即可(tRTP不是tRP,將在第二時序中介紹),尤其是PCB不好或者跑高頻的時候,多幾個周期比較穩妥。
DRAM Command Mode(Command Rate,CR):首命令延遲,也就是我們平時說的1T/2T模式。是指從選定bank之后到可以發出行地址激活命令所經過的時間。CR可能對性能的影響有比較大的變數:如果CPU所需要的數據都在內存的一個行地址上,就不需要進行重復多次的bank選擇,CR的影響就很小;但是如果一個rank中同時多個bank要激活行地址,或者不同的rank中不同bank需要同時激活的時候,CR對性能的影響就會提升。但是隨着內存頻率的提升,CR=1T/2T的時間差越短,它的影響就會越來越小,這就是我們看到DDR1的時候1T/2T對性能影響挺大,但是到了DDR3影響就很小的其中一個原因。但是為了性能最大化,我們盡量把CR設為1T,但是如果bank數很多的時候,例如插滿四條內存,就有32個bank,bank選擇隨機性增大,1T的首命令時間可能會不穩定。
所以,內存的基本讀取操作的時序角度流程就是把上面那三張圖合起來:預充電-激活行地址並尋找列地址-發送讀取命令-讀出數據,這四步操作中間的三個延遲就分別是tRP、tRCD和CL。和我們常說的時序順序剛好是反過來的。 第二時序——XMP
DRAM CAS Write Latency(tWCL):列地址寫入延遲,也就是DRAM的最小寫入操作時間,與CL剛好是讀寫對應關系,一般跟CL值設為同一個值就是可以穩定的。由於內存讀取之前必須先寫入,所以這個值可以說與CL一樣重要。但是在BIOS里一般沒得設置,可能是與CL綁定了。
DRAM Row Cycle Time(tRC):行周期時間。定義了同一bank兩次行激活命令所間隔的最小時間,或者說是一個bank中完成一次行操作周期(Row Cycle)的時間,即tRP+tRAS(預充電加上激活的整個過程),tRC設得太緊可能會直接點開不了機,一般只要能進系統再多加一兩個周期都是可以穩定的。下圖顯示的就是tRC的時間。

DRAM Row Refresh Cycle Time(tRFC):行地址刷新周期,定義了一個bank中行地址刷新所需要的時間。重提一下刷新的含義,由於cell中電容的電荷在MOSFET關閉之后一段時間就會失去,為了維持數據,每隔很短一段時間就需要重新充電。這里多提一句,Intel平台和AMD平台對tRFC的含義不一樣,AMD平台的tRFC是DRAM刷新延遲時間,單位是ns,通常有90/110/160/300幾個值可以調整,也就是說它的tRFC時鍾周期會隨着頻率的提升而提升;而Intel平台的單位則直接是時鍾周期,相反地延遲時間會隨着頻率的提升而降低。容量大的bank行地址和cell會更多,刷新時間也更長,因此tRFC也要更高。另外,tRFC如果太快會導致數據出錯,太慢則影響性能,但可以增加穩定性。
DRAM Refresh Interval(tREFI):內存刷新時間間隔,也就是內存的刷新命令生效前要經過的時間。刷新的時間間隔一般取決於內存顆粒的容量(density),容量越大,就越需要頻繁刷新,tREFI值就要越低。另外tREFI的時間也會受到內存工作溫度與內存電壓(Vdimm)影響,因為溫度越高電容漏電越快。一般在AMD主板的BIOS里,這個值只有3.9us和7.8us可選,而在SNB平台,則是按時鍾周期算,例如DDR3-1333下默認值為5199T,換算過來就是2000/1333x5199=7800ns,也就是7.8us。一般DRAM顆粒的spec中都是規定工作溫度大於85度時采用3.9us。
DRAM RAS to RAS Delay(tRRD):行地址間延遲,定義的是同一rank不同bank間兩個連續激活命令的最短延遲,在DDR3時代一般最小是4T。它的作用和CR有點像,不過比CR更多的時候對性能有較大的影響,所以這個時序可盡量縮小。
DRAM Write Recovery Time(tWR):內存寫入恢復時間,它定義了內存從寫入命令發出(從開始寫入算起)到下一次預充電間隔的時間,也就是tRP的前一個操作。如果這個時間設得太短,可能會導致前一次寫入未完成就開始下一次預充電,進行尋址,那么前一次寫入的數據就會不完整,造成丟數據的情況。這個周期也是第二時序中比較長的,DDR3-2000一般需要10-14個周期,甚至更高。
DRAM Read to Precharge Time(tRTP):與tWR類似,定義了同一rank上內存從讀取命令發出到tRP之前的間隔時間,但是它在讀取完成並且行地址關閉之后才會生效。單顆128MB的內存顆粒可以在DDR3-2000下運行在4到6個時鍾周期,如果bank容量增大時,這個時序有可能要放寬。
DRAM Four Active Window(tFAW):它定義了同一rank中允許同時發送大於四個行激活命令的間隔時間,因此最小值應該不小於tRRD的四倍。在DDR3上,tRRD的最小值是4T,因此tFAW的最小值就是16T。這個tFAW由於是在一個rank中大於四個bank同時激活之后才生效,因此在內存不是很繁忙的時候,它對性能的影響並不是很大。但是對一些頻繁讀寫內存的操作(例如SuperPI 32M),tFAW對性能的影響可能會加大。由於現在內存用滿的幾率非常非常小,兩根雙面的內存更是有4個rank,配合上interleaving,一個rank中同時激活大於四個bank的幾率應該不大,所以通常我們把它設為tRRD的四倍應該就不會出問題。
DRAM Write to Read Delay(tWTR):內存寫-讀延遲,它定義的是內存寫入命令發出后到下一個讀取命令之間的時間間隔,最小為4T,與tRTP類似,提升內存的頻率或者容量提升時,這個值需要提高。
結語
看完以上內容,我們已經對時序有了個大致的了解,現在應該可以知道一些時序設置時要注意什么了。比如tFAW要設為tRRD的四倍,tRAS不能設太低等等。還是那句話,內存是輔助CPU超頻的,時序設置只是為了放開內存更多的超頻空間,時序本身對性能的影響很小,並且隨着頻率的提升,或者bank數的增加,這種影響可能會進一步減小。具體不同的內存顆粒也會有不同的設置情況,還請大家多關注本站的顆粒匯總以及最新內存顆粒測試報告! 閱讀原文 https://www.cnblogs.com/QQParadise/articles/2430204.html |