nand flash 相關系統知識


【Nand Flash的物理存儲單元的陣列組織結構】

Nand flash的內部組織結構,此處還是用圖來解釋,比較容易理解:

 

圖2.Nand Flash物理存儲單元的陣列組織結構

上圖是K9K8G08U0A的datasheet中的描述。

 

簡單解釋就是:

1.一個nand flash由很多個塊(Block)組成,

    塊的大小一般是

        -> 128KB,

        -> 256KB,

        -> 512KB

      此處是128KB。

 

2.每個塊里面又包含了很多頁(page)。每個頁的大小,

       老的nand flash,頁大小是256B,512B,

            這類的nand flash被稱作small block,。地址周期只有4個。

       對於現在常見的nand flash多數是2KB,

            被稱作big block,對應的發讀寫命令地址,一共5個周期(cycle),

       更新的nand flash是4KB,

       ,也是Nand Flash的擦除操作的基本/最小單位。

 

3.每一個頁,對應還有一塊區域,叫做空閑區域(spare area)/冗余區域(redundant area),而Linux系統中,一般叫做OOB(Out Of Band),這個區域,是最初基於Nand Flash的硬件特性:數據在讀寫時候相對容易錯誤,所以為了保證數據的正確性,必須要有對應的檢測和糾錯機制,此機制被叫做EDC(Error Detection Code)/ECC(Error Code Correction,或者Error Checking and Correcting),所以設計了多余的區域,用於放置數據的校驗值。

       , 是Nand Flash的寫入操作的基本/最小的單位。

 

【Nand Flash數據存儲單元的整體架構】

簡單說就是,常見的nand flash,內部只有一個chip,每個chip只有一個plane。

而有些復雜的,容量更大的nand flash,內部有多個chip,每個chip有多個plane。這類的nand flash,往往也有更加高級的功能,比如下面要介紹的Multi Plane Program和Interleave Page Program等。

比如,型號為K9K8G08U0A這個芯片(chip),

            內部有: 

               K9F4G08U0A (256MB)     :  Plane (1Gb),   Plane (1Gb)

               K9F4G08U0A (256MB)     :  Plane (1Gb),   Plane (1Gb)

 

 

K9WAG08U1A  ,內部包含了2個K9K8G08U0A

K9NBG08U5A    ,內部包含了4個K9K8G08U0A

 

【Flash名稱的由來】

Flash的擦除操作是以block塊為單位的,與此相對應的是其他很多存儲設備,是以bit位為最小讀取/寫入的單位,Flash是一次性地擦除整個塊:在發送一個擦除命令后,一次性地將一個block,常見的塊的大小是128KB/256KB。。,全部擦除為1,也就是里面的內容全部都是0xFF了,由於是一下子就擦除了,相對來說,擦除用的時間很短,可以用一閃而過來形容,所以,叫做Flash Memory。中文有的翻譯為(快速)閃存。

 

【Flash相對於普通設備的特殊性】

1.       上面提到過的,Flash最小操作單位,有些特殊。

一般設備,比如硬盤/內存,讀取和寫入都是以bit位為單位,讀取一個bit的值,將某個值寫入對應的地址的位,都是可以按位操作的。

但是Flash由於物理特性,使得內部存儲的數據,只能從1變成0,這點,可以從前面的內部實現機制了解到,只是方便統一充電,不方便單獨的存儲單元去放電,所以才說,只能從1變成0,也就是釋放電荷。

所以,總結一下Flash的特殊性如下:

 

 

普通設備(硬盤/內存等)

Flash

讀取/寫入的叫法

讀取/寫入

讀取/編程(Program)①

讀取/寫入的最小單位

Bit/位

Page/頁

擦除(Erase)操作的最小單位

Bit/位

Block/塊②

擦除操作的含義

將數據刪除/全部寫入0

將整個塊都擦除成全是1,也就是里面的數據都是0xFF③

對於寫操作

直接寫即可

在寫數據之前,要先擦除,然后再寫

 

表2.Flash和普通設備相比所具有的特殊性

注:

①之所以將寫操作叫做編程,是因為,flash和之前的EPROM,EEPROM繼承發展而來,而之前的EEPROM(Electrically Erasable Programmable Read-Only Memory),往里面寫入數據,就叫做編程Program,之所以這么稱呼,是因為其對數據的寫入,是需要用電去擦除/寫入的,就叫做編程。

②對於目前常見的頁大小是2K/4K的Nand Flash,其塊的大小有128KB/256KB/512KB等。而對於Nor Flash,常見的塊大小有64K/32K等。

③在寫數據之前,要先擦除,內部就都變成0xFF了,然后才能寫入數據,也就是將對應位由1變成0。

 

【Nand Flash引腳(Pin)的說明】

 

圖3.Nand Flash引腳功能說明

上圖是常見的Nand Flash所擁有的引腳(Pin)所對應的功能,簡單翻譯如下:

1.       I/O0 ~ I/O7:用於輸入地址/數據/命令,輸出數據

2.       CLE:Command Latch Enable,命令鎖存使能,在輸入命令之前,要先在模式寄存器中,設置CLE使能

3.       ALE:Address Latch Enable,地址鎖存使能,在輸入地址之前,要先在模式寄存器中,設置ALE使能

 

4.       CE#:Chip Enable,芯片使能,在操作Nand Flash之前,要先選中此芯片,才能操作

5.       RE#:Read Enable,讀使能,在讀取數據之前,要先使CE#有效。

6.       WE#:Write Enable,寫使能,在寫取數據之前,要先使WE#有效。

7.       WP#:Write Protect,寫保護

8.       R/B#:Ready/Busy Output,就緒/忙,主要用於在發送完編程/擦除命令后,檢測這些操作是否完成,忙,表示編程/擦除操作仍在進行中,就緒表示操作完成.

 

9.       Vcc:Power,電源

10.   Vss:Ground,接地

11.   N.C:Non-Connection,未定義,未連接。

 

[小常識]

在數據手冊中,你常會看到,對於一個引腳定義,有些字母上面帶一橫杠的,那是說明此引腳/信號是低電平有效,比如你上面看到的RE頭上有個橫線,就是說明,此RE是低電平有效,此外,為了書寫方便,在字母后面加“#”,也是表示低電平有效,比如我上面寫的CE#;如果字母頭上啥都沒有,就是默認的高電平有效,比如上面的CLE,就是高電平有效。

 

【為何需要ALE和CLE

突然想明白了,Nand Flash中,為何設計這么多的命令,把整個系統搞這么復雜的原因了:

比如命令鎖存使能(Command Latch Enable,CLE)和地址鎖存使能(Address Latch Enable,ALE),那是因為,Nand Flash就8個I/O,而且是復用的,也就是,可以傳數據,也可以傳地址,也可以傳命令,為了區分你當前傳入的到底是啥,所以,先要用發一個CLE(或ALE)命令,告訴nand Flash的控制器一聲,我下面要傳的是命令(或地址),這樣,里面才能根據傳入的內容,進行對應的動作。否則,nand flash內部,怎么知道你傳入的是數據,還是地址,還是命令啊,也就無法實現正確的操作了.

 

【Nand Flash只有8個I/O引腳的好處】

1.       減少外圍引腳:相對於並口(Parellel)的Nor Flash的48或52個引腳來說,的確是大大減小了引腳數目,這樣封裝后的芯片體積,就小很多。現在芯片在向體積更小,功能更強,功耗更低發展,減小芯片體積,就是很大的優勢。同時,減少芯片接口,也意味着使用此芯片的相關的外圍電路會更簡化,避免了繁瑣的硬件連線。

2.       提高系統的可擴展性,因為沒有像其他設備一樣用物理大小對應的完全數目的addr引腳,在芯片內部換了芯片的大小等的改動,對於用全部的地址addr的引腳,那么就會引起這些引腳數目的增加,比如容量擴大一倍,地址空間/尋址空間擴大一倍,所以,地址線數目/addr引腳數目,就要多加一個,而對於統一用8個I/O的引腳的Nand Flash,由於對外提供的都是統一的8個引腳,內部的芯片大小的變化或者其他的變化,對於外部使用者(比如編寫nand flash驅動的人)來說,不需要關心,只是保證新的芯片,還是遵循同樣的接口,同樣的時序,同樣的命令,就可以了。這樣就提高了系統的擴展性。

 --------------------------------------------------------------------------

【Nand flash的一些典型(typical)特性】

1.頁擦除時間是200us,有些慢的有800us。

2.塊擦除時間是1.5ms.

3.頁數據讀取到數據寄存器的時間一般是20us。

4.串行訪問(Serial access)讀取一個數據的時間是25ns,而一些舊的nand flash是30ns,甚至是50ns。

5.輸入輸出端口是地址和數據以及命令一起multiplex復用的。

6.以前老的Nand Flash,編程/擦除時間比較短,比如K9G8G08U0M,才5K次,而后來很多6.nand flash的編程/擦除的壽命,最多允許的次數,以前的nand flash多數是10K次,也就是1萬次,而現在很多新的nand flash,技術提高了,比如,Micron的MT29F1GxxABB,Numonyx的NAND04G-B2D/NAND08G-BxC,都可以達到100K,也就是10萬次的編程/擦除。和之前常見的Nor Flash達到同樣的使用壽命了。

7.48引腳的TSOP1封裝或 52引腳的ULGA封裝

 

【Nand Flash中的特殊硬件結構】

由於nand flash相對其他常見設備來說,比較特殊,所以,特殊的設備,也有特殊的設計,所以,有些特殊的硬件特性,就有比較解釋一下:

1.       頁寄存器(Page Register):由於Nand Flash讀取和編程操作來說,一般最小單位是頁,所以,nand flash在硬件設計時候,就考慮到這一特性,對於每一片,都有一個對應的區域,專門用於存放,將要寫入到物理存儲單元中去的或者剛從存儲單元中讀取出來的,一頁的數據,這個數據緩存區,本質上就是一個buffer,但是只是名字叫法不同,datasheet里面叫做Page Register,此處翻譯為頁寄存器,實際理解為頁緩存,更為恰當些。

注意:只有寫到了這個頁緩存中,只有等你發了對應的編程第二階段的確認命令0x10,實際的編程動作才開始,才開始把頁緩存中的數據,一點點寫到物理存儲單元中去。

所以,簡單總結一下就是,對於數據的流向,實際是經過了如下步驟:

圖4 Nand Flash讀寫時的數據流向

 

【Nand Flash中的壞塊(Bad Block)】

Nand Flash中,一個塊中含有1個或多個位是壞的,就成為其為壞塊。

壞塊的穩定性是無法保證的,也就是說,不能保證你寫入的數據是對的,或者寫入對了,讀出來也不一定對的。而正常的塊,肯定是寫入讀出都是正常的。

壞塊有兩種:

(1)一種是,也就是,你買到的新的,還沒用過的Nand Flash,就可以包含了壞塊。此類出廠時就有的壞塊,被稱作factory (masked)bad block或initial bad/invalid block,在出廠之前,就會做對應的標記,標為壞塊。

具體標記的地方是,對於現在常見的頁大小為2K的Nand Flash,是塊 中 第一個頁 的oob起始位置的 第1個字節(舊的小頁面,pagesize是512B甚至256B的nand flash,壞塊標記是第6個字節),。相對應的是,所有正常的塊,好的塊,里面所有數據都是0xFF的。

(2)第二類叫做在的,由於使用過程時間長了,在擦塊除的時候,出錯了,說明此塊壞了,也要在程序運行過程中,發現,並且標記成壞塊的。具體標記的位置,和上面一樣。這類塊叫做worn-out bad block。

 

----  壞塊管理(BBM,Bad Block Managment)----

對於壞塊的管理,在Linux系統中,叫做壞塊管理(BBM,Bad Block Managment),對應的會有一個表去記錄好塊,壞塊的信息,以及壞塊是出廠就有的,還是后來使用產生的,這個表叫做 壞塊表(BBT,Bad Block Table)。在Linux內核MTD架構下的Nand Flash驅動,和Uboot中Nand Flash驅動中,在加載完驅動之后,如果你沒有加入參數主動要求跳過壞塊掃描的話,那么都會去主動,建立必要的BBT的,以備后面壞塊管理所使用。

 

而關於好塊和壞塊,Nand Flash在出廠的時候,會做出保證:

1.關於好的,可以使用的塊的數目達到一定的數目,比如三星的K9G8G08U0M,整個flash一共有4096個塊,出廠的時候,保證好的塊至少大於3996個,也就是意思是,你新買到這個型號的nand flash,最壞的可能,有3096-3996=100個壞塊。不過,事實上,現在出廠時的壞塊,比較少,絕大多數,都是使用時間長了,在使用過程中出現的。

2.保證第一個塊是好的,並且一般相對來說比較耐用。做此保證的主要原因是,很多Nand Flash壞塊管理方法中,就是將第一個塊,用來存儲上面提到的BBT,否則,都是出錯幾率一樣的塊,那么也就不太好管理了,連放BBT的地方,都不好找了,^_^。

 

一般來說,不同型號的Nand Flash的數據手冊中,也會提到,自己的這個nand flash,最多允許多少個壞塊。就比如上面提到的,三星的K9G8G08U0M,最多有100個壞塊。

 

對於壞塊的標記,本質上,也只是對應的flash上的某些字節的數據是非0xFF而已,所以,只要是數據,就是可以讀取和寫入的。也就意味着,可以寫入其他值,也就把這個壞塊標記信息破壞了。對於出廠時的壞塊,一般是不建議將標記好的信息擦除掉的。

uboot中有個命令是“nand scrub”就可以將塊中所有的內容都擦除了,包括壞塊標記,不論是出廠時的,還是后來使用過程中出現而新標記的。一般來說,不建議用這個。不過,我倒是經常用,其實也沒啥大礙,呵呵。

最好用“nand erase”只擦除好的塊,對於已經標記壞塊的塊,不擦除。

 

 

【nand Flash中頁的訪問順序】

在一個塊內,對每一個頁進行編程的話,必須是順序的,而不能是隨機的。比如,一個塊中有128個頁,那么你只能先對page0編程,再對page1編程,。。。。,而不能隨機的,比如先對page3,再page1,page2.,page0,page4,.。。。

 

【片選無關(CE don’t-care)技術】  (降低功耗的方式)

很多Nand flash支持一個叫做CE don’t-care的技術,字面意思就是,不關心是否片選,

那有人會問了,如果不片選,那還能對其操作嗎?

答案就是,這個技術,主要用在不需要選中芯片卻還可以繼續操作的這些情況:在某些應用,比如錄音,音頻播放等應用,中,外部使用的微秒(us)級的時鍾周期,此處假設是比較少的2us,在進行讀取一頁或者對頁編程時,是對Nand Flash操作,這樣的串行(Serial Access)訪問的周期都是20/30/50ns,都是納秒(ns)級的,此處假設是50ns,

當你已經發了對應的讀或寫的命令之后,接下來只是需要Nand Flash內部去自己操作,將數據讀取除了或寫入進去到內部的數據寄存器中而已,,CE#是低電平有效,取消片選就是拉高電平,這樣會在下一個外部命令發送過來之前,即微秒量級的時間里面,即2us-50ns≈2us,這段時間的取消片選,可以降低很少的系統功耗,但是多次的操作,就可以在很大程度上降低整體的功耗了。

總結起來簡單解釋就是:由於某些外部應用的頻率比較低,而Nand Flash內部操作速度比較快,所以具體讀寫操作的大部分時間里面,都是在等待外部命令的輸入,同時卻選中芯片,產生了多余的功耗,此“不關心片選”技術,就是在Nand Flash的內部的相對快速的操作(讀或寫)完成之后,就取消片選,以節省系統功耗。待下次外部命令/數據/地址輸入來的時候,再選中芯片,即可正常繼續操作了。這樣,整體上,就可以大大降低系統功耗了。

注:。如果數據沒有記錯的話,我之前遇到我們系統里面的nand flash的片選,呢,要知道,整個系統優化之后的待機功耗,也才10個mA左右的。

 

帶EDC的拷回操作以及Sector的定義(Copy-Back Operation with EDC & Sector Definition for EDC)】

Copy-Back功能,簡單的說就是,將一個頁的數據,拷貝到另一個頁。

如果沒有Copy-Back功能,那么正常的做法就是,先要將那個頁的數據拷貝出來放到內存的數據buffer中,讀出來之后,再用寫命令將這頁的數據,寫到新的頁里面。

Copy-Back功能的好處在於,不需要用到外部的存儲空間,不需要讀出來放到外部的buffer里面,而是可以直接讀取數據到內部的頁寄存器(page register)然后寫到新的頁里面去。而且,為了保證數據的正確,要硬件支持EDC(Error Detection Code)的,否則,在數據的拷貝過程中,可能會出現錯誤,並且拷貝次數多了,可能會累積更多錯誤。

而對於錯誤檢測來說,硬件一般支持的是512字節數據,對應有16字節用來存放校驗產生的ECC數值,而這512字節一般叫做一個扇區。對於2K+64字節大小的頁來說,按照512字節分,分別叫做A,B,C,D區,而后面的64字節的oob區域,按照16字節一個區,分別叫做E,F,G,H區,對應存放A,B,C,D數據區的ECC的值。

總結:

512+16

2K  +64 : A B C D - E F G H區

Copy-Back編程的主要作用在於,去掉了數據串行讀取出來,再串行寫入進去的時間,所以,這部分操作,是比較耗時的,所以此技術可以提高編程效率,提高系統整體性能。

 

【多片同時編程(Simultaneously Program Multi Plane)】  針對plane

對於有些新出的Nand Flash,支持同時對多個片進行編程,比如上面提到的三星的K9K8G08U0A,內部包含4片(Plane),分別叫做Plane0,Plane1,Plane2,Plane3。.由於硬件上,對於每一個Plane,都有對應的大小是2048+64=2112字節的頁寄存器(Page Register),使得同時支持多個Plane編程成為可能。K9K8G08U0A支持同時對2個Plane進行編程。不過要注意的是,只能對Plane0和Plane1或者Plane2和Plane3,同時編程,而不支持Plane0和Plane2同時編程。

 

【交錯頁編程(Interleave Page Program)】                    針對chip

多片同時編程,是針對一個chip里面的多個Plane來說的,

而此處的交錯頁編程,是指對多個chip而言的。

可以先對一個chip,假設叫chip1,里面的一頁進行編程,然后此時,chip1內部就開始將數據一點點寫到頁里面,就出於忙的狀態了,而此時可以利用這個時間,對出於就緒狀態的chip2,也進行頁編程,發送對應的命令后,chip2內部也就開始慢慢的寫數據到存儲單元里面去了,也出於忙的狀態了。此時,再去檢查chip1,如果編程完成了,就可以開始下一頁的編程了,然后發完命令后,就讓其內部慢慢的編程吧,再去檢查chip2,如果也是編程完了,也就可以進行接下來的其他頁的編程了。如此,交互操作chip1和chip2,就可以有效地利用時間,使得整體編程效率提高近2倍,大大提高nand flash的編程/擦寫速度了。

 

【隨機輸出頁內數據(Random Data Output In a Page)】

在介紹此特性之前,先要說說,與Random Data Output In a Page相對應的是,普通的,正常的,sequential data output in a page。

正常情況下,我們讀取數據,都是先發讀命令,然后等待數據從存儲單元到內部的頁數據寄存器中后,我們通過不斷地將RE#(Read Enale,低電平有效)置低,然后從我們開始傳入的列的起始地址,一點點讀出我們要的數據,直到頁的末尾,當然有可能還沒到頁地址的末尾,就不再讀了。所謂的順序(sequential)讀取也就是,根據你之前發送的列地址的起始地址開始,每讀一個字節的數據出來,內部的數據指針就加1,移到下個字節的地址,然后你再讀下一個字節數據,就可以讀出來你要的數據了,直到讀取全部的數據出來為止。

而此處的隨機(random)讀取,就是在你正常的順序讀取的過程中,

        先發一個隨機讀取的開始命令0x05命令,

        再傳入你要將內部那個數據指針定位到具體什么地址,也就是2個cycle的列地址,

        然后再發隨機讀取結束命令0xE0,

        然后,內部那個數據地址指針,就會移動到你所制定的位置了,

        你接下來再讀取的數據,就是從那個制定地址開始的數據了。

        而nand flash數據手冊里面也說了,這樣的隨機讀取,你可以多次操作,沒限制的。

請注意,上面你所傳入的地址,都是列地址,也就是頁內地址,也就是說,對於頁大小為2K的nand flash來說,所傳入的地址,應該是小於2048+64=2112的。

不過,實際在nand flash的使用中,好像這種用法很少的。絕大多數,都是順序讀取數據。

 

 

【頁編程(寫操作)】

Nand flash的寫操作叫做編程Program,編程,一般情況下,是以頁為單位的。

有的Nand Flash,比如K9K8G08U0A,支持部分頁編程,但是有一些限制:在同一個頁內的,連續的部分頁的編程,不能超過4次。一般情況下,很少使用到部分頁編程,都是以頁為單位進行編程操作的。

 

一個操作,用去實現,看起來是多余,效率不高,但是實際上,有其特殊考慮,

至少對於塊擦除來說,

       開始的命令0x60是擦除設置命令(erase setup comman),

       然后傳入要擦除的塊地址,

       然后再傳入擦除確認命令(erase confirm command)0xD0,

以開始擦除的操作。

這種,分兩步:開始設置,最后確認的命令方式,是為了避免由於外部由於無意的/未預料而產生的噪音,比如,此時,即使被nand flash誤認為是擦除操作,但是沒有之后的確認操作0xD0,nand flash就不會去擦除數據,這樣使得數據更安全,不會由於噪音而誤操作。

 

 

 

【讀(read)操作過程詳解】

以最簡單的read操作為例,解釋如何理解時序圖,以及將時序圖中的要求,轉化為代碼。

 

解釋時序圖之前,讓我們先要搞清楚,我們要做的事情:那就是,要從nand flash的某個頁里面,讀取我們要的數據。

要實現此功能,會涉及到幾部分的知識,至少很容易想到的就是:

       1.需要用到哪些命令,

       2.怎么發這些命令,

       3.怎么計算所需要的地址,

       4.怎么讀取我們要的數據等等。

 

下面,就一步步的解釋,需要做什么,以及如何去做:

 

1.需要使用何種命令

首先,是要了解,對於讀取數據,要用什么命令。

下面是datasheet中的命令集合:

圖5.Nand Flash K9K8G08U0A的命令集合

很容易看出,我們要讀取數據,要用到Read命令,該命令需要2個周期,。

 

2.發送命令前的准備工作以及時序圖各個信號的具體含義

知道了用何命令后,再去了解如何發送這些命令。

圖6.Nand Flash數據讀取操作的時序圖

注:此圖來自三星的型號K9K8G08U0A的nand flash的數據手冊(datasheet)。

 

我們來一起看看,我在圖6中的特意標注的①邊上的黃色豎線。

黃色豎線所處的時刻,是在發送讀操作的第一個周期的命令0x00之前的那一刻。

讓我們看看,在那一刻,其所穿過好幾行都對應什么值,以及進一步理解,為何要那個值。

(1)黃色豎線穿過的第一行,是CLE。還記得前面介紹命令所存使能(CLE)那個引腳吧?CLE,將CLE置1,就說明你將要通過I/O復用端口發送進入Nand Flash的,是命令,而不是地址或者其他類型的數據。只有這樣將CLE置1,使其有效,才能去通知了內部硬件邏輯,你接下來將收到的是命令,內部硬件邏輯,才會將受到的命令,放到命令寄存器中,才能實現后面正確的操作,否則,不去將CLE置1使其有效,硬件會無所適從,不知道你傳入的到底是數據還是命令了。

(2)而第二行,是CE#,那一刻的值是0。這個道理很簡單,你既然要向Nand Flash發命令,那么先要選中它,所以,要保證CE#為低電平,使其有效,也就是片選有效。

(3)第三行是WE#,意思是寫使能。因為接下來是往nand Flash里面寫命令,所以,要使得WE#有效,所以設為低電平。

(4)第四行,是ALE是低電平,而ALE是高電平有效,此時意思就是使其無效。而對應地,前面介紹的,使CLE有效,因為將要數據的是命令,而不是地址。如果在其他某些場合,比如接下來的要輸入地址的時候,就要使其有效,而使CLE無效了。

(5)第五行,RE#,此時是高電平,無效。可以看到,知道后面低6階段,才變成低電平,才有效,因為那時候,要發生讀取命令,去讀取數據。

(6)第六行,就是我們重點要介紹的,復用的輸入輸出I/O端口了,此刻,還沒有輸入數據,接下來,在不同的階段,會輸入或輸出不同的數據/地址。

(7)第七行,R/B#,高電平,表示R(Ready)/就緒,因為到了后面的第5階段,硬件內部,在第四階段,接受了外界的讀取命令后,把該頁的數據一點點送到頁寄存器中,這段時間,屬於系統在忙着干活,屬於忙的階段,所以,R/B#才變成低,表示Busy忙的狀態的。

介紹了時刻①的各個信號的值,以及為何是這個值之后,相信,后面的各個時刻,對應的不同信號的各個值,大家就會自己慢慢分析了,也就容易理解具體的操作順序和原理了。

 

3.如何計算出,我們要傳入的地址

在介紹具體讀取數據的詳細流程之前,還要做一件事,那就是,先要搞懂我們要訪問的地址,以及這些地址,如何分解后,一點點傳入進去,使得硬件能識別才行。

此處還是以K9K8G08U0A為例,此nand flash,一共有8192個塊,每個塊內有64頁,每個頁是2K+64 Bytes,假設,我們要訪問其中的,此時,我們就要先把具體的地址算出來:

物理地址=塊大小×塊號+頁大小×頁號+頁內地址=7000×128K+64×2K+1208=0x36B204B8,

接下來,我們就看看,怎么才能把這個實際的物理地址,轉化為nand Flash所要求的格式。

在解釋地址組成之前,先要來看看其datasheet中關於地址周期的介紹:

圖7 Nand Flash的地址周期組成

結合圖7和圖5中的2,3階段,我們可以看出,此nand flash地址周期共有5個,2個列(Column)周期,3個行(Row)周期。

而對於對應地,我們可以看出,實際上,

列地址A0~A10,就是頁內地址,地址范圍是從0到2047,而對出的A11,理論上可以表示2048~4095,但是實際上,我們最多也只用到了2048~2112,用於表示頁內的oob區域,其大小是64字節。

A12~A30,稱作頁號,頁的號碼,可以定位到具體是哪一個頁。

                   而其中,A18~A30,表示對應的塊號,即屬於哪個塊。

// 可見:地址的傳輸順序是是 頁內地址,頁號,塊號。 從小到大。

簡單解釋完了地址組成,那么就很容易分析上面例子中的地址了:

0x36B204B8 = 00110110 10110010 000001001011 1000,分別分配到5個地址周期就是:

1st 周期,A7~A0        :1011 1000= 0x B8

2nd周期,A11~A8      :00000100 = 0x04

3rd周期,A19~A12     :0010 0000= 0x20

4th周期,A27~A20     :0110 1011 = 0x6B

5th周期,A30~A28     :00000011 = 0x03

注意,與圖7中對應的,*L,意思是低電平,由於未用到那些位,datasheet中強制要求設為0,所以,才有上面的2nd周期中的高4位是0000.其他的A30之后的位也是類似原理,都是0。

因此,接下來要介紹的,我們要訪問第7000個塊中的第25頁中的1208字節處的話,所要傳入的地址就是分5個周期,分別傳入兩個列地址的:0xB8,0x04,然后再傳3個行地址的:0x20,0x6B,0x03,這樣硬件才能識別。

 

4.讀操作過程的解釋

准備工作終於完了,下面就可以開始解釋說明,對於讀操作的,上面圖中標出來的,1-6個階段,具體是什么含義。

(1)      操作准備階段:此處是讀(Read)操作,所以,先發一個圖5中讀命令的第一個階段的0x00,表示,讓硬件先准備一下,接下來的操作是讀。

(2)      發送兩個周期的列地址。也就是頁內地址,表示,我要從一個頁的什么位置開始讀取數據。

(3)      接下來再傳入三個行地址。對應的也就是頁號。

(4)      然后再發一個讀操作的第二個周期的命令0x30。接下來,就是硬件內部自己的事情了。

(5)      Nand Flash內部硬件邏輯,負責去按照你的要求,根據傳入的地址,找到哪個塊中的哪個頁,然后把整個這一頁的數據,都一點點搬運到頁緩存中去。而在此期間,你所能做的事,也就只需要去讀取狀態寄存器,看看對應的位的值,也就是R/B#那一位,是1還是0,0的話,就表示,系統是busy,仍在”忙“(着讀取數據),如果是1,就說系統活干完了,忙清了,已經把整個頁的數據都搬運到頁緩存里去了,你可以接下來讀取你要的數據了。

對於這里。估計有人會問了,這一個頁一共2048+64字節,如果我傳入的頁內地址,就像上面給的1028一類的值,只是想讀取1028到2011這部分數據,而不是頁開始的0地址整個頁的數據,那么內部硬件卻讀取整個頁的數據出來,豈不是很浪費嗎?答案是,的確很浪費,效率看起來不高,但是實際就是這么做的,而且本身讀取整個頁的數據,相對時間並不長,而且讀出來之后,內部數據指針會定位到你剛才所制定的1208的那個位置。

(6)      接下來,就是你“竊取“系統忙了半天之后的勞動成果的時候了,呵呵。通過先去Nand Flash的控制器中的數據寄存器中寫入你要讀取多少個字節(byte)/字(word),然后就可以去Nand Flash的控制器的FIFO中,一點點讀取你要的數據了。

至此,整個Nand Flash的讀操作就完成了。

對於其他操作,可以根據我上面的分析,一點點自己去看datasheet,根據里面的時序圖去分析具體的操作過程,然后對照代碼,會更加清楚具體是如何實現的。

 

【Flash的類型】

Flash的類型主要分兩種,nand flash和nor flash。

除了網上最流行的這個解釋之外:

NAND和NOR的比較

再多說幾句:

1.nor的成本相對高,具體讀寫數據時候,不容易出錯。總體上,比較適合應用於存儲少量的代碼。

2.Nand flash相對成本低。使用中數據讀寫容易出錯,所以一般都需要有對應的軟件或者硬件的數據校驗算法,統稱為ECC。由於相對來說,容量大,價格便宜,因此適合用來存儲大量的數據。其在嵌入式系統中的作用,相當於PC上的硬盤,用於存儲大量數據。

所以,一個常見的應用組合就是,用小容量的Nor Flash存儲啟動代碼,比如uboot,系統啟動后,初始化對應的硬件,包括SDRAM等,然后將Nand Flash上的Linux 內核讀取到內存中,做好該做的事情后,就跳轉到SDRAM中去執行內核了,然后內核解壓(如果是壓縮內核的話,否則就直接運行了)后,開始運行,在Linux內核啟動最后,去Nand Flash上,掛載根文件,比如jffs2,yaffs2等,掛載完成,運行初始化腳本,啟動consle交互,才運行你通過console和內核交互。至此完成整個系統啟動過程。

而Nor Flash存放的是Uboot,Nand Flash存放的是Linux的內核鏡像和根文件系統,以及余下的空間分成一個數據區。

 

Nor flash,有類似於dram之類的地址總線,因此可以直接和CPU相連,CPU可以直接通過地址總線對nor flash進行訪問,而nand flash沒有這類的總線,只有IO接口,只能通過IO接口發送命令和地址,對nand flash內部數據進行訪問。相比之下,nor flash就像是並行訪問,nand flash就是串行訪問,所以相對來說,前者的速度更快些。

但是由於物理制程/制造方面的原因,導致nor 和nand在一些具體操作方面的特性不同:

表3 Nand Flash 和 Nor Flash的區別

1.       理論上是可以的,而且也是有人驗證過可以的,只不過由於nand flash的物理特性,不能完全保證所讀取的數據/代碼是正確的,實際上,很少這么用而已。因為,如果真是要用到nand flash做XIP,那么除了讀出速度慢之外,還要保證有數據的校驗,以保證讀出來的,將要執行的代碼/數據,是正確的。否則,系統很容易就跑飛了。。。

2.       芯片內執行(XIP, eXecute In Place):

http://hi.baidu.com/serial_story/blog/item/adb20a2a3f8ffe3c5243c1df.html

 

【Nand Flash的種類】

具體再分,又可以分為

1)Bare NAND chips:裸片,單獨的nand 芯片

2)SmartMediaCards: =裸片+一層薄塑料,常用於數碼相機和MP3播放器中。之所以稱smart,是由於其軟件smart,而不是硬件本身有啥smart之處。^_^

3)DiskOnChip:裸片+glue logic,,那塊地址中包含了引導代碼的stub樁,其可以從nand flash中拷貝真正的引導代碼。

 

【spare area/oob】

Nand由於最初硬件設計時候考慮到,額外的錯誤校驗等需要空間,專門對應每個頁,額外設計了叫做spare area空區域,在其他地方,比如jffs2文件系統中,也叫做oob(out of band)數據。

其具體用途,總結起來有:

1.       標記是否是壞快

2.       存儲ECC數據

3.       存儲一些和文件系統相關的數據,如jffs2就會用到這些空間存儲一些特定信息,yaffs2文件系統,會在oob中,存放很多和自己文件系統相關的信息。

----------------------------------------------------------------------------

看到這里,我已內牛滿面,東北的哥們真夠給力,此文之詳細、用心可見一斑。 【內存技術設備,MTD(Memory Technology Device)】

MTD,是Linux的存儲設備中的一個子系統。其設計此系統的目的是,對於內存類的設備,提供一個抽象層,一個接口,使得對於硬件驅動設計者來說,可以盡量少的去關心存儲格式,比如FTL,FFS2等,而只需要去提供最簡單的底層硬件設備的讀/寫/擦除函數就可以了。而對於數據對於上層使用者來說是如何表示的,硬件驅動設計者可以不關心,而MTD存儲設備子系統都幫你做好了。

對於MTD字系統的好處,簡單解釋就是,他幫助你實現了,很多對於以前或者其他系統來說,本來也是你驅動設計者要去實現的很多功能。換句話說,有了MTD,使得你設計Nand Flash的驅動,所要做的事情,要少很多很多,因為大部分工作,都由MTD幫你做好了。

當然,這個好處的一個“副作用”就是,使得我們不了解的人去理解整個Linux驅動架構,以及MTD,變得更加復雜。但是,總的說,覺得是利遠遠大於弊,否則,就不僅需要你理解,而且還是做更多的工作,實現更多的功能了。

此外,還有一個重要的原因,那就是,前面提到的nand flash和普通硬盤等設備的特殊性:

有限的通過出復用來實現輸入輸出命令和地址/數據等的IO接口,最小單位是頁而不是常見的bit,寫前需擦除等,導致了這類設備,不能像平常對待硬盤等操作一樣去操作,只能采取一些特殊方法,這就誕生了MTD設備的統一抽象層。

MTD,將nand flash,nor flash和其他類型的flash等設備,統一抽象成MTD設備來管理,根據這些設備的特點,上層實現了常見的操作函數封裝,底層具體的內部實現,就需要驅動設計者自己來實現了。具體的內部硬件設備的讀/寫/擦除函數,那就是你必須實現的了。

 

表4.MTD設備和硬盤設備之間的區別

========== 多說一句,關於MTD更多的內容,感興趣的,去附錄中的MTD的主頁去看。

關於mtd設備驅動,感興趣的可以去參考

MTD原始設備與FLASH硬件驅動的對話

MTD原始設備與FLASH硬件驅動的對話-續

那里,算是比較詳細地介紹了整個流程,方便大家理解整個mtd框架和nand flash驅動。

 

【Nand flash驅動工作原理】

在介紹具體如何寫Nand Flash驅動之前,我們先要了解,大概的,整個系統,和Nand Flash相關的部分的驅動工作流程,這樣,對於后面的驅動實現,才能更加清楚機制,才更容易實現,否則就是,即使寫完了代碼,也還是沒搞懂系統是如何工作的了。

讓我們以最常見的,Linux內核中已經有的三星的Nand Flash驅動,來解釋Nand Flash驅動具體流程和原理。

 

此處是參考2.6.29版本的Linux源碼中的\drivers\mtd\nand\s3c2410.c,以2410為例。

1.   在nand flash驅動加載后,第一步,調用對應的init函數 ---- s3c2410_nand_init: 去將nand flash驅動注冊到Linux驅動框架中。

2.   驅動本身真正的開始,是從probe函數: s3c2410_nand_probe->s3c24xx_nand_probe,         在probe過程中:             clk_enable          //打開nand flash控制器的clock時鍾,             request_mem_region   //去申請驅動所需要的一些內存等相關資源。             s3c2410_nand_inithw  //去初始化硬件相關的部分,主要是關於時鍾頻率的計算,以及啟用nand flash控制器,使得硬件初始化好了,后面才能正常工作。

3.   需要多解釋一下的,是這部分代碼:

       for (setno = 0; setno < nr_sets; setno++, nmtd++) {               pr_debug("initialising set %d (%p, info %p)\n", setno, nmtd, info);

 

/*調用init chip去掛載你的nand驅動的底層函數到"nand flash的結構體"中,以及設置對應的"ecc mode",掛載ecc相關的函數 */

              s3c2410_nand_init_chip(info, nmtd, sets);

 

/* scan_ident,掃描nand 設備,設置nand flash的默認函數,獲得物理設備的具體型號以及對應各個特性參數,這部分算出來的一些值,對於nand flash來說,是最主要的參數,比如nand flash的芯片的。 */               nmtd->scan_res = nand_scan_ident(&nmtd->mtd, (sets) ? sets->nr_chips : 1);

              if (nmtd->scan_res == 0) {                      s3c2410_nand_update_chip(info, nmtd);

 

/*掃描的后一階段,經過前面的scan_ident,我們已經獲得對應nand flash的硬件的各個參數, *然后就可以在scan tail中根據這些參數,去設置其他一些重要參數,尤其是ecc的layout,即ecc是如何在oob中擺放的, *最后,再去進行一些初始化操作,主要是根據你的驅動,如果沒有實現一些函數的話,那么就用系統默認的。 */                      nand_scan_tail(&nmtd->mtd);

 

/*add partion,根據你的nand flash的分區設置,去分區 */                      s3c2410_nand_add_partition(info, nmtd, sets);               }               if (sets != NULL)                      sets++;        }

 

 

4.   等所有的參數都計算好了,函數都掛載完畢,系統就可以正常工作了。

上層訪問你的nand falsh中的數據的時候,通過MTD層,一層層調用,最后調用到你所實現的那些底層訪問硬件數據/緩存的函數中。

 

【Linux下nand flash驅動編寫步驟簡介】

關於上面提到的,在nand_scan_tail的時候,系統會根據你的驅動,如果沒有實現一些函數的話,那么就用系統默認的。如果實現了自己的函數,就用你的。 "那么到底我要實現哪些函數呢,而又有哪些是可以不實現,用系統默認的就可以了呢。" 此問題的,就是我們下面要介紹的,也就是,你要實現的,你的驅動最少要做哪些工作,才能使整個nand flash工作起來。

1.       對於驅動框架部分

其實,要了解,關於驅動框架部分,你所要做的事情的話,只要看看三星的整個nand flash驅動中的這個結構體,就差不多了:

static struct platform_driver s3c2410_nand_driver = {        .probe          = s3c2410_nand_probe,        .remove        = s3c2410_nand_remove,        .suspend      = s3c24xx_nand_suspend,        .resume        = s3c24xx_nand_resume,        .driver           = {               .name     = "s3c2410-nand",               .owner    = THIS_MODULE,        }, };

對於上面這個結構體,沒多少要解釋的。從名字,就能看出來: (1)probe就是系統“探測”,就是前面解釋的整個過程,這個過程中的多數步驟,都是和你自己的nand flash相關的,尤其是那些硬件初始化部分,是你必須要自己實現的。 (2)remove,就是和probe對應的,“反初始化”相關的動作。主要是釋放系統相關資源和關閉硬件的時鍾等常見操作了。 (3)suspend和resume,對於很多沒用到電源管理的情況下,至少對於我們剛開始寫基本的驅動的時候,可以不用關心,放個空函數即可。

2.       對於nand flash底層操作實現部分

而對於底層硬件操作的有些函數,總體上說,都可以在上面提到的s3c2410_nand_init_chip中找到:

static void s3c2410_nand_init_chip(struct s3c2410_nand_info *info,                                    struct s3c2410_nand_mtd  *nmtd,                             //主要是完善該結構體struct s3c2410_nand_mtd                                    struct s3c2410_nand_set  *set) {

       struct nand_chip *chip = &nmtd->chip;        void __iomem *regs = info->regs;

       chip->write_buf    = s3c2410_nand_write_buf;        chip->read_buf     = s3c2410_nand_read_buf;        chip->select_chip  = s3c2410_nand_select_chip;        chip->chip_delay   = 50;        chip->priv         = nmtd;        chip->options      = 0;        chip->controller   = &info->controller;

       switch (info->cpu_type) {        case TYPE_S3C2410:

/* nand flash控制器中,一般都有對應的數據寄存器,用於給你往里面寫數據,表示將要讀取或寫入多少個字節(byte,u8)/字(word,u32) ,所以,此處,你要給出地址,以便后面的操作所使用 */

              chip->IO_ADDR_W    = regs + S3C2410_NFDATA;               info->sel_reg             = regs + S3C2410_NFCONF;               info->sel_bit               = S3C2410_NFCONF_nFCE;               chip->cmd_ctrl           = s3c2410_nand_hwcontrol;               chip->dev_ready        = s3c2410_nand_devready;

              break;

。。。。。。

      }

       chip->IO_ADDR_R = chip->IO_ADDR_W;

       nmtd->info              = info;        nmtd->mtd.priv        = chip;        nmtd->mtd.owner    = THIS_MODULE;        nmtd->set                = set;

       if (hardware_ecc) {               chip->ecc.calculate = s3c2410_nand_calculate_ecc;               chip->ecc.correct    = s3c2410_nand_correct_data;

/* 此處,多數情況下,你所用的Nand Flash的控制器,都是支持硬件ECC的,所以,此處設置硬件ECC(HW_ECC) ,也是充分利用硬件的特性, * 而如果此處不用硬件去做ECC話,那么下面也會去設置成NAND_ECC_SOFT,系統會用默認的軟件去做ECC校驗,相比之下,比硬件ECC的效率就低很多,而你的nand flash的讀寫,也會相應地要慢不少 */

              chip->ecc.mode         = NAND_ECC_HW;   //設置成了硬件方式校驗ecc

              switch (info->cpu_type) {

              case TYPE_S3C2410:

                     chip->ecc.hwctl      = s3c2410_nand_enable_hwecc;                      chip->ecc.calculate  = s3c2410_nand_calculate_ecc;

                     break; 。。。。。               }

       } else {               chip->ecc.mode         = NAND_ECC_SOFT; //也就是說,怎么搞也得校驗了        }

       if (set->ecc_layout != NULL)               chip->ecc.layout   = set->ecc_layout;

       if (set->disable_ecc)               chip->ecc.mode     = NAND_ECC_NONE; }

 

而我們要實現的底層函數,也就是上面藍色標出來的一些函數而已:

(1)s3c2410_nand_write_bufs3c2410_nand_read_buf:這是,其功能,就是往你的nand flash的控制器中的FIFO讀寫數據。一般情況下,是MTD上層的操作,比如要讀取一頁的數據,那么在發送完相關的讀命令和等待時間之后,就會調用到你底層的read_buf,去nand Flash的FIFO中,一點點把我們要的數據,讀取出來,放到我們制定的內存的緩存中去。寫操作也是類似,將我們內存中的數據,寫到Nand Flash的FIFO中去。 (2)s3c2410_nand_select_chip : 實現Nand Flash的。 (3)s3c2410_nand_hwcontrol:    給底層,或者設置具體操作的模式,都是通過此函數。 (4)s3c2410_nand_devready:     Nand Flash的一些操作,比如讀一頁數據,寫入(編程)一頁數據,擦除一個塊,都是需要一定時間的,在命令發送完成后,就是硬件開始忙着工作的時候了,而硬件什么時候完成這些操作,什么時候不忙了,變就緒了,就是通過這個函數去的。一般具體實現都是去讀硬件的一個狀態寄存器,其中某一位是否是1,對應着是出於“就緒/不忙”還是“忙”的狀態。這個寄存器,也就是我們前面分析時序圖中的R/B#。 (5)s3c2410_nand_calculate_ecc:如果是上面提到的硬件ECC的話,就不用我們用了,而是直接去讀取硬件產生的ECC數值就可以了。 (6)s3c2410_nand_correct_data: 當實際操作過程中,讀取出來的數據所對應的硬件或軟件計算出來的ECC,和從oob中讀出來的ECC不一樣的時候,就是說明數據有誤了,就需要調用此函數去糾正錯誤。對於現在SLC常見的ECC算法來說,可以。如果錯誤大於1位,那么就無法糾正回來了。一般情況下,出錯超過1位的,好像幾率不大。至少我看到的不是很大。更復雜的情況和更加注重數據安全的情況下,一般是需要另外實現更高效和檢錯和糾錯能力更強的ECC算法的。 (7)s3c2410_nand_enable_hwecc: 在硬件支持的前提下,前面設置了硬件ECC的話,要實現這個函數,用於每次在讀寫操作前,,這樣在讀寫操作完成后,就可以去讀取硬件校驗產生出來的ECC數值了。

當然,除了這些你必須實現的函數之外,在你更加熟悉整個框架之后,你可以根據你自己的nand flash的特點,去實現其他一些原先用系統默認但是效率不高的函數,而用自己的更高效率的函數替代他們,以提升你的nand flash的整體性能和效率。

 

【引用文章】

1.Brief Intro of Nand Flash

http://hi.baidu.com/serial_story/blog/item/3f1635d1dc041cd7562c84a1.html

2. Samsung的型號為K9G8G08U0M的Nand Flash的數據手冊

要下載數據手冊,可以去這里介紹的網站下載:

samsung 4K pagesize SLC Nand Flash K9F8G08U0M datasheet + 推薦一個datasheet搜索的網站

http://hi.baidu.com/serial_story/blog/item/7f25a03def1de309bba167c8.html

3.Nand Falsh Read Operation

http://hi.baidu.com/serial_story/blog/item/f06db3546eced11a3b29356c.html

4. Memory Technology Device (MTD) Subsystem for Linux.

http://www.linux-mtd.infradead.org/index.html

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM