nand flash 相關系統知識

本文轉載自查看原文 2012-09-29 11:47 3614 PCB Layout

【Nand Flash的物理存儲單元的陣列組織結構】

Nand flash的內部組織結構，此處還是用圖來解釋，比較容易理解：

圖2.Nand Flash物理存儲單元的陣列組織結構

上圖是K9K8G08U0A的datasheet中的描述。

簡單解釋就是:

1.一個nand flash由很多個塊（Block）組成，

塊的大小一般是

-> 128KB，

-> 256KB，

-> 512KB

此處是128KB。

2.每個塊里面又包含了很多頁（page）。每個頁的大小，

老的nand flash，頁大小是256B，512B，

這類的nand flash被稱作small block，。地址周期只有4個。

對於現在常見的nand flash多數是2KB，

被稱作big block，對應的發讀寫命令地址，一共5個周期(cycle)，

更新的nand flash是4KB，

塊，也是Nand Flash的擦除操作的基本/最小單位。

3.每一個頁，對應還有一塊區域，叫做空閑區域（spare area）/冗余區域（redundant area），而Linux系統中，一般叫做OOB（Out Of Band），這個區域，是最初基於Nand Flash的硬件特性：數據在讀寫時候相對容易錯誤，所以為了保證數據的正確性，必須要有對應的檢測和糾錯機制，此機制被叫做EDC(Error Detection Code)/ECC（Error Code Correction,或者Error Checking and Correcting），所以設計了多余的區域，用於放置數據的校驗值。

頁, 是Nand Flash的寫入操作的基本/最小的單位。

【Nand Flash數據存儲單元的整體架構】

簡單說就是，常見的nand flash，內部只有一個chip，每個chip只有一個plane。

而有些復雜的，容量更大的nand flash，內部有多個chip，每個chip有多個plane。這類的nand flash，往往也有更加高級的功能，比如下面要介紹的Multi Plane Program和Interleave Page Program等。

比如，型號為K9K8G08U0A這個芯片（chip），

內部有:

K9F4G08U0A (256MB) : Plane (1Gb), Plane (1Gb)

K9WAG08U1A ，內部包含了2個K9K8G08U0A

K9NBG08U5A ，內部包含了4個K9K8G08U0A

【Flash名稱的由來】

Flash的擦除操作是以block塊為單位的，與此相對應的是其他很多存儲設備，是以bit位為最小讀取/寫入的單位，Flash是一次性地擦除整個塊：在發送一個擦除命令后，一次性地將一個block，常見的塊的大小是128KB/256KB。。，全部擦除為1，也就是里面的內容全部都是0xFF了，由於是一下子就擦除了，相對來說，擦除用的時間很短，可以用一閃而過來形容，所以，叫做Flash Memory。中文有的翻譯為（快速）閃存。

【Flash相對於普通設備的特殊性】

1. 上面提到過的，Flash最小操作單位，有些特殊。

一般設備，比如硬盤/內存，讀取和寫入都是以bit位為單位，讀取一個bit的值，將某個值寫入對應的地址的位，都是可以按位操作的。

但是Flash由於物理特性，使得內部存儲的數據，只能從1變成0，這點，可以從前面的內部實現機制了解到，只是方便統一充電，不方便單獨的存儲單元去放電，所以才說，只能從1變成0，也就是釋放電荷。

所以，總結一下Flash的特殊性如下：

普通設備(硬盤/內存等)

Flash

讀取/寫入的叫法

讀取/寫入

讀取/編程(Program)①

讀取/寫入的最小單位

Bit/位

Page/頁

擦除(Erase)操作的最小單位

Bit/位

Block/塊②

擦除操作的含義

將數據刪除/全部寫入0

將整個塊都擦除成全是1，也就是里面的數據都是0xFF③

對於寫操作

直接寫即可

在寫數據之前，要先擦除，然后再寫

表2.Flash和普通設備相比所具有的特殊性

注：

①之所以將寫操作叫做編程，是因為，flash和之前的EPROM，EEPROM繼承發展而來，而之前的EEPROM(Electrically Erasable Programmable Read-Only Memory)，往里面寫入數據，就叫做編程Program，之所以這么稱呼，是因為其對數據的寫入，是需要用電去擦除/寫入的，就叫做編程。

②對於目前常見的頁大小是2K/4K的Nand Flash，其塊的大小有128KB/256KB/512KB等。而對於Nor Flash，常見的塊大小有64K/32K等。

③在寫數據之前，要先擦除，內部就都變成0xFF了，然后才能寫入數據，也就是將對應位由1變成0。

【Nand Flash引腳(Pin)的說明】

圖3.Nand Flash引腳功能說明

上圖是常見的Nand Flash所擁有的引腳（Pin）所對應的功能，簡單翻譯如下：

1. I/O0 ~ I/O7：用於輸入地址/數據/命令，輸出數據

2. CLE：Command Latch Enable，命令鎖存使能，在輸入命令之前，要先在模式寄存器中，設置CLE使能

3. ALE：Address Latch Enable，地址鎖存使能，在輸入地址之前，要先在模式寄存器中，設置ALE使能

4. CE#：Chip Enable，芯片使能，在操作Nand Flash之前，要先選中此芯片，才能操作

5. RE#：Read Enable，讀使能，在讀取數據之前，要先使CE＃有效。

6. WE#：Write Enable，寫使能,在寫取數據之前，要先使WE＃有效。

7. WP#：Write Protect，寫保護

8. R/B#:Ready/Busy Output,就緒/忙,主要用於在發送完編程/擦除命令后,檢測這些操作是否完成,忙,表示編程/擦除操作仍在進行中,就緒表示操作完成.

9. Vcc：Power，電源

10. Vss：Ground，接地

11. N.C：Non-Connection,未定義，未連接。

[小常識]

在數據手冊中，你常會看到，對於一個引腳定義，有些字母上面帶一橫杠的，那是說明此引腳/信號是低電平有效，比如你上面看到的RE頭上有個橫線，就是說明，此RE是低電平有效，此外，為了書寫方便，在字母后面加“＃”，也是表示低電平有效，比如我上面寫的CE＃；如果字母頭上啥都沒有，就是默認的高電平有效，比如上面的CLE，就是高電平有效。

【為何需要ALE和CLE】

突然想明白了，Nand Flash中,為何設計這么多的命令,把整個系統搞這么復雜的原因了:

比如命令鎖存使能(Command Latch Enable,CLE)和地址鎖存使能(Address Latch Enable，ALE)，那是因為，Nand Flash就8個I/O，而且是復用的，也就是，可以傳數據，也可以傳地址，也可以傳命令，為了區分你當前傳入的到底是啥，所以，先要用發一個CLE（或ALE）命令，告訴nand Flash的控制器一聲，我下面要傳的是命令（或地址），這樣，里面才能根據傳入的內容，進行對應的動作。否則,nand flash內部,怎么知道你傳入的是數據,還是地址,還是命令啊,也就無法實現正確的操作了.

【Nand Flash只有8個I/O引腳的好處】

1. 減少外圍引腳：相對於並口(Parellel)的Nor Flash的48或52個引腳來說，的確是大大減小了引腳數目，這樣封裝后的芯片體積，就小很多。現在芯片在向體積更小，功能更強，功耗更低發展，減小芯片體積，就是很大的優勢。同時，減少芯片接口，也意味着使用此芯片的相關的外圍電路會更簡化，避免了繁瑣的硬件連線。

2. 提高系統的可擴展性，因為沒有像其他設備一樣用物理大小對應的完全數目的addr引腳，在芯片內部換了芯片的大小等的改動，對於用全部的地址addr的引腳，那么就會引起這些引腳數目的增加，比如容量擴大一倍，地址空間/尋址空間擴大一倍，所以，地址線數目/addr引腳數目，就要多加一個，而對於統一用8個I/O的引腳的Nand Flash，由於對外提供的都是統一的8個引腳，內部的芯片大小的變化或者其他的變化，對於外部使用者(比如編寫nand flash驅動的人)來說，不需要關心，只是保證新的芯片，還是遵循同樣的接口，同樣的時序，同樣的命令，就可以了。這樣就提高了系統的擴展性。

--------------------------------------------------------------------------

【Nand flash的一些典型(typical)特性】

1.頁擦除時間是200us，有些慢的有800us。

2.塊擦除時間是1.5ms.

3.頁數據讀取到數據寄存器的時間一般是20us。

4.串行訪問（Serial access）讀取一個數據的時間是25ns，而一些舊的nand flash是30ns，甚至是50ns。

5.輸入輸出端口是地址和數據以及命令一起multiplex復用的。

6.以前老的Nand Flash，編程/擦除時間比較短，比如K9G8G08U0M，才5K次，而后來很多6.nand flash的編程/擦除的壽命，最多允許的次數，以前的nand flash多數是10K次，也就是1萬次，而現在很多新的nand flash，技術提高了，比如，Micron的MT29F1GxxABB，Numonyx的NAND04G-B2D/NAND08G-BxC，都可以達到100K，也就是10萬次的編程/擦除。和之前常見的Nor Flash達到同樣的使用壽命了。

7.48引腳的TSOP1封裝或 52引腳的ULGA封裝

【Nand Flash中的特殊硬件結構】

由於nand flash相對其他常見設備來說，比較特殊，所以，特殊的設備，也有特殊的設計，所以，有些特殊的硬件特性，就有比較解釋一下：

1. 頁寄存器（Page Register）：由於Nand Flash讀取和編程操作來說，一般最小單位是頁，所以，nand flash在硬件設計時候，就考慮到這一特性，對於每一片，都有一個對應的區域，專門用於存放，將要寫入到物理存儲單元中去的或者剛從存儲單元中讀取出來的，一頁的數據，這個數據緩存區，本質上就是一個buffer，但是只是名字叫法不同，datasheet里面叫做Page Register，此處翻譯為頁寄存器，實際理解為頁緩存，更為恰當些。

注意：只有寫到了這個頁緩存中，只有等你發了對應的編程第二階段的確認命令0x10，實際的編程動作才開始，才開始把頁緩存中的數據，一點點寫到物理存儲單元中去。

所以，簡單總結一下就是，對於數據的流向，實際是經過了如下步驟：

圖4 Nand Flash讀寫時的數據流向

【Nand Flash中的壞塊(Bad Block)】

Nand Flash中，一個塊中含有1個或多個位是壞的，就成為其為壞塊。

壞塊的穩定性是無法保證的，也就是說，不能保證你寫入的數據是對的，或者寫入對了，讀出來也不一定對的。而正常的塊，肯定是寫入讀出都是正常的。

壞塊有兩種：

（1）一種是，也就是，你買到的新的，還沒用過的Nand Flash，就可以包含了壞塊。此類出廠時就有的壞塊，被稱作factory (masked)bad block或initial bad/invalid block，在出廠之前，就會做對應的標記，標為壞塊。

具體標記的地方是，對於現在常見的頁大小為2K的Nand Flash，是塊中第一個頁的oob起始位置的第1個字節（舊的小頁面，pagesize是512B甚至256B的nand flash，壞塊標記是第6個字節），。相對應的是，所有正常的塊，好的塊，里面所有數據都是0xFF的。

（2）第二類叫做在的，由於使用過程時間長了，在擦塊除的時候，出錯了，說明此塊壞了，也要在程序運行過程中，發現，並且標記成壞塊的。具體標記的位置，和上面一樣。這類塊叫做worn-out bad block。

---- 壞塊管理（BBM，Bad Block Managment）----

對於壞塊的管理，在Linux系統中，叫做壞塊管理（BBM，Bad Block Managment），對應的會有一個表去記錄好塊，壞塊的信息，以及壞塊是出廠就有的，還是后來使用產生的，這個表叫做 壞塊表（BBT，Bad Block Table）。在Linux內核MTD架構下的Nand Flash驅動，和Uboot中Nand Flash驅動中，在加載完驅動之后，如果你沒有加入參數主動要求跳過壞塊掃描的話，那么都會去主動，建立必要的BBT的，以備后面壞塊管理所使用。

而關於好塊和壞塊，Nand Flash在出廠的時候，會做出保證：

1.關於好的，可以使用的塊的數目達到一定的數目，比如三星的K9G8G08U0M，整個flash一共有4096個塊，出廠的時候，保證好的塊至少大於3996個，也就是意思是，你新買到這個型號的nand flash，最壞的可能，有3096－3996＝100個壞塊。不過，事實上，現在出廠時的壞塊，比較少，絕大多數，都是使用時間長了，在使用過程中出現的。

2.保證第一個塊是好的，並且一般相對來說比較耐用。做此保證的主要原因是，很多Nand Flash壞塊管理方法中，就是將第一個塊，用來存儲上面提到的BBT，否則，都是出錯幾率一樣的塊，那么也就不太好管理了，連放BBT的地方，都不好找了，^_^。

一般來說，不同型號的Nand Flash的數據手冊中，也會提到，自己的這個nand flash，最多允許多少個壞塊。就比如上面提到的，三星的K9G8G08U0M，最多有100個壞塊。

對於壞塊的標記，本質上，也只是對應的flash上的某些字節的數據是非0xFF而已，所以，只要是數據，就是可以讀取和寫入的。也就意味着，可以寫入其他值，也就把這個壞塊標記信息破壞了。對於出廠時的壞塊，一般是不建議將標記好的信息擦除掉的。

uboot中有個命令是“nand scrub”就可以將塊中所有的內容都擦除了，包括壞塊標記，不論是出廠時的，還是后來使用過程中出現而新標記的。一般來說，不建議用這個。不過，我倒是經常用，其實也沒啥大礙，呵呵。

最好用“nand erase”只擦除好的塊，對於已經標記壞塊的塊，不擦除。

【nand Flash中頁的訪問順序】

在一個塊內，對每一個頁進行編程的話，必須是順序的，而不能是隨機的。比如，一個塊中有128個頁，那么你只能先對page0編程，再對page1編程，。。。。，而不能隨機的，比如先對page3，再page1，page2.，page0，page4，.。。。

【片選無關(CE don’t-care)技術】（降低功耗的方式）

很多Nand flash支持一個叫做CE don’t-care的技術，字面意思就是，不關心是否片選，

那有人會問了，如果不片選，那還能對其操作嗎？

答案就是，這個技術，主要用在不需要選中芯片卻還可以繼續操作的這些情況：在某些應用，比如錄音，音頻播放等應用，中，外部使用的微秒（us）級的時鍾周期，此處假設是比較少的2us，在進行讀取一頁或者對頁編程時，是對Nand Flash操作，這樣的串行（Serial Access）訪問的周期都是20/30/50ns，都是納秒（ns）級的，此處假設是50ns，

當你已經發了對應的讀或寫的命令之后，接下來只是需要Nand Flash內部去自己操作，將數據讀取除了或寫入進去到內部的數據寄存器中而已，，CE#是低電平有效，取消片選就是拉高電平，這樣會在下一個外部命令發送過來之前，即微秒量級的時間里面，即2us－50ns≈2us，這段時間的取消片選，可以降低很少的系統功耗，但是多次的操作，就可以在很大程度上降低整體的功耗了。

總結起來簡單解釋就是：由於某些外部應用的頻率比較低，而Nand Flash內部操作速度比較快，所以具體讀寫操作的大部分時間里面，都是在等待外部命令的輸入，同時卻選中芯片，產生了多余的功耗，此“不關心片選”技術，就是在Nand Flash的內部的相對快速的操作（讀或寫）完成之后，就取消片選，以節省系統功耗。待下次外部命令/數據/地址輸入來的時候，再選中芯片，即可正常繼續操作了。這樣，整體上，就可以大大降低系統功耗了。

注:。如果數據沒有記錯的話，我之前遇到我們系統里面的nand flash的片選，呢，要知道，整個系統優化之后的待機功耗，也才10個mA左右的。

【帶EDC的拷回操作以及Sector的定義（Copy-Back Operation with EDC & Sector Definition for EDC）】

Copy-Back功能，簡單的說就是，將一個頁的數據，拷貝到另一個頁。

如果沒有Copy-Back功能，那么正常的做法就是，先要將那個頁的數據拷貝出來放到內存的數據buffer中，讀出來之后，再用寫命令將這頁的數據，寫到新的頁里面。

而Copy-Back功能的好處在於，不需要用到外部的存儲空間，不需要讀出來放到外部的buffer里面，而是可以直接讀取數據到內部的頁寄存器（page register）然后寫到新的頁里面去。而且，為了保證數據的正確，要硬件支持EDC（Error Detection Code）的，否則，在數據的拷貝過程中，可能會出現錯誤，並且拷貝次數多了，可能會累積更多錯誤。

而對於錯誤檢測來說，硬件一般支持的是512字節數據，對應有16字節用來存放校驗產生的ECC數值，而這512字節一般叫做一個扇區。對於2K＋64字節大小的頁來說，按照512字節分，分別叫做A，B，C，D區，而后面的64字節的oob區域，按照16字節一個區，分別叫做E，F，G，H區，對應存放A，B，C，D數據區的ECC的值。

總結：

512+16

2K +64 ： A B C D - E F G H區

Copy-Back編程的主要作用在於，去掉了數據串行讀取出來，再串行寫入進去的時間，所以，這部分操作，是比較耗時的，所以此技術可以提高編程效率，提高系統整體性能。

【多片同時編程(Simultaneously Program Multi Plane)】針對plane

對於有些新出的Nand Flash，支持同時對多個片進行編程，比如上面提到的三星的K9K8G08U0A，內部包含4片(Plane)，分別叫做Plane0，Plane1，Plane2，Plane3。.由於硬件上，對於每一個Plane，都有對應的大小是2048+64=2112字節的頁寄存器（Page Register），使得同時支持多個Plane編程成為可能。K9K8G08U0A支持同時對2個Plane進行編程。不過要注意的是，只能對Plane0和Plane1或者Plane2和Plane3，同時編程，而不支持Plane0和Plane2同時編程。

【交錯頁編程（Interleave Page Program）】針對chip

多片同時編程，是針對一個chip里面的多個Plane來說的，

而此處的交錯頁編程，是指對多個chip而言的。

可以先對一個chip，假設叫chip1，里面的一頁進行編程，然后此時，chip1內部就開始將數據一點點寫到頁里面，就出於忙的狀態了，而此時可以利用這個時間，對出於就緒狀態的chip2，也進行頁編程，發送對應的命令后，chip2內部也就開始慢慢的寫數據到存儲單元里面去了，也出於忙的狀態了。此時，再去檢查chip1，如果編程完成了，就可以開始下一頁的編程了，然后發完命令后，就讓其內部慢慢的編程吧，再去檢查chip2，如果也是編程完了，也就可以進行接下來的其他頁的編程了。如此，交互操作chip1和chip2，就可以有效地利用時間，使得整體編程效率提高近2倍，大大提高nand flash的編程/擦寫速度了。

【隨機輸出頁內數據（Random Data Output In a Page）】

在介紹此特性之前，先要說說，與Random Data Output In a Page相對應的是，普通的，正常的，sequential data output in a page。

正常情況下，我們讀取數據，都是先發讀命令，然后等待數據從存儲單元到內部的頁數據寄存器中后，我們通過不斷地將RE#(Read Enale，低電平有效)置低，然后從我們開始傳入的列的起始地址，一點點讀出我們要的數據，直到頁的末尾，當然有可能還沒到頁地址的末尾，就不再讀了。所謂的順序（sequential）讀取也就是，根據你之前發送的列地址的起始地址開始，每讀一個字節的數據出來，內部的數據指針就加1，移到下個字節的地址，然后你再讀下一個字節數據，就可以讀出來你要的數據了，直到讀取全部的數據出來為止。

而此處的隨機（random）讀取，就是在你正常的順序讀取的過程中，

先發一個隨機讀取的開始命令0x05命令，

再傳入你要將內部那個數據指針定位到具體什么地址，也就是2個cycle的列地址，

然后再發隨機讀取結束命令0xE0，

然后，內部那個數據地址指針，就會移動到你所制定的位置了，

你接下來再讀取的數據，就是從那個制定地址開始的數據了。

而nand flash數據手冊里面也說了，這樣的隨機讀取，你可以多次操作，沒限制的。

請注意，上面你所傳入的地址，都是列地址，也就是頁內地址，也就是說，對於頁大小為2K的nand flash來說，所傳入的地址，應該是小於2048+64＝2112的。

不過，實際在nand flash的使用中，好像這種用法很少的。絕大多數，都是順序讀取數據。

【頁編程（寫操作）】

Nand flash的寫操作叫做編程Program，編程，一般情況下，是以頁為單位的。

有的Nand Flash，比如K9K8G08U0A，支持部分頁編程，但是有一些限制：在同一個頁內的，連續的部分頁的編程，不能超過4次。一般情況下，很少使用到部分頁編程，都是以頁為單位進行編程操作的。

一個操作，用去實現，看起來是多余，效率不高，但是實際上，有其特殊考慮，

至少對於塊擦除來說，

開始的命令0x60是擦除設置命令(erase setup comman)，

然后傳入要擦除的塊地址，

然后再傳入擦除確認命令（erase confirm command）0xD0，

以開始擦除的操作。

這種，分兩步：開始設置，最后確認的命令方式，是為了避免由於外部由於無意的/未預料而產生的噪音，比如，此時，即使被nand flash誤認為是擦除操作，但是沒有之后的確認操作0xD0，nand flash就不會去擦除數據，這樣使得數據更安全，不會由於噪音而誤操作。

【讀（read）操作過程詳解】

以最簡單的read操作為例，解釋如何理解時序圖，以及將時序圖中的要求，轉化為代碼。

解釋時序圖之前，讓我們先要搞清楚，我們要做的事情：那就是，要從nand flash的某個頁里面，讀取我們要的數據。

要實現此功能，會涉及到幾部分的知識，至少很容易想到的就是：

1.需要用到哪些命令，

2.怎么發這些命令，

3.怎么計算所需要的地址，

4.怎么讀取我們要的數據等等。

下面，就一步步的解釋，需要做什么，以及如何去做：

1.需要使用何種命令

首先，是要了解，對於讀取數據，要用什么命令。

下面是datasheet中的命令集合：

圖5.Nand Flash K9K8G08U0A的命令集合

很容易看出，我們要讀取數據，要用到Read命令，該命令需要2個周期，。

2.發送命令前的准備工作以及時序圖各個信號的具體含義

知道了用何命令后，再去了解如何發送這些命令。

圖6.Nand Flash數據讀取操作的時序圖

注：此圖來自三星的型號K9K8G08U0A的nand flash的數據手冊(datasheet)。

我們來一起看看，我在圖6中的特意標注的①邊上的黃色豎線。

黃色豎線所處的時刻，是在發送讀操作的第一個周期的命令0x00之前的那一刻。

讓我們看看，在那一刻，其所穿過好幾行都對應什么值，以及進一步理解，為何要那個值。

（1）黃色豎線穿過的第一行，是CLE。還記得前面介紹命令所存使能（CLE）那個引腳吧？CLE，將CLE置1，就說明你將要通過I/O復用端口發送進入Nand Flash的，是命令，而不是地址或者其他類型的數據。只有這樣將CLE置1，使其有效，才能去通知了內部硬件邏輯，你接下來將收到的是命令，內部硬件邏輯，才會將受到的命令，放到命令寄存器中，才能實現后面正確的操作，否則，不去將CLE置1使其有效，硬件會無所適從，不知道你傳入的到底是數據還是命令了。

（2）而第二行，是CE#，那一刻的值是0。這個道理很簡單，你既然要向Nand Flash發命令，那么先要選中它，所以，要保證CE#為低電平，使其有效，也就是片選有效。

（3）第三行是WE#，意思是寫使能。因為接下來是往nand Flash里面寫命令，所以，要使得WE#有效，所以設為低電平。

（4）第四行，是ALE是低電平，而ALE是高電平有效，此時意思就是使其無效。而對應地，前面介紹的，使CLE有效，因為將要數據的是命令，而不是地址。如果在其他某些場合，比如接下來的要輸入地址的時候，就要使其有效，而使CLE無效了。

（5）第五行，RE#，此時是高電平，無效。可以看到，知道后面低6階段，才變成低電平，才有效，因為那時候，要發生讀取命令，去讀取數據。

（6）第六行，就是我們重點要介紹的，復用的輸入輸出I/O端口了，此刻，還沒有輸入數據，接下來，在不同的階段，會輸入或輸出不同的數據/地址。

（7）第七行，R/B#,高電平，表示R（Ready）/就緒，因為到了后面的第5階段，硬件內部，在第四階段，接受了外界的讀取命令后，把該頁的數據一點點送到頁寄存器中，這段時間，屬於系統在忙着干活，屬於忙的階段，所以，R/B#才變成低，表示Busy忙的狀態的。

介紹了時刻①的各個信號的值，以及為何是這個值之后，相信，后面的各個時刻，對應的不同信號的各個值，大家就會自己慢慢分析了，也就容易理解具體的操作順序和原理了。

3.如何計算出，我們要傳入的地址

在介紹具體讀取數據的詳細流程之前，還要做一件事，那就是，先要搞懂我們要訪問的地址，以及這些地址，如何分解后，一點點傳入進去，使得硬件能識別才行。

此處還是以K9K8G08U0A為例，此nand flash，一共有8192個塊，每個塊內有64頁，每個頁是2K+64 Bytes，假設，我們要訪問其中的，此時，我們就要先把具體的地址算出來：

物理地址=塊大小×塊號+頁大小×頁號+頁內地址=7000×128K+64×2K+1208=0x36B204B8,

接下來，我們就看看，怎么才能把這個實際的物理地址，轉化為nand Flash所要求的格式。

在解釋地址組成之前，先要來看看其datasheet中關於地址周期的介紹：

圖7 Nand Flash的地址周期組成

結合圖7和圖5中的2，3階段，我們可以看出，此nand flash地址周期共有5個，2個列(Column)周期，3個行（Row）周期。

而對於對應地，我們可以看出，實際上，

列地址A0~A10，就是頁內地址，地址范圍是從0到2047，而對出的A11，理論上可以表示2048～4095，但是實際上，我們最多也只用到了2048～2112，用於表示頁內的oob區域，其大小是64字節。

A12～A30，稱作頁號，頁的號碼，可以定位到具體是哪一個頁。

而其中，A18～A30，表示對應的塊號，即屬於哪個塊。

// 可見：地址的傳輸順序是是頁內地址，頁號，塊號。從小到大。

簡單解釋完了地址組成，那么就很容易分析上面例子中的地址了：

0x36B204B8 = 00110110 10110010 000001001011 1000，分別分配到5個地址周期就是：

1st 周期，A7～A0 ：1011 1000= 0x B8

2nd周期，A11～A8 ：00000100 = 0x04

3rd周期，A19～A12 ：0010 0000= 0x20

4th周期，A27～A20 ：0110 1011 = 0x6B

5th周期，A30～A28 ：00000011 = 0x03

注意，與圖7中對應的，*L，意思是低電平，由於未用到那些位，datasheet中強制要求設為0，所以，才有上面的2nd周期中的高4位是0000.其他的A30之后的位也是類似原理，都是0。

因此，接下來要介紹的，我們要訪問第7000個塊中的第25頁中的1208字節處的話，所要傳入的地址就是分5個周期，分別傳入兩個列地址的：0xB8，0x04，然后再傳3個行地址的：0x20，0x6B，0x03，這樣硬件才能識別。

4.讀操作過程的解釋

准備工作終於完了，下面就可以開始解釋說明，對於讀操作的，上面圖中標出來的，1-6個階段，具體是什么含義。

（1）操作准備階段：此處是讀（Read）操作，所以，先發一個圖5中讀命令的第一個階段的0x00,表示，讓硬件先准備一下，接下來的操作是讀。

（2）發送兩個周期的列地址。也就是頁內地址，表示，我要從一個頁的什么位置開始讀取數據。

（3）接下來再傳入三個行地址。對應的也就是頁號。

（4）然后再發一個讀操作的第二個周期的命令0x30。接下來，就是硬件內部自己的事情了。

（5） Nand Flash內部硬件邏輯，負責去按照你的要求，根據傳入的地址，找到哪個塊中的哪個頁，然后把整個這一頁的數據，都一點點搬運到頁緩存中去。而在此期間，你所能做的事，也就只需要去讀取狀態寄存器，看看對應的位的值，也就是R/B#那一位，是1還是0，0的話，就表示，系統是busy，仍在”忙“（着讀取數據），如果是1，就說系統活干完了，忙清了，已經把整個頁的數據都搬運到頁緩存里去了，你可以接下來讀取你要的數據了。

對於這里。估計有人會問了，這一個頁一共2048+64字節，如果我傳入的頁內地址，就像上面給的1028一類的值，只是想讀取1028到2011這部分數據，而不是頁開始的0地址整個頁的數據，那么內部硬件卻讀取整個頁的數據出來，豈不是很浪費嗎？答案是，的確很浪費，效率看起來不高，但是實際就是這么做的，而且本身讀取整個頁的數據，相對時間並不長，而且讀出來之后，內部數據指針會定位到你剛才所制定的1208的那個位置。

（6）接下來，就是你“竊取“系統忙了半天之后的勞動成果的時候了，呵呵。通過先去Nand Flash的控制器中的數據寄存器中寫入你要讀取多少個字節(byte)/字(word)，然后就可以去Nand Flash的控制器的FIFO中，一點點讀取你要的數據了。

至此，整個Nand Flash的讀操作就完成了。

對於其他操作，可以根據我上面的分析，一點點自己去看datasheet，根據里面的時序圖去分析具體的操作過程，然后對照代碼，會更加清楚具體是如何實現的。

【Flash的類型】

Flash的類型主要分兩種，nand flash和nor flash。

除了網上最流行的這個解釋之外：

NAND和NOR的比較

再多說幾句：

1.nor的成本相對高，具體讀寫數據時候，不容易出錯。總體上，比較適合應用於存儲少量的代碼。

2.Nand flash相對成本低。使用中數據讀寫容易出錯，所以一般都需要有對應的軟件或者硬件的數據校驗算法，統稱為ECC。由於相對來說，容量大，價格便宜，因此適合用來存儲大量的數據。其在嵌入式系統中的作用，相當於PC上的硬盤，用於存儲大量數據。

所以，一個常見的應用組合就是，用小容量的Nor Flash存儲啟動代碼，比如uboot，系統啟動后,初始化對應的硬件，包括SDRAM等，然后將Nand Flash上的Linux 內核讀取到內存中，做好該做的事情后，就跳轉到SDRAM中去執行內核了，然后內核解壓（如果是壓縮內核的話，否則就直接運行了）后，開始運行，在Linux內核啟動最后，去Nand Flash上，掛載根文件，比如jffs2，yaffs2等，掛載完成，運行初始化腳本，啟動consle交互，才運行你通過console和內核交互。至此完成整個系統啟動過程。

而Nor Flash存放的是Uboot，Nand Flash存放的是Linux的內核鏡像和根文件系統，以及余下的空間分成一個數據區。

Nor flash，有類似於dram之類的地址總線，因此可以直接和CPU相連，CPU可以直接通過地址總線對nor flash進行訪問，而nand flash沒有這類的總線，只有IO接口，只能通過IO接口發送命令和地址，對nand flash內部數據進行訪問。相比之下，nor flash就像是並行訪問，nand flash就是串行訪問，所以相對來說，前者的速度更快些。

但是由於物理制程/制造方面的原因，導致nor 和nand在一些具體操作方面的特性不同：

表3 Nand Flash 和 Nor Flash的區別

1. 理論上是可以的，而且也是有人驗證過可以的，只不過由於nand flash的物理特性，不能完全保證所讀取的數據/代碼是正確的，實際上，很少這么用而已。因為，如果真是要用到nand flash做XIP，那么除了讀出速度慢之外，還要保證有數據的校驗，以保證讀出來的，將要執行的代碼/數據，是正確的。否則，系統很容易就跑飛了。。。

2. 芯片內執行(XIP, eXecute In Place):

http://hi.baidu.com/serial_story/blog/item/adb20a2a3f8ffe3c5243c1df.html

【Nand Flash的種類】

具體再分，又可以分為

1)Bare NAND chips：裸片，單獨的nand 芯片

2)SmartMediaCards： =裸片+一層薄塑料，常用於數碼相機和MP3播放器中。之所以稱smart，是由於其軟件smart，而不是硬件本身有啥smart之處。^_^

3)DiskOnChip：裸片+glue logic，，那塊地址中包含了引導代碼的stub樁，其可以從nand flash中拷貝真正的引導代碼。

【spare area/oob】

Nand由於最初硬件設計時候考慮到，額外的錯誤校驗等需要空間，專門對應每個頁，額外設計了叫做spare area空區域，在其他地方，比如jffs2文件系統中，也叫做oob（out of band）數據。

其具體用途，總結起來有：

1. 標記是否是壞快

2. 存儲ECC數據

3. 存儲一些和文件系統相關的數據，如jffs2就會用到這些空間存儲一些特定信息，yaffs2文件系統，會在oob中，存放很多和自己文件系統相關的信息。

----------------------------------------------------------------------------

看到這里，我已內牛滿面，東北的哥們真夠給力，此文之詳細、用心可見一斑。 【內存技術設備，MTD（Memory Technology Device）】

MTD，是Linux的存儲設備中的一個子系統。其設計此系統的目的是，對於內存類的設備，提供一個抽象層，一個接口，使得對於硬件驅動設計者來說，可以盡量少的去關心存儲格式，比如FTL，FFS2等，而只需要去提供最簡單的底層硬件設備的讀/寫/擦除函數就可以了。而對於數據對於上層使用者來說是如何表示的，硬件驅動設計者可以不關心，而MTD存儲設備子系統都幫你做好了。

對於MTD字系統的好處，簡單解釋就是，他幫助你實現了，很多對於以前或者其他系統來說，本來也是你驅動設計者要去實現的很多功能。換句話說，有了MTD，使得你設計Nand Flash的驅動，所要做的事情，要少很多很多，因為大部分工作，都由MTD幫你做好了。

當然，這個好處的一個“副作用”就是，使得我們不了解的人去理解整個Linux驅動架構，以及MTD，變得更加復雜。但是，總的說，覺得是利遠遠大於弊，否則，就不僅需要你理解，而且還是做更多的工作，實現更多的功能了。

此外，還有一個重要的原因，那就是，前面提到的nand flash和普通硬盤等設備的特殊性：

有限的通過出復用來實現輸入輸出命令和地址/數據等的IO接口，最小單位是頁而不是常見的bit，寫前需擦除等，導致了這類設備，不能像平常對待硬盤等操作一樣去操作，只能采取一些特殊方法，這就誕生了MTD設備的統一抽象層。

MTD，將nand flash，nor flash和其他類型的flash等設備，統一抽象成MTD設備來管理，根據這些設備的特點，上層實現了常見的操作函數封裝，底層具體的內部實現，就需要驅動設計者自己來實現了。具體的內部硬件設備的讀/寫/擦除函數，那就是你必須實現的了。

表4.MTD設備和硬盤設備之間的區別

========== 多說一句，關於MTD更多的內容，感興趣的，去附錄中的MTD的主頁去看。

關於mtd設備驅動，感興趣的可以去參考

MTD原始設備與FLASH硬件驅動的對話

MTD原始設備與FLASH硬件驅動的對話-續

那里，算是比較詳細地介紹了整個流程，方便大家理解整個mtd框架和nand flash驅動。

【Nand flash驅動工作原理】

在介紹具體如何寫Nand Flash驅動之前，我們先要了解，大概的，整個系統，和Nand Flash相關的部分的驅動工作流程，這樣，對於后面的驅動實現，才能更加清楚機制，才更容易實現，否則就是，即使寫完了代碼，也還是沒搞懂系統是如何工作的了。

讓我們以最常見的，Linux內核中已經有的三星的Nand Flash驅動，來解釋Nand Flash驅動具體流程和原理。

此處是參考2.6.29版本的Linux源碼中的\drivers\mtd\nand\s3c2410.c，以2410為例。

1. 在nand flash驅動加載后，第一步，調用對應的init函數 ---- s3c2410_nand_init: 去將nand flash驅動注冊到Linux驅動框架中。

2. 驅動本身真正的開始，是從probe函數： s3c2410_nand_probe->s3c24xx_nand_probe, 在probe過程中： clk_enable //打開nand flash控制器的clock時鍾， request_mem_region //去申請驅動所需要的一些內存等相關資源。 s3c2410_nand_inithw //去初始化硬件相關的部分，主要是關於時鍾頻率的計算，以及啟用nand flash控制器，使得硬件初始化好了，后面才能正常工作。

3. 需要多解釋一下的，是這部分代碼：

for (setno = 0; setno < nr_sets; setno++, nmtd++) { pr_debug("initialising set %d (%p, info %p)\n", setno, nmtd, info);

/*調用init chip去掛載你的nand驅動的底層函數到"nand flash的結構體"中，以及設置對應的"ecc mode"，掛載ecc相關的函數 */

s3c2410_nand_init_chip(info, nmtd, sets);

/* scan_ident，掃描nand 設備，設置nand flash的默認函數，獲得物理設備的具體型號以及對應各個特性參數，這部分算出來的一些值，對於nand flash來說，是最主要的參數，比如nand flash的芯片的。 */ nmtd->scan_res = nand_scan_ident(&nmtd->mtd, (sets) ? sets->nr_chips : 1);

if (nmtd->scan_res == 0) { s3c2410_nand_update_chip(info, nmtd);

/*掃描的后一階段，經過前面的scan_ident，我們已經獲得對應nand flash的硬件的各個參數， *然后就可以在scan tail中，根據這些參數，去設置其他一些重要參數，尤其是ecc的layout，即ecc是如何在oob中擺放的， *最后，再去進行一些初始化操作，主要是根據你的驅動，如果沒有實現一些函數的話，那么就用系統默認的。 */ nand_scan_tail(&nmtd->mtd);

/*add partion，根據你的nand flash的分區設置，去分區 */ s3c2410_nand_add_partition(info, nmtd, sets); } if (sets != NULL) sets++; }

4. 等所有的參數都計算好了，函數都掛載完畢，系統就可以正常工作了。

上層訪問你的nand falsh中的數據的時候，通過MTD層，一層層調用，最后調用到你所實現的那些底層訪問硬件數據/緩存的函數中。

【Linux下nand flash驅動編寫步驟簡介】

關於上面提到的，在nand_scan_tail的時候，系統會根據你的驅動，如果沒有實現一些函數的話，那么就用系統默認的。如果實現了自己的函數，就用你的。 "那么到底我要實現哪些函數呢，而又有哪些是可以不實現，用系統默認的就可以了呢。" 此問題的，就是我們下面要介紹的，也就是，你要實現的，你的驅動最少要做哪些工作，才能使整個nand flash工作起來。

1. 對於驅動框架部分

其實，要了解，關於驅動框架部分，你所要做的事情的話，只要看看三星的整個nand flash驅動中的這個結構體，就差不多了：

static struct platform_driver s3c2410_nand_driver = { .probe = s3c2410_nand_probe, .remove = s3c2410_nand_remove, .suspend = s3c24xx_nand_suspend, .resume = s3c24xx_nand_resume, .driver = { .name = "s3c2410-nand", .owner = THIS_MODULE, }, };

對於上面這個結構體，沒多少要解釋的。從名字，就能看出來：（1）probe就是系統“探測”，就是前面解釋的整個過程，這個過程中的多數步驟，都是和你自己的nand flash相關的，尤其是那些硬件初始化部分，是你必須要自己實現的。（2）remove，就是和probe對應的，“反初始化”相關的動作。主要是釋放系統相關資源和關閉硬件的時鍾等常見操作了。（3）suspend和resume，對於很多沒用到電源管理的情況下，至少對於我們剛開始寫基本的驅動的時候，可以不用關心，放個空函數即可。

2. 對於nand flash底層操作實現部分

而對於底層硬件操作的有些函數，總體上說，都可以在上面提到的s3c2410_nand_init_chip中找到：

static void s3c2410_nand_init_chip(struct s3c2410_nand_info *info, struct s3c2410_nand_mtd *nmtd, //主要是完善該結構體struct s3c2410_nand_mtd struct s3c2410_nand_set *set) {

struct nand_chip *chip = &nmtd->chip; void __iomem *regs = info->regs;

chip->write_buf = s3c2410_nand_write_buf; chip->read_buf = s3c2410_nand_read_buf; chip->select_chip = s3c2410_nand_select_chip; chip->chip_delay = 50; chip->priv = nmtd; chip->options = 0; chip->controller = &info->controller;

switch (info->cpu_type) { case TYPE_S3C2410:

/* nand flash控制器中，一般都有對應的數據寄存器，用於給你往里面寫數據，表示將要讀取或寫入多少個字節(byte,u8)/字(word,u32) ，所以，此處，你要給出地址，以便后面的操作所使用 */

chip->IO_ADDR_W = regs + S3C2410_NFDATA; info->sel_reg = regs + S3C2410_NFCONF; info->sel_bit = S3C2410_NFCONF_nFCE; chip->cmd_ctrl = s3c2410_nand_hwcontrol; chip->dev_ready = s3c2410_nand_devready;

break;

。。。。。。

}

chip->IO_ADDR_R = chip->IO_ADDR_W;

nmtd->info = info; nmtd->mtd.priv = chip; nmtd->mtd.owner = THIS_MODULE; nmtd->set = set;

if (hardware_ecc) { chip->ecc.calculate = s3c2410_nand_calculate_ecc; chip->ecc.correct = s3c2410_nand_correct_data;

/* 此處，多數情況下，你所用的Nand Flash的控制器，都是支持硬件ECC的，所以，此處設置硬件ECC(HW_ECC) ，也是充分利用硬件的特性， * 而如果此處不用硬件去做ECC話，那么下面也會去設置成NAND_ECC_SOFT，系統會用默認的軟件去做ECC校驗，相比之下，比硬件ECC的效率就低很多，而你的nand flash的讀寫，也會相應地要慢不少 */

chip->ecc.mode = NAND_ECC_HW; //設置成了硬件方式校驗ecc

switch (info->cpu_type) {

case TYPE_S3C2410:

chip->ecc.hwctl = s3c2410_nand_enable_hwecc; chip->ecc.calculate = s3c2410_nand_calculate_ecc;

break; 。。。。。 }

} else { chip->ecc.mode = NAND_ECC_SOFT; //也就是說，怎么搞也得校驗了 }

if (set->ecc_layout != NULL) chip->ecc.layout = set->ecc_layout;

if (set->disable_ecc) chip->ecc.mode = NAND_ECC_NONE; }

而我們要實現的底層函數，也就是上面藍色標出來的一些函數而已：

（1）s3c2410_nand_write_buf和 s3c2410_nand_read_buf：這是，其功能，就是往你的nand flash的控制器中的FIFO讀寫數據。一般情況下，是MTD上層的操作，比如要讀取一頁的數據，那么在發送完相關的讀命令和等待時間之后，就會調用到你底層的read_buf，去nand Flash的FIFO中，一點點把我們要的數據，讀取出來，放到我們制定的內存的緩存中去。寫操作也是類似，將我們內存中的數據，寫到Nand Flash的FIFO中去。（2）s3c2410_nand_select_chip ：實現Nand Flash的。（3）s3c2410_nand_hwcontrol：給底層，或者設置具體操作的模式，都是通過此函數。（4）s3c2410_nand_devready： Nand Flash的一些操作，比如讀一頁數據，寫入（編程）一頁數據，擦除一個塊，都是需要一定時間的，在命令發送完成后，就是硬件開始忙着工作的時候了，而硬件什么時候完成這些操作，什么時候不忙了，變就緒了，就是通過這個函數去的。一般具體實現都是去讀硬件的一個狀態寄存器，其中某一位是否是1，對應着是出於“就緒/不忙”還是“忙”的狀態。這個寄存器，也就是我們前面分析時序圖中的R/B#。（5）s3c2410_nand_calculate_ecc：如果是上面提到的硬件ECC的話，就不用我們用了，而是直接去讀取硬件產生的ECC數值就可以了。（6）s3c2410_nand_correct_data：當實際操作過程中，讀取出來的數據所對應的硬件或軟件計算出來的ECC，和從oob中讀出來的ECC不一樣的時候，就是說明數據有誤了，就需要調用此函數去糾正錯誤。對於現在SLC常見的ECC算法來說，可以。如果錯誤大於1位，那么就無法糾正回來了。一般情況下，出錯超過1位的，好像幾率不大。至少我看到的不是很大。更復雜的情況和更加注重數據安全的情況下，一般是需要另外實現更高效和檢錯和糾錯能力更強的ECC算法的。（7）s3c2410_nand_enable_hwecc：在硬件支持的前提下，前面設置了硬件ECC的話，要實現這個函數，用於每次在讀寫操作前，，這樣在讀寫操作完成后，就可以去讀取硬件校驗產生出來的ECC數值了。

當然，除了這些你必須實現的函數之外，在你更加熟悉整個框架之后，你可以根據你自己的nand flash的特點，去實現其他一些原先用系統默認但是效率不高的函數，而用自己的更高效率的函數替代他們，以提升你的nand flash的整體性能和效率。

【引用文章】

1.Brief Intro of Nand Flash

http://hi.baidu.com/serial_story/blog/item/3f1635d1dc041cd7562c84a1.html

2. Samsung的型號為K9G8G08U0M的Nand Flash的數據手冊

要下載數據手冊，可以去這里介紹的網站下載：

samsung 4K pagesize SLC Nand Flash K9F8G08U0M datasheet + 推薦一個datasheet搜索的網站

http://hi.baidu.com/serial_story/blog/item/7f25a03def1de309bba167c8.html

3.Nand Falsh Read Operation

http://hi.baidu.com/serial_story/blog/item/f06db3546eced11a3b29356c.html

4. Memory Technology Device (MTD) Subsystem for Linux.

http://www.linux-mtd.infradead.org/index.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 OK6410 tftp下載內核、文件系統以及nand flash地址相關整理、總結 Nand Flash 說說NAND FLASH以及相關ECC校驗方法 kernel下nand flash的文件系統總結 EMMC與nand flash的區別 Nor/Nand FLASH的讀寫 NAND FLASH學習筆記之nand flash基礎（一）【轉】 Nand flash基本原理 NAND Flash基本原理 EMMC與nand flash的區別【轉】