----------------------------------------------------------------------文章1----------------------------------------------------------------------
Flash簡介:
Flash全名叫做Flash Memory,屬於非易失性存儲設備(Non-volatile Memory Device),與此相對應的是易失性存儲設備(Volatile Memory Device)。這類設備,除了Flash,還有其他比較常見的如硬盤,ROM等。
與此相對的,易失性就是斷電了,數據就丟失了,比如大家常用的內存,不論是以前的SDRAM,DDR SDRAM,還是現在的DDR2,DDR3等,都是斷電后,數據就沒了。
Flash的內部存儲是MOSFET,里面有個懸浮門(Floating Gate),是真正存儲數據的單元。
Nandflash存儲器是flash存儲器的一種,其內部采用非線性宏單元模式,為固態大容量內存的實現提供了廉價有效的解決方案。
Nandflash存儲器具有容量較大,改寫速度快等優點,適用於大量數據的存儲,因而在業界得到了越來越廣泛的應用,如嵌入式產品中包括數碼相機、MP3隨身聽記憶卡、體積小巧的U盤、固態硬盤等。
Nandflash根據存儲原理分為三種,SLC(Single Level Cell)、MLC( Multi-Level Cell)、TLC(Tripple Level Cell):
SLC :1個存儲器儲存單元可存放1 bit的數據,只存在0和1兩個充電值
MLC:1個存儲器儲存單元可存放2 bit的數據,存在00 01 10 11表示的4個值
TLC:1個存儲器儲存單元可存放3 bit的數據,存在000 001 010 011 100 101 110 111表示的8個值
最早出現的是SLC,一個浮柵MOS管(cell)只存儲1bit數據,這種可靠性好,壽命長。
因為半導體芯片量產成本基本上與所占硅片面積成正比,為了追求存儲密度,降低閃存成本,有人想到了在一個cell里存儲2bit數據,也就是通過在浮柵里灌不同數量的電荷來區分4個狀態。相同的半導體制程、相同的硅片面積,存儲數據多了一倍。帶來的缺憾就是差錯率提高、讀寫壽命縮短。
再后來繼續追求低成本,有人造出了TLC,在一個cell里存3bit,也就是將電荷量分成8個級別,這樣容量提升到3倍。結果是可靠性和壽命急劇下降。當然,普通民用,通過糾錯算法和各種減小磨損的算法,可以將就着用。現在大多數閃存都用了TLC。
再后來,還有人造QLC,在一個cell里存16個狀態,對應4bit。結果是壽命更短,可靠性更差。大概擦寫壽命幾百次吧。
Nandflash工作原理:
根據NAND的物理結構,NAND是通過絕緣層存儲數據的。當你要寫入數據,需要施加電壓並形成一個電場,這樣電子就可以通過絕緣體進入到存儲單元,此時完成寫入數據。如果要刪除存儲單元(數據),則要再次施加電壓讓電子穿過絕緣層,從而離開存儲單元。所以,NAND閃存在重新寫入新數據之前必須要刪除原來數據。
由於TLC的1個存儲器儲存單元可存放3 bit的數據,為了區分,必須使用不同電壓來實現。除了能夠實現和SLC一樣的000(TLC)=0(SLC)和111(TLC)=1(SLC)外、還有另外六種數據格式必須采用其他不同的電壓來區分,讓不同數量的電子進入到存儲單元,實現不同的數據表達。這樣,才能讓TLC實現單位存儲單元存放比SLC、MLC更多數據的目的。
為什么TLC的性能在三種介質中最差?
由於數據寫入到TLC中需要八種不同電壓狀態, 而施加不同的電壓狀態、尤其是相對較高的電壓,需要更長的時間才能得以實現(電壓不斷增高的過程,直到合適的電壓值被發現才算完成)。
所以,在TLC中數據所需訪問時間更長,因此傳輸速度更慢。經過實測,同等技術條件下,TLC的SSD性能是比不上MLC SSD的。
為什么沒有機械結構的SSD還是出現壽命問題?
因為按照工作原理,閃存單元每次寫入或擦除的施加電壓過程都會導致絕緣體硅氧化物的物理損耗。這東西本來就只有區區10納米的厚度,每進行一次電子穿越就會變薄一些。也正因為如此,硅氧化物越來越薄,電子可能會滯留在二氧化硅絕緣層,擦寫時間也會因此延長,因為在達到何時的電壓之前需要更長時間、更高的加壓。主控制器是無法改變編程和擦寫電壓的。如果原本設計的電壓值工作異常,主控就會嘗試不同的電壓,這自然需要時間,也會給硅氧化物帶來更多壓力,加速了損耗。
最后,主控控制編程和擦寫一個TLC閃存單元所需要的時間也越來越長,最終達到嚴重影響性能、無法接受的地步,閃存區塊也就廢了。
同時,傳統的2D閃存在達到一定密度之后每個電源存儲的電荷量會下降,損耗后的TLC絕緣層,相鄰的存儲單元也會產生電荷干擾,發展到20nm工藝之后,Cell單元之間的干擾現象更加嚴重,如果數據長時間不刷新的話就會出現像之前三星840 Evo那樣的讀取舊文件會掉速的現象。
人們為什么會擔心壽命?
由於TLC采用不同的電壓狀態,加上存儲容量多,擊穿絕緣層次數也比其他介質多,於是加速了絕緣層的損耗過程。所以,TLC SSD的壽命比SLC、MLC短得多。
一開始TLC的P/E壽命只有不到1000次,但是經過廠商改進算法以及優化主控,提升到1000到2000次。相比之下,MLC有3000到10000次擦寫壽命。如果用戶的PC只有TLC SSD,那么在日常使用環境下,如果一個120GB SSD的P/E壽命只有不到1000次,並且每天寫入60GB的數據,那么不到五年,SSD就會報廢。在目前性能過剩時代,這壽命是十分嚇人的,所以以前人們十分擔心TLC SSD的壽命問題。
TLC SSD為何“倒行逆施”般井噴?
三星 850 EVO、東芝 Q300、英睿達BX200……我們耳熟能詳的SSD廠商都在2015年大規模推出了TLC SSD,氣勢磅礴。既然我們之前說了TLC那么多的不足,為何廠商依然推廣呢?不是搬石頭砸自己腳嗎?
這一年來,SSD廠商最大的功勞就是解決了TLC的P/E壽命問題,讓TLC SSD的壽命上升到我們使用一台電腦正常周期上。主控算法的好壞會對性能和壽命造成非常大的影響,目前SSD廠商在主控技術上進行了很大的改進,信號處理,更強的ECC算法、擴大備用區域的容量增加預留空間等技術應用,從TLC的500--1000次P/E提升到目前的1000到2000次,一定程度上保證了可靠性與壽命。我們知道TLC的性能比較差,尤其寫入性能上,SSD廠商就通過SLC Cache的運用,只要制造一個大容量的緩沖區用戶很多時候就不會感覺得到寫入速度慢,而且SLC Cache玩得好還有延長壽命的作用。另外,SSD廠商對於TLC SSD的質保提升到與MLC SSD基本一致的水平,比如三星 TLC SSD的質保一般為五年,讓消費者在這五年的使用中高枕無憂。加上TLC天生的價格優勢,以及金字招牌,的確有很大的吸引力。越來越多的廠商參與到TLC SSD的競爭中,價格不斷走低,讓不少對SSD感興趣的朋友嘗鮮一把,助長了TLC SSD的壯大。
TLC的未來?
TLC的逆襲就是揚長避短的道理。有市場,就有進步,相信廠商會對TLC技術進行更多的研究,保證物美價廉的TLC繼續生存下去。
比如三星3D NAND閃存就是TLC的一個重要方向。3D NAND是不再追求縮小Cell單元,而是通過3D堆疊技術封裝更多Cell單元,所以我們不必要追求更先進的制程,畢竟制程約先進,壽命反而越差。所以,可以使用相對更舊的工藝來生產3D NAND閃存,使用舊工藝的好處就是P/E擦寫次數大幅提升,而且電荷干擾的情況也因為使用舊工藝而大幅減少。
未來的3D NAND可能都會做成可以MLC與TLC工作模式相互切換,也就是用TLC屏蔽一半容量、來充當MLC,也就是各種所謂的3bit MLC技術創新。類似地,東芝的Q300和OCZ TRION 100用的還是更長壽穩定的企業級eTLC聽起來SLC、MLC、TLC不再是涇渭分明。
文章轉載自:https://blog.csdn.net/fc34235/article/details/79584758
----------------------------------------------------------------------文章2----------------------------------------------------------------------
Nandflash結構:
從上面的圖中可以看到:一塊NandFlash可以划分為2048個塊,一個塊分為64個頁,一頁分為2k+64字節的兩個區,2k存放有效數據,64字節保存校驗信息等。
這種划分的形式在任何NandFlash中都是一樣的。只是說塊數、頁數、每頁大小可能不一樣。
Row Address - 行地址可以簡單的認為是頁號。
Column Address - 列地址相當於在一個頁內的偏移地址。
有了頁號和偏移地址便能正確的訪問到每個存儲單元。
塊是Nandflash擦除操作的基本/最小單位。
頁是Nandflash寫入操作的基本/最小單位。每一個頁,對應還有一塊區域,叫做空閑區域(spare area)/冗余區域(redundant area),而Linux系統中,一般叫做OOB(Out Of Band),這個區域,是最初基於Nand Flash的硬件特性:數據在讀寫時候相對容易
錯誤,所以為了保證數據的正確性,必須要有對應的檢測和糾錯機制,此機制被叫做EDC(Error Detection Code)/ECC(Error Code Correction,或者Error Checking and Correcting),所以設計了多余的區域,用於放置數據的校驗值。
Flash名稱的由來
Flash的擦除操作是以block塊為單位的,與此相對應的是其他很多存儲設備,是以bit位為最小讀取/寫入的單位,Flash是一次性地擦除整個塊,在發送一個擦除命令后,一次性地將一個block,常見的塊的大小是128KB/256KB等,全部擦除為1,也就是里面的內容
全部都是0xFF了,由於是一下子就擦除了,相對來說,擦除用的時間很短,可以用一閃而過來形容,所以叫做Flash Memory,中文有的翻譯為(快速)閃存。
Flash相對於普通設備的特殊性
|
普通設備(硬盤/內存等) |
Flash |
讀取/寫入的叫法 |
讀取/寫入 |
讀取/編程(Program)① |
讀取/寫入的最小單位 |
Bit/位 |
Page/頁 |
擦除(Erase)操作的最小單位 |
Bit/位 |
Block/塊② |
擦除操作的含義 |
將數據刪除/全部寫入0 |
將整個塊都擦除成全是1,也就是里面的數據都是0xFF③ |
對於寫操作 |
直接寫即可 |
在寫數據之前,要先擦除,然后再寫 |
Nandflash引腳功能說明
I/O0 ~ I/O7:用於輸入地址/數據/命令,輸出數據
CE:芯片選擇
RE:讀允許
WE:寫允許
WP:在寫或擦除期間,提供寫保護
R/B:讀/忙
ALE:地址鎖存 ALE = 1,data0-data7上傳輸的是地址
CLE:命令鎖存 CLE = 1,data0-data7上傳輸的是命令
ALE、CLE都是0的時候data0-data7上傳輸的是數據
WP:Write Protect,寫保護
在數據手冊中,你常會看到,對於一個引腳定義,有些字母上面帶一橫杠的,那是說明此引腳/信號是低電平有效,比如你上面看到的RE頭上有個橫線,就是說明,此RE是低電平有效,此外,為了書寫方便,在字母下面加'_',也是表示低電平有效,比如我上面寫的WP,如果字母頭上啥都沒有,就是默認的高電平有效,比如上面的CLE,就是高電平有效。
為何需要ALE和CLE?
那是因為,Nand Flash就8個I/O,而且是復用的,也就是,可以傳數據,也可以傳地址,也可以傳命令,為了區分你當前傳入的到底是啥,所以,先要用發一個CLE(或ALE)命令,告訴nand Flash的控制器一聲,我下面要傳的是命令(或地址),這樣,里面才能
根據傳入的內容,進行對應的動作。否則,nand flash內部,怎么知道你傳入的是數據,還是地址,還是命令啊,也就無法實現正確的操作了。
Nandflash只有8個I/O引腳的好處?
1、減少外圍引腳。相對於並口(Parellel)48或52個引腳的Nor Flash來說,的確是大大減小了引腳數目,這樣封裝后的芯片體積就小很多。現在芯片在向體積更小,功能更強,功耗更低發展,減小芯片體積就是很大的優勢。同時,減少芯片接口也意味着使用此芯片
的相關的外圍電路會更簡化,避免了繁瑣的硬件連線。
2、提高系統的可擴展性,因為沒有像其他設備一樣用物理大小對應的完全數目的addr引腳,在芯片內部換了芯片的大小等的改動,對於用全部的地址addr的引腳,那么就會引起這些引腳數目的增加,比如容量擴大一倍,地址空間/尋址空間擴大一倍,所以,地址線
數目/addr引腳數目,就要多加一個,而對於統一用8個I/O的引腳的Nand Flash,由於對外提供的都是統一的8個引腳,內部的芯片大小的變化或者其他的變化,對於外部使用者(比如編寫nand flash驅動的人)來說,不需要關心,只是保證新的芯片,還是遵循同樣的
接口,同樣的時序,同樣的命令就可以了,這樣就提高了系統的擴展性。
Nandflash的一些典型特性
1、頁擦除時間是200us,有些慢的有800us。
2、塊擦除時間是1.5ms.
3、頁數據讀取到數據寄存器的時間一般是20us。
4、串行訪問(Serial access)讀取一個數據的時間是25ns,而一些舊的nand flash是30ns,甚至是50ns。
5、輸入輸出端口是地址和數據以及命令一起復用的。
Nandflash中的特殊硬件結構
1、頁寄存器(Page Register)
由於Nand Flash讀取和編程操作來說,一般最小單位是頁,所以nand flash在硬件設計時候就考慮到這一特性,對於每一片都有一個對應的區域,專門用於存放將要寫入到物理存儲單元中去的或者剛從存儲單元中讀取出來的一頁數
據,這個數據緩存區本質上就是一個buffer,只是名字叫法不同,datasheet里面叫做Page Register,此處翻譯為頁寄存器,實際理解為頁緩存更為恰當些。
注意:只有寫到了這個頁緩存中,只有等你發了對應的編程第二階段的確認命令0x10之后,實際的編程動作才開始,才開始把頁緩存中的數據,一點點寫到物理存儲單元中去。
2、Nand Flash中的壞塊(Bad Block)
Nand Flash中,一個塊中含有1個或多個位是壞的,就成為其為壞塊。
壞塊的穩定性是無法保證的,也就是說,不能保證你寫入的數據是對的,或者寫入對了,讀出來也不一定對的。而正常的塊,肯定是寫入讀出都是正常的。
壞塊有兩種:
(1)一種是出廠的時候,也就是你買到的新的還沒用過的Nand Flash,就可能包含了壞塊。此類出廠時就有的壞塊,被稱作factory (masked)bad block或initial bad/invalid block,在出廠之前,就會做對應的標記,標為壞塊。
具體標記的地方是,對於現在常見的頁大小為2K的Nand Flash,是塊中第一個頁的oob起始位置(關於什么是頁和oob,下面會有詳細解釋)的第1個字節(舊的小頁面,pagesize是512B甚至256B的nand flash,壞塊標記是第6個字節),如果不是0xFF,就說明是
壞塊。相對應的是,所有正常的塊,好的塊,里面所有數據都是0xFF的。
(2)第二類叫做在使用過程中產生的,由於使用過程時間長了,在擦塊除的時候,出錯了,說明此塊壞了,也要在程序運行過程中發現並且標記成壞塊的。具體標記的位置,和上面一樣。這類塊叫做worn-out bad block。
對於壞塊的管理,在Linux系統中,叫做壞塊管理(BBM,Bad Block Managment),對應的會有一個表去記錄好塊,壞塊的信息,以及壞塊是出廠就有的,還是后來使用產生的,這個表叫做 壞塊表(BBT,Bad Block Table)。在Linux內核MTD架構下的Nand
Flash驅動,和Uboot中Nand Flash驅動中,在加載完驅動之后,如果你沒有加入參數主動要求跳過壞塊掃描的話,那么都會去主動掃描壞塊,建立必要的BBT的,以備后面壞塊管理所使用。
而關於好塊和壞塊,Nand Flash在出廠的時候,會做出保證:
1、關於好的,可以使用的塊的數目達到一定的數目,比如三星的K9G8G08U0M,整個flash一共有4096個塊,出廠的時候,保證好的塊至少大於3996個,也就是意思是,你新買到這個型號的nand flash,最壞的可能,有3096-3996=100個壞塊。不過,事實上,
現在出廠時的壞塊,比較少,絕大多數,都是使用時間長了,在使用過程中出現的。
2、保證第一個塊是好的,並且一般相對來說比較耐用。做此保證的主要原因是,很多Nand Flash壞塊管理方法中,就是將第一個塊,用來存儲上面提到的BBT,否則都是出錯幾率一樣的塊,那么也就不太好管理了,連放BBT的地方都不好找了。
一般來說,不同型號的Nand Flash的數據手冊中,也會提到,自己的這個nand flash,最多允許多少個壞塊。就比如上面提到的,三星的K9G8G08U0M,最多有100個壞塊。
對於壞塊的標記,本質上,也只是對應的flash上的某些字節的數據是非0xFF而已,所以只要是數據,就是可以讀取和寫入的。也就意味着,可以寫入其他值,也就把這個壞塊標記信息破壞了。對於出廠時的壞塊,一般是不建議將標記好的信息擦除掉的。
壞塊的產生,在編程的時候、在擦出的時候、在讀取的時候
Nandflash中頁的訪問順序
在一個塊內,對每一個頁進行編程的話,必須是順序的,而不能是隨機的。比如,一個塊中有128個頁,那么你只能先對page0編程,再對page1編程,。。。。,而不能隨機的,比如先對page3,再page1,page2.,page0,page4,.。
Nandflash行地址和列地址的計算
如上圖所示,Nandflash有2048Blocks,每個Block有64頁,每一頁含有2K的用戶可以使用的數據和64B的OOB。對於用戶來說這64B的數據時不用操作的,讀寫的時候也會忽略這部分。也就是說用戶在讀這一頁數據的時候只會發出11位地址,不會發出12位地址(12位地址包含了讀寫OOB)。 如果讀取0x60000地址處的數據,那么:
column_address = 0x60000 % 2048;
row_address = 0x60000 / 2048;
由於地址和數據都是通過8位引腳發送的,所以:
第一個周期發送的地址是: 0x60000 & 0xff 或column_address & 0xff;
第二個周期發送的地址為:(0x60000 >> 8) & 0x07或(column_address >> 8) & 0x07;
第三個周期發送的地址為:(0x60000 >> 11) & 0xff,這里是右移11位,不是12位,或row_address & 0xff;
第四個周期發送的地址為:(0x60000 >> 19) & 0xff,或(row_address >> 8) & 0xff;
最后一個周期發送的地址為:(0x60000 >> 27) & 0x01,或(row_address >> 16) & 0x01。
片選無關(CE don’t-care)技術
很多Nand flash支持一個叫做CE don’t-care的技術,字面意思就是,不關心是否片選,
那有人會問了,如果不片選,那還能對其操作嗎?答案就是,這個技術,主要用在當時是不需要選中芯片卻還可以繼續操作的這些情況:在某些應用,比如錄音,音頻播放等應用中,外部使用的微秒(us)級的時鍾周期,此處假設是比較少的2us,在進行讀取一頁
或者對頁編程時,是對Nand Flash操作,這樣的串行(Serial Access)訪問的周期都是20/30/50ns,都是納秒(ns)級的,此處假設是50ns,當你已經發了對應的讀或寫的命令之后,接下來只是需要Nand Flash內部去自己操作,將數據讀取除了或寫入進去到內部
的數據寄存器中而已,此處,如果可以把片選取消,CE是低電平有效,取消片選就是拉高電平,這樣會在下一個外部命令發送過來之前,即微秒量級的時間里面,即2us-50ns≈2us,這段時間的取消片選,可以降低很少的系統功耗,但是多次的操作,就可以在很
大程度上降低整體的功耗了。
總結起來簡單解釋就是:由於某些外部應用的頻率比較低,而Nand Flash內部操作速度比較快,所以具體讀寫操作的大部分時間里面,都是在等待外部命令的輸入,同時卻選中芯片,產生了多余的功耗,此“不關心片選”技術,就是在Nand Flash的內部的相對快速的
操作(讀或寫)完成之后,就取消片選,以節省系統功耗。待下次外部命令/數據/地址輸入來的時候,再選中芯片,即可正常繼續操作了。這樣,整體上,就可以大大降低系統功耗了。
注:Nand Flash的片選與否,功耗差別會有很大。如果數據沒有記錯的話,我之前遇到我們系統里面的nand flash的片選,大概有5個mA的電流輸出呢,要知道,整個系統優化之后的待機功耗,也才10個mA左右的。
帶EDC的拷回操作以及Sector的定義(Copy-Back Operation with EDC & Sector Definition for EDC)
Copy-Back功能,簡單的說就是,將一個頁的數據,拷貝到另一個頁。
如果沒有Copy-Back功能,那么正常的做法就是,先要將那個頁的數據拷貝出來放到內存的數據buffer中,讀出來之后,再用寫命令將這頁的數據,寫到新的頁里面。
而Copy-Back功能的好處在於,不需要用到外部的存儲空間,不需要讀出來放到外部的buffer里面,而是可以直接讀取數據到內部的頁寄存器(page register)然后寫到新的頁里面去。而且為了保證數據的正確,要硬件支持EDC(Error Detection Code),否則在
數據的拷貝過程中,可能會出現錯誤,並且拷貝次數多了,可能會累積更多錯誤。
而對於錯誤檢測來說,硬件一般支持的是512字節數據,對應有16字節用來存放校驗產生的ECC數值,而這512字節一般叫做一個扇區。對於2K+64字節大小的頁來說,按照512字節分,分別叫做A,B,C,D區,而后面的64字節的oob區域,按照16字節一個區,
分別叫做E,F,G,H區,對應存放A,B,C,D數據區的ECC的值。
總結:
512+16
2K +64 : A B C D - E F G H區
Copy-Back編程的主要作用在於,去掉了數據串行讀取出來再串行寫入進去的時間,這部分操作是比較耗時的,所以此技術可以提高編程效率,提高系統整體性能。
多片同時編程(Simultaneously Program Multi Plane)
對於有些新出的Nand Flash,支持同時對多個片進行編程,比如上面提到的三星的K9K8G08U0A,內部包含4片(Plane),分別叫做Plane0,Plane1,Plane2,Plane3。.由於硬件上,對於每一個Plane,都有對應的大小是2048+64=2112字節的頁寄存器(Page
Register),使得同時支持多個Plane編程成為可能。K9K8G08U0A支持同時對2個Plane進行編程。不過要注意的是,只能對Plane0和Plane1或者Plane2和Plane3,同時編程,而不支持Plane0和Plane2同時編程。
交錯頁編程(Interleave Page Program)
多片同時編程,是針對一個chip里面的多個Plane來說的,
而此處的交錯頁編程,是指對多個chip而言的。
可以先對一個chip,假設叫chip1,里面的一頁進行編程,然后此時,chip1內部就開始將數據一點點寫到頁里面,就出於忙的狀態了,而此時可以利用這個時間,對出於就緒狀態的chip2,也進行頁編程,發送對應的命令后,chip2內部也就開始慢慢的寫數據到存儲
單元里面去了,也出於忙的狀態了。此時,再去檢查chip1,如果編程完成了,就可以開始下一頁的編程了,然后發完命令后,就讓其內部慢慢的編程吧,再去檢查chip2,如果也是編程完了,也就可以進行接下來的其他頁的編程了。如此,交互操作chip1和chip2,
就可以有效地利用時間,使得整體編程效率提高近2倍,大大提高nand flash的編程/擦寫速度了。
隨機輸出頁內數據(Random Data Output In a Page)
在介紹此特性之前,先要說說,與Random Data Output In a Page相對應的是,普通的,正常的輸出頁數據(sequential data output in a page)。
正常情況下,我們讀取數據,都是先發讀命令,然后等待數據從存儲單元到內部的頁數據寄存器中后,我們通過將RE(Read Enale,低電平有效)置低,然后從開始傳入的列起始地址,一點點讀出我們要的數據,直到頁的末尾,當然有可能還沒到頁地址的末尾就不
再讀了。所謂的順序(sequential)讀取也就是,根據你之前發送的列地址的起始地址開始,每讀一個字節的數據出來,內部的數據指針就加1,移到下個字節的地址,然后你再讀下一個字節數據,這樣就可以讀出你要的全部數據。
而此處的隨機(random)讀取,就是在你正常的順序讀取的過程中,先發一個隨機讀取的開始命令0x05命令,再傳入你要將內部那個數據指針定位到具體什么地址,也就是2個cycle的列地址,然后再發隨機讀取結束命令0xE0,然后內部那個數據地址指針,就會移
動到你所指定的位置了,你接下來再讀取的數據,就是從那個制定地址開始的數據了。
而nand flash數據手冊里面也說了,這樣的隨機讀取,你可以多次操作,沒限制的。
請注意,上面你所傳入的地址都是列地址,也就是頁內地址,也就是說,對於頁大小為2K的nand flash來說,所傳入的地址應該是小於2048+64=2112的。
不過,實際在nand flash的使用中,好像這種用法很少的。絕大多數,都是順序讀取數據。
頁編程(寫操作)
Nand flash的寫操作叫做編程Program,編程,一般情況下,是以頁為單位的。
有的Nand Flash,比如K9K8G08U0A,支持部分頁編程,但是有一些限制:在同一個頁內的,連續的部分頁的編程,不能超過4次。一般情況下,很少使用到部分頁編程,都是以頁為單位進行編程操作的。
一個操作,用兩個命令去實現,看起來是多余,效率不高,但是實際上,有其特殊考慮,
至少對於塊擦除來說,開始的命令0x60是擦除設置命令(erase setup comman),然后傳入要擦除的塊地址,然后再傳入擦除確認命令(erase confirm command)0xD0,以開始擦除的操作。
這種分兩步:開始設置,最后確認的命令方式,是為了避免由於外部由於無意的/未預料而產生的噪音,假設此時即使被nand flash誤認為是擦除操作,但是沒有之后的確認操作0xD0,nand flash就不會去擦除數據,這樣使得數據更安全,不會由於噪音而誤操作。
讀操作過程
(1) 操作准備階段:此處是讀(Read)操作,所以先發一個讀命令的第一個階段命令0x00,,表示讓硬件先准備一下,接下來的操作是讀。
(2) 發送兩個周期的列地址,也就是頁內地址,表示我要從一個頁的什么位置開始讀取數據。
(3) 接下來再傳入三個行地址,對應的也就是頁號。
(4) 然后再發一個讀操作的第二個周期命令0x30,接下來就是硬件內部自己的事情了。
(5) Nand Flash內部硬件邏輯,負責去按照你的要求,根據傳入的地址,找到哪個塊中的哪個頁,然后把整個這一頁的數據,都一點點搬運到頁緩存中去。而在此期間,你所能做的事,也就只需要去讀取狀態寄存器,看看對應的位的值,也就是R/B那一位,是1
還是0,0的話就表示系統是busy,仍在”忙“(着讀取數據),如果是1,就說系統活干完了,忙清了,已經把整個頁的數據都搬運到頁緩存里去了,你可以接下來讀取你要的數據了。
對於這里估計有人會問了,這一個頁一共2048+64字節,如果我傳入的頁內地址,就像上面給的1028一類的值,只是想讀取1028到2011這部分數據,而不是頁開始的0地址整個頁的數據,那么內部硬件卻讀取整個頁的數據出來,豈不是很浪費嗎?答案是,的確很
浪費,效率看起來不高,但是實際就是這么做的,而且本身讀取整個頁的數據,相對時間並不長,而且讀出來之后,內部數據指針會定位到你剛才所制定的1208的那個位置。
(6) 接下來,就是你“竊取“系統忙了半天之后的勞動成果的時候了。通過先去Nand Flash的控制器中的數據寄存器中寫入你要讀取多少個字節(byte)/字(word),然后就可以去Nand Flash控制器的FIFO中,一點點讀取你要的數據了。
至此,整個Nand Flash的讀操作就完成了。
spare area/oob
Nand由於最初硬件設計時候考慮到,額外的錯誤校驗等需要空間,專門對應每個頁,額外設計了叫做spare area空區域,在其他地方,比如jffs2文件系統中,也叫做oob(out of band)數據。
其具體用途,總結起來有:
1. 標記是否是壞快
2. 存儲ECC數據
3. 存儲一些和文件系統相關的數據,如jffs2就會用到這些空間存儲一些特定信息,yaffs2文件系統,會在oob中,存放很多和自己文件系統相關的信息。
內存技術設備MTD(Memory Technology Device)
MTD,是Linux的存儲設備中的一個子系統。其設計此系統的目的是,對於內存類的設備,提供一個抽象層,一個接口,使得對於硬件驅動設計者來說,可以盡量少的去關心存儲格式,比如FTL,FFS2等,而只需要去提供最簡單的底層硬件設備的讀/寫/擦除函數就
可以了。而對於數據對於上層使用者來說是如何表示的,硬件驅動設計者可以不關心,而MTD存儲設備子系統都幫你做好了。
對於MTD字系統的好處,簡單解釋就是,他幫助你實現了很多對於以前或者其他系統來說,本來也是你驅動設計者要去實現的很多功能。換句話說,有了MTD,使得你設計Nand Flash的驅動,所要做的事情要少很多很多,因為大部分工作,都由MTD幫你做好了。
當然,這個好處的一個“副作用”就是,使得我們不了解的人去理解整個Linux驅動架構,以及MTD,變得更加復雜。但是,總的說,覺得是利遠遠大於弊,否則,就不僅需要你理解,而且還是做更多的工作,實現更多的功能了。
此外,還有一個重要的原因,那就是,前面提到的nand flash和普通硬盤等設備的特殊性:
有限的通過出復用來實現輸入輸出命令和地址/數據等的IO接口,最小單位是頁而不是常見的bit,寫前需擦除等,導致了這類設備,不能像平常對待硬盤等操作一樣去操作,只能采取一些特殊方法,這就誕生了MTD設備的統一抽象層。
MTD,將nand flash,nor flash和其他類型的flash等設備,統一抽象成MTD設備來管理,根據這些設備的特點,上層實現了常見的操作函數封裝,底層具體的內部實現,就需要驅動設計者自己來實現了。具體的內部硬件設備的讀/寫/擦除函數,那就是你必須實現的
了。
錯誤校驗碼
Nand Flash物理特性上使得其數據讀寫過程中會發生一定幾率的錯誤,所以要有個對應的錯誤檢測和糾正的機制,於是才有此ECC,用於數據錯誤的檢測與糾正。Nand Flash的ECC,常見的算法有海明碼和BCH,這類算法的實現,可以是軟件也可以是硬件。不同
系統,根據自己的需求,采用對應的軟件或者是硬件。
相對來說,硬件實現這類ECC算法,肯定要比軟件速度要快,但是多加了對應的硬件部分,所以成本相對要高些。如果系統對於性能要求不是很高,那么可以采用軟件實現這類ECC算法,但是由於增加了數據讀取和寫入前后要做的數據錯誤檢測和糾錯,所以性能
相對要降低一些,即Nand Flash的讀取和寫入速度相對會有所影響。其中,Linux中的軟件實現ECC算法,即NAND_ECC_SOFT模式,就是用的對應的海明碼。而對於目前常見的MLC的Nand Flash來說,由於容量比較大,動輒2GB,4GB,8GB等,常用BCH算
法。BCH算法,相對來說,算法比較復雜。筆者由於水平有限,目前仍未完全搞懂BCH算法的原理。
BCH算法,通常是由對應的Nand Flash的Controller中,包含對應的硬件BCH ECC模塊,實現了BCH算法,而作為軟件方面,需要在讀取數據后,寫入數據之前,分別操作對應BCH相關的寄存器,設置成BCH模式,然后讀取對應的BCH狀態寄存器,得知是否有錯
誤,和生成的BCH校驗碼,用於寫入。其具體代碼是如何操作這些寄存器的,由於是和具體的硬件,具體的nand flash的controller不同而不同,無法用同一的代碼。如果你是nand flash驅動開發者,自然會得到對應的起nand flash的controller部分的datasheet,按
照手冊說明,去操作即可。
不過,額外說明一下的是,關於BCH算法,往往是要從專門的做軟件算法的廠家購買的,但是Micron之前在網上放出一個免費版本的BCH算法。
位反轉
Nand Flash的位反轉現象,主要是由以下一些原因/效應所導致:
漂移效應(Drifting Effects):漂移效應指的是,Nand Flash中cell的電壓值,慢慢地變了,變的和原始值不一樣了
編程干擾所產生的錯誤(Program-Disturb Errors):此現象有時候也叫做,過度編程效應(over-program effect),對於某個頁面的編程操作,即寫操作,引起非相關的其他的頁面的某個位跳變了。
讀操作干擾產生的錯誤(Read-Disturb Errors):此效應是,對一個頁進行數據讀取操作,卻使得對應的某個位的數據,產生了永久性的變化,即Nand Flash上的該位的值變了。
Nand Flash位反轉類型和解決辦法
一種是nand flash物理上的數據存儲的單元上的數據,是正確的,只是在讀取此數據出來的數據中的某位,發生變化,出現了位反轉,即讀取出來的數據中,某位錯了,本來是0變成1,或者本來是1變成0了。此處可以成為軟件上位反轉。此數據位的錯誤,當然可以
通過一定的校驗算法檢測並糾正。
另外一種,就是nand flash中的物理存儲單元中,對應的某個位,物理上發生了變化,原來是1的,變成了0,或原來是0的,變成了1,發生了物理上的位的數據變化。此處可以成為硬件上的位反轉。此錯誤,由於是物理上發生的,雖然讀取出來的數據的錯誤,可以
通過軟件或硬件去檢測並糾正過來,但是物理上真正發生的位的變化,則沒辦法改變了。不過個人理解,好像也是可以通過擦除Erase整個數據塊Block的方式去擦除此錯誤,不過在之后的Nand Flash的使用過程中,估計此位還是很可能繼續發生同樣的硬件的位反
轉的錯誤。
以上兩種類型的位反轉,其實對於從Nand Flash讀取出來的數據來說,解決其中的錯誤的位的方法,都是一樣的,即通過一定的校驗算法,常稱為ECC,去檢測出來,或檢測並糾正錯誤。
如果只是單獨檢測錯誤,那么如果發現數據有誤,那么再重新讀取一次即可。
實際中更多的做法是,ECC校驗發現有錯誤,會有對應的算法去找出哪位錯誤並且糾正過來。
其中對錯誤的檢測和糾正,具體的實現方式,有軟件算法,也有硬件實現,即硬件Nand Flash的控制器controller本身包含對應的硬件模塊以實現數據的校驗和糾錯的。
文章參考自https://blog.csdn.net/zxcv1234qwert/article/details/42460697、https://blog.csdn.net/doccode/article/details/46963855、https://blog.csdn.net/luopingfeng/article/details/23621229