YAFFS2文件系統分析(轉)

本文轉載自查看原文 2014-04-26 10:48 8967

http://blog.chinaunix.net/uid-25314474-id-343665.html

1.前言
略。

2.yaffs 文件系統簡介
按理說這里應該出現一些諸如“yaffs 是一種適合於 NAND Flash 的文件系統 XXXXX”之類
的字眼,不過考慮到網絡上關於 yaffs/yaffs2 的介紹已經多如牛毛,所以同上,略。
3.本文內容組織

本文將模仿《linux 內核源代碼情景分析》一書,以情景分析的方式對 yaffs2 文件系統的
源代碼進行分析。首先將分析幾組底層函數,如存儲空間的分配和釋放等;其次分析文件
邏輯地址映射;然后是垃圾收集機制;接下來......Sorry,本人還沒想好。:-)

4.說明
因為 yaffs2 貌似還在持續更新中,所以本文所列代碼可能和讀者手中的代碼不完全一致。
另外,本文讀者應熟悉 C 語言,熟悉 NAND Flash 的基本概念(如 block 和 page)。
Ok,步入正題。首先分析存儲空間的分配。

5.NAND Flash 存儲空間分配和釋放
我們知道,NAND Flash 的基本擦除單位是 Block,而基本寫入單位是 page。yaffs2 在分配
存儲空間的時候是以 page 為單位的,不過在 yaffs2 中把基本存儲單位稱為 chunk,和
page 是一樣的大小,在大多數情況下和 page 是一個意思。在下文中我們使用 chunk 這個
詞,以保持和 yaffs2 的源代碼一致。
我們先看存儲空間的分配(在 yaffs_guts.c 中。這個文件也是 yaffs2 文件系統的核心部分):
static int yaffs_AllocateChunk(yaffs_Device * dev, int useReserve,
yaffs_BlockInfo **blockUsedPtr)
{
int retVal;
yaffs_BlockInfo *bi;
if (dev->allocationBlock < 0) {
/* Get next block to allocate off */
dev->allocationBlock = yaffs_FindBlockForAllocation(dev);
dev->allocationPage = 0;
}
函數有三個參數,dev 是 yaffs_Device 結構的指針,yaffs2 用這個結構來記錄一個 NAND
器件的屬性(如 block 和 page 的大小)和系統運行過程中的一些統計值(如器件中可用
chunk 的總數),還用這個結構維護着一組 NAND 操作函數(如讀、寫、刪除)的指針。
整個結構體比較大,我們會按情景的不同分別分析。useReserve 表示是否使用保留空間。
yaffs2 文件系統並不會將所有的存儲空間全部用於存儲文件系統數據,而要空出部分
block 用於垃圾收集時使用。一般情況下這個參數都是 0,只有在垃圾收集時需要分配存
儲空間的情況下將該參數置 1。yaffs_BlockInfo 是描述 block 屬性的結構,主要由一些統
計變量組成,比如該 block 內還剩多少空閑 page 等。我們同樣在具體情景中再分析這個結
構中的字段含義。
函數首先判斷 dev->allocationBlock 的值是否小於 0。yaffs_Device 結構內的
allocationBlock 字段用於記錄當前從中分配 chunk(page)的那個 block 的序號。當一
個 block 內的所有 page 全部分配完畢時,就將這個字段置為-1,下次進入該函數時就會
重新挑選空閑的 block。這里我們假定需要重新挑選空閑 block,因此進入
yaffs_FindBlockForAllocation 函數:
[yaffs_AllocateChunk() => yaffs_FindBlockForAllocation()]
static int yaffs_FindBlockForAllocation(yaffs_Device * dev)
{
int i;
yaffs_BlockInfo *bi;
if (dev->nErasedBlocks < 1) {
/* Hoosterman we've got a problem.
* Can't get space to gc
*/
T(YAFFS_TRACE_ERROR,
(TSTR("yaffs tragedy: no more eraased blocks" TENDSTR)));
return -1;
}
dev->nErasedBlocks 記錄着器件內所有可供分配的 block 的數量。如果該值小於 1,那顯
然是有問題了。不但正常的分配請求無法完成,就連垃圾收集都辦不到了。
for (i = dev->internalStartBlock; i <= dev->internalEndBlock; i++) {
dev->allocationBlockFinder++;
if (dev->allocationBlockFinder < dev->internalStartBlock
|| dev->allocationBlockFinder > dev->internalEndBlock) {
dev->allocationBlockFinder = dev->internalStartBlock;
internalStartBlock 和 internalEndBlock 分別是 yaffs2 使用的 block 的起始序號和結束
序號。也就是說 yaffs2 文件系統不一定要占據整個 Flash,可以只占用其中的一部分。
dev->allocationBlockFinder 記錄着上次分配的塊的序號。如果已經分配到系統尾部,就
從頭重新開始搜索可用塊。
bi = yaffs_GetBlockInfo(dev, dev->allocationBlockFinder);
if (bi->blockState == YAFFS_BLOCK_STATE_EMPTY) {
bi->blockState = YAFFS_BLOCK_STATE_ALLOCATING;
dev->sequenceNumber++;
bi->sequenceNumber = dev->sequenceNumber;
dev->nErasedBlocks--;
T(YAFFS_TRACE_ALLOCATE,
(TSTR("Allocated block %d, seq %d, %d left" TENDSTR),
dev->allocationBlockFinder, dev->sequenceNumber,
dev->nErasedBlocks));
return dev->allocationBlockFinder;
}
yaffs_GetBlockInfo 函數獲取指向 block 信息結構的指針,該函數比較簡單,就不詳細介
紹了。yaffs_BlockInfo 結構中的 blockState 成員描述該 block 的狀態,比如空,滿,已
損壞,當前分配中,等等。因為是要分配空閑塊,所以塊狀態必須是
YAFFS_BLOCK_STATE_EMPTY,如果不是,就繼續測試下一個 block。找到以后將 block 狀
態修改為 YAFFS_BLOCK_STATE_ALLOCATING,表示當前正從該 block 中分配存儲空間。正
常情況下,系統中只會有一個 block 處於該狀態。另外還要更新統計量 ErasedBlocks 和
sequenceNumber。這個 sequenceNumber 記錄着各 block 被分配出去的先后順序,以后在
垃圾收集的時候會以此作為判斷該 block 是否適合回收的依據。
現在讓我們返回到函數 yaffs_AllocateChunk 中。yaffs_CheckSpaceForAllocation()函數
檢查 Flash 上是否有足夠的可用空間,通過檢查后,就從當前供分配的 block 上切下一個
chunk:
if (dev->allocationBlock >= 0) {
bi = yaffs_GetBlockInfo(dev, dev->allocationBlock);
retVal = (dev->allocationBlock * dev->nChunksPerBlock) +
dev->allocationPage;
bi->pagesInUse++;
yaffs_SetChunkBit(dev, dev->allocationBlock,
dev->allocationPage);
dev->allocationPage++;
dev->nFreeChunks--;
/* If the block is full set the state to full */
if (dev->allocationPage >= dev->nChunksPerBlock) {
bi->blockState = YAFFS_BLOCK_STATE_FULL;
dev->allocationBlock = -1;
}
if(blockUsedPtr)
*blockUsedPtr = bi;
return retVal;
}
dev->allocationPage 記錄着上次分配的 chunk 在 block 中的序號,每分配一次加 1。從這
里我們可以看出,系統在分配 chunk 的時候是從 block 的開頭到結尾按序分配的,直到一
個 block 內的所有 chunk 全部分配完畢為止。retVal 是該 chunk 在整個 device 內的總序
號。PagesInUse 記錄着該 block 中已分配使用的 page 的數量。
系統在設備描述結構 yaffs_Device 中維護着一張位圖,該位圖的每一位都代表着 Flash
上的一個 chunk 的狀態。yaffs_SetChunkBit()將剛分配得到的 chunk 在位圖中的對應位置
1,表明該塊已被使用。更新一些統計量后,就可以返回了。
看過 chunk 分配以后,我們再來 chunk 的釋放。和 chunk 分配不同的是,chunk 的
釋放在大多數情況下並不釋放對應的物理介質,這是因為 NAND 雖然可以按 page 寫,但
只能按 block 擦除,所以物理介質的釋放要留到垃圾收集或一個 block 上的所有 page 全部
變成空閑的時候才進行。根據應用場合的不同,chunk 的釋放方式並不唯一,分別由
yaffs_DeleteChunk 函數和 yaffs_SoftDeleteChunk 函數完成。我們先看
yaffs_DeleteChunk:
void yaffs_DeleteChunk(yaffs_Device * dev, int chunkId, int markNAND, int lyn)
chunkId 就是要刪除的 chunk 的序號,markNand 參數用於 yaffs 一代的代碼中,yaffs2 不
使用該參數。
參數 lyn 在調用該函數時置成當前行號(__LINE__),用於調試。
首先通過 yaffs_GetBlockInfo 獲得 chunk 所在 block 的信息描述結構指針,然后就跑到
else 里面去了。if 語句的判斷條件中有一條!dev->isYaffs2,所以對於 yaffs2 而言是不
會執行 if 分支的。在 else 分支里面只是遞增一下統計計數就出來了,我們接着往下看。
if (bi->blockState == YAFFS_BLOCK_STATE_ALLOCATING ||
bi->blockState == YAFFS_BLOCK_STATE_FULL ||
bi->blockState == YAFFS_BLOCK_STATE_NEEDS_SCANNING ||
bi->blockState == YAFFS_BLOCK_STATE_COLLECTING) {
dev->nFreeChunks++;
yaffs_ClearChunkBit(dev, block, page);
bi->pagesInUse--;
if (bi->pagesInUse == 0 &&
!bi->hasShrinkHeader &&
bi->blockState != YAFFS_BLOCK_STATE_ALLOCATING &&
bi->blockState != YAFFS_BLOCK_STATE_NEEDS_SCANNING) {
yaffs_BlockBecameDirty(dev, block);
}
} else {
/* T(("Bad news deleting chunk %d\n",chunkId)); */
}
首先要判斷一下該 block 上是否確實存在着可釋放的 chunk。block 不能為空,不能是壞塊。
YAFFS_BLOCK_STATE_NEEDS_SCANNING 表明正對該塊進行垃圾回收,我們后面會分析;
YAFFS_BLOCK_STATE_NEEDS_SCANNING 在我手上的源代碼中似乎沒有用到。
通過判斷以后,所做的工作和 chunk 分配函數類似,只是一個遞增統計值,一個遞減。遞
減統計值以后還要判斷該 block 上的 page 是否已全部釋放,如果已全部釋放,並且不是
當前分配塊,就通過 yaffs_BlockBecameDirty 函數刪除該 block,只要能通過刪除操作
(不是壞塊),該 block 就又可以用於分配了。
相比較來說,yaffs_SoftDeleteChunk 所做的工作就簡單多了。關鍵的代碼只有兩行:
static void yaffs_SoftDeleteChunk(yaffs_Device * dev, int chunk)
{
......
theBlock->softDeletions++;
dev->nFreeChunks++;
......
}
這里遞增的是 yaffs_blockInfo 結構中的另一個統計量 softDeletions,而沒有修改
pagesInUse 成員,也沒有修改 chunk 狀態位圖。那么,這兩個函數的應用場合有什么區別
呢?
一般來說,yaffs_DeleteChunk 用於文件內容的更新。比如我們要修改文件中的部分內容,
這時候 yaffs2 會分配新的 chunk,將更改后的內容寫入新 chunk 中,原 chunk 的內容自然
就沒有用了,所以要將 pageInUse 減 1,並修改位圖;
yaffs_SoftDeleteChunk 用於文件的刪除。yaffs2 在刪除文件的時候只是刪除該文件在內
存中的一些描述結構,而被刪除的文件所占用的 chunk 不會立即釋放,也就是不會刪除
文件內容,在后續的文件系統操作中一般也不會把這些 chunk 分配出去,直到系統進行垃
圾收集的時候才有選擇地釋放這些 chunk。熟悉 DOS 的朋友可能還記得,DOS 在刪除的文
件的時候也不會立即刪除文件內容,只是將文件名的第一個字符修改為 0xA5,事后還可
以恢復文件內容。yaffs2 在這點上是類似的。

6.文件地址映射
上面說到,yaffs 文件系統在更新文件數據的時候,會分配一塊新的 chunk,也就是說,
同樣的文件偏移地址,在該地址上的數據更新前和更新后,其對應的 flash 上的存儲地
址是不一樣的。那么,如何根據文件內偏移地址確定 flash 存儲地址呢?最容易想到的辦
法,就是在內存中維護一張映射表。由於 flash 基本存儲單位是 chunk,因此,只要將以
chunk 描述的文件偏移量作為表索引,將 flash chunk 序號作為表內容,就可以解決該問
題了。但是這個方法有幾個問題,首先就是在做 seek 操作的時候,要從表項 0 開始按序搜
索,對於大文件會消耗很多時間;其次是在建立映射表的時候,無法預計文件大小的變
化,於是就可能在后來的操作中頻繁釋放分配內存以改變表長,造成內存碎片。yaffs 的
解決方法是將這張大的映射表拆分成若干個等長的小表,並將這些小表組織成樹的結構,
方便管理。我們先看小表的定義:
union yaffs_Tnode_union {
union yaffs_Tnode_union *internal[YAFFS_NTNODES_INTERNAL];
}
YAFFS_NTNODES_INTERNAL 定義為(YAFFS_NTNODES_LEVEL0 / 2),而
YAFFS_NTNODES_LEVEL0 定義為 16,所以這實際上是一個長度為 8 的指針數組。不管是葉
子節點還是非葉節點,都是這個結構。當節點為非葉節點時,數組中的每個元素都指向
下一層子節點;當節點為葉子節點時,該數組拆分為 16 個 16 位長的短整數(也有例外,后
面會說到),該短整數就是文件內容在 flash 上的存儲位置(即 chunk 序號)。至於如何
通過文件內偏移找到對應的 flash 存儲位置,源代碼所附文檔
(Development/yaffs/Documentation/yaffs-notes2.html)已經有說明,俺就不在此處饒
舌了。下面看具體函數。
為了行文方便,后文中將 yaffs_Tnode 這個指針數組稱為“一組”Tnode,而將數組
中的每個元素稱為“一個”Tnode。樹中的每個節點,都是“一組”Tnode。
先看映射樹的節點的分配。
static yaffs_Tnode *yaffs_GetTnode(yaffs_Device * dev)
{
yaffs_Tnode *tn = yaffs_GetTnodeRaw(dev);
if(tn)
memset(tn, 0, (dev->tnodeWidth * YAFFS_NTNODES_LEVEL0)/8);
return tn;
}
調用 yaffs_GetTnodeRaw 分配節點,然后將得到的節點初始化為零。
static yaffs_Tnode *yaffs_GetTnodeRaw(yaffs_Device * dev)
{
yaffs_Tnode *tn = NULL;
/* If there are none left make more */
if (!dev->freeTnodes) {
yaffs_CreateTnodes(dev, YAFFS_ALLOCATION_NTNODES);
}
當前所有空閑節點組成一個鏈表,dev->freeTnodes 是這個鏈表的表頭。我們假定已經沒
有空閑節點可用,需通過 yaffs_CreateTnodes 創建一批新的節點。
static int yaffs_CreateTnodes(yaffs_Device * dev, int nTnodes)
{
......
tnodeSize = (dev->tnodeWidth * YAFFS_NTNODES_LEVEL0)/8;
newTnodes = YMALLOC(nTnodes * tnodeSize);
mem = (__u8 *)newTnodes;
上面說過,葉節點中一個 Tnode 的位寬默認為 16 位,也就是可以表示 65536 個 chunk。對
於時下的大容量 flash,chunk 的大小為 2K,因此在默認情況下 yaffs2 所能尋址的最大
flash 空間就是 128M。為了能將 yaffs2 用於大容量 flash 上,代碼作者試圖通過兩種手段
解決這個問題。第一種手段就是這里的 dev->tnodeWidth,通過增加單個 Tnode 的位寬,
就可以增加其所能表示的最大 chunk Id;另一種手段是我們后面將看到的 chunk group,
通過將若干個 chunk 合成一組用同一個 id 來表示,也可以增加系統所能尋址的 chunk 范圍。
俺為了簡單,分析的時候不考慮這兩種情況,因此 tnodeWidth 取默認值 16,也不考慮將
多個 chunk 合成一組的情況,只在遇到跟這兩種情況有關的代碼時作簡單說明。
在 32 位的系統中,指針的寬度為 32 位,而 chunk id 的寬度為 16 位,因此相同大小的
Tnode 組,可以用來表示 N 個非葉 Tnode(作為指針使用),也可以用來表示 N * 2 個葉子
Tnode(作為 chunk id 使用)。代碼中分別用 YAFFS_NTNODES_INTERNAL 和
YAFFS_NTNODES_LEVEL0 來表示。前者取值為 8,后者取值為 16。從這里我們也可以看出
若將 yaffs2 用於 64 位系統需要作哪些修改。針對上一段敘述的問題,俺以為在內存不緊
張的情況下,不如將葉節點 Tnode 和非葉節點 Tnode 都設為一個指針的長度。
分配得到所需的內存后,就將這些空閑空間組成 Tnode 鏈表:
for(i = 0; i < nTnodes -1; i++) {
curr = (yaffs_Tnode *) &mem[i * tnodeSize];
next = (yaffs_Tnode *) &mem[(i+1) * tnodeSize];
curr->internal[0] = next;
}
每組 Tnode 的第一個元素作為指針指向下一組 Tnode。完成鏈表構造后,還要遞增統計量,
並將新得到的 Tnodes 掛入一個全局管理鏈表 yaffs_TnodeList:
dev->nFreeTnodes += nTnodes;
dev->nTnodesCreated += nTnodes;
tnl = YMALLOC(sizeof(yaffs_TnodeList));
if (!tnl) {
T(YAFFS_TRACE_ERROR,
(TSTR
("yaffs: Could not add tnodes to management list" TENDSTR)));
} else {
tnl->tnodes = newTnodes;
tnl->next = dev->allocatedTnodeList;
dev->allocatedTnodeList = tnl;
}
回到 yaffs_GetTnodeRaw,創建了若干組新的 Tnode 以后,從中切下所需的 Tnode,並修
改空閑鏈表表頭指針:
if (dev->freeTnodes) {
tn = dev->freeTnodes;
dev->freeTnodes = dev->freeTnodes->internal[0];
dev->nFreeTnodes--;
}
至此,分配工作就完成了。相比較來說,釋放 Tnodes 的工作就簡單多了,簡單的鏈表和
統計值操作:
static void yaffs_FreeTnode(yaffs_Device * dev, yaffs_Tnode * tn)
{
if (tn) {
tn->internal[0] = dev->freeTnodes;
dev->freeTnodes = tn;
dev->nFreeTnodes++;
}
}
看過 Tnode 的分配和釋放,我們再來看看這些 Tnode 是如何使用的。在后文中,我
們把以 chunk 為單位的文件內偏移稱作邏輯 chunk id,文件內容在 flash 上的實際存儲位
置稱作物理 chunk id。先看一個比較簡單的函數。
void yaffs_PutLevel0Tnode(yaffs_Device *dev, yaffs_Tnode *tn, unsigned pos,
unsigned val)
這個函數將某個 Tnode 設置為指定的值。tn 是指向一組 Tnode 的指針;pos 是所要設置的
那個 Tnode 在該組 Tnode 中的索引;val 就是所要設置的值,也就是物理 chunk id。函數
名中的 Level0 指映射樹的葉節點。函數開頭幾行如下:
pos &= YAFFS_TNODES_LEVEL0_MASK;
val >>= dev->chunkGroupBits;
bitInMap = pos * dev->tnodeWidth;
wordInMap = bitInMap /32;
bitInWord = bitInMap & (32 -1);
mask = dev->tnodeMask << bitInWord;
上面說過,一組 Tnode 中的 8 個指針在葉節點這一層轉換成 16 個 16 位寬的 chunk Id,因
此需要 4 位二進制碼對其進行索引,這就是 YAFFS_TNODES_LEVEL0_MASK 的值。我們還說
過這個 16 位值就是 chunk 在 flash 上的序號,當 flash 容量比較大, chunk 數量多時,16
位可能無法給 flash 上的所有 chunk 編號,這種情況下可以增加 chunk id 的位寬,具體位
寬的值記錄在 dev->tnodeWidth 中。yaffs2 允許使用非字節對齊的 tnodeWidth,因此可
能出現某個 chunk id 跨 32 位邊界存儲的情況。所以在下面的代碼中,需要分邊界前和邊
界后兩部分處理:
map[wordInMap] &= ~mask;
map[wordInMap] |= (mask & (val << bitInWord));
if(dev->tnodeWidth > (32-bitInWord)) {
bitInWord = (32 - bitInWord);
wordInMap++;;
mask = dev->tnodeMask >> (/*dev->tnodeWidth -*/ bitInWord);
map[wordInMap] &= ~mask;
map[wordInMap] |= (mask & (val >> bitInWord));
}
if 語句判斷當前 chunk 序號是否跨越當前 32 位邊界。整個代碼初看起來比較難理解,其
實只要將 dev->tnodeWidth 以 16 或 32 代入, 就很好懂了。還有一個類似的函數
yaffs_GetChunkGroupBase,返回由 tn 和 pos 確定的一組 chunk 的起始序號,就不詳細分
析了。
現在我們假設有這樣一個情景:已知文件偏移地址,要找到 flash 上對應的存儲地址,該
怎么做呢?這項工作的主體是由函數 yaffs_FindLevel0Tnode 完成的。
static yaffs_Tnode *yaffs_FindLevel0Tnode(yaffs_Device * dev,
yaffs_FileStructure * fStruct,
__u32 chunkId)
{
yaffs_Tnode *tn = fStruct->top;
__u32 i;
int requiredTallness;
int level = fStruct->topLevel;
函數參數中,fStruct 是指向文件描述結構的指針,該結構保存着文件大小、映射樹層高、
映射樹頂層節點指針等信息。chunkId 是邏輯 chunk id。
fStruct->top 是映射樹頂層節點指針,fStruct->topLevel 是映射樹層高。注意:當只有
一層時,層高為 0。
/* First check we're tall enough (ie enough topLevel) */
i = chunkId >> YAFFS_TNODES_LEVEL0_BITS;
requiredTallness = 0;
while (i) {
i >>= YAFFS_TNODES_INTERNAL_BITS;
requiredTallness++;
}
if (requiredTallness > fStruct->topLevel) {
/* Not tall enough, so we can't find it, return NULL. */
return NULL;
}
在看這段代碼之前,我們先用一個例子來回顧一下映射樹的組成。假定我們有一個大小
為 128K 的文件,flash 的 page 大小為 2K,那么我們就需要 64 個 page(或者說 chunk)來
存儲該文件。一組 Tnode 的 size 是 8 個指針,或者 16 個 16 位整數,所以我們需要 64 / 16
= 4 組 Tnode 來存儲物理 chunk 序號。這 4 組 Tnode 就是映射樹的葉節點,也就是 Level0
節點。由於這 4 組 Tnode 在內存中不一定連續,所以我們需要另外一組 Tnode,將其作為
指針數組使用,這個指針數組的前 4 個元素分別指向 4 組 Level0 節點,而 fStruct->top
就指向這組作為指針數組使用的 Tnode。隨着文件長度的增大,所需的葉節點越多,非葉
節點也越多,樹也就越長越高。
回過頭來看代碼,首先是檢查函數參數 chunkId 是否超過文件長度。作為非葉節點使用的
Tnode 每組有 8 個指針,需要 3 位二進制碼對其進行索引,因此樹每長高一層,邏輯
chunkId 就多出 3 位。相反,每 3 位非零 chunkId 就代表一層非葉節點。while 循環根據這
個原則計算參數 chunkId 所對應的樹高。如果樹高超過了文件結構中保存的樹高,那就
說明該邏輯 chunkId 已經超出文件長度了。通過文件長度檢查之后,同樣根據上面的原則,
就可以找到邏輯 chunkId 對應的物理 chunkId 了。具體的操作通過一個 while 循環完成:
/* Traverse down to level 0 */
while (level > 0 && tn) {
tn = tn->
internal[(chunkId >>
( YAFFS_TNODES_LEVEL0_BITS +
(level - 1) *
YAFFS_TNODES_INTERNAL_BITS)
) &
YAFFS_TNODES_INTERNAL_MASK];
level--;
}
return tn;
將返回值和邏輯 chunk id 作為參數調用 yaffs_GetChunkGroupBase,就可以得到物理
chunk id 了。
下面我們看另一個情景,看看當文件長度增加的時候,映射樹是如何擴展的。主要
函數為
static yaffs_Tnode *yaffs_AddOrFindLevel0Tnode(yaffs_Device * dev,
yaffs_FileStructure * fStruct,
__u32 chunkId,
yaffs_Tnode *passedTn)
函數的前幾行和 yaffs_FindLevel0Tnode 一樣,對函數參數作一些檢查。通過檢查之后,
首先看原映射樹是否有足夠的高度,如果高度不夠,就先將其“拔高”:
if (requiredTallness > fStruct->topLevel) {
/* Not tall enough,gotta make the tree taller */
for (i = fStruct->topLevel; i < requiredTallness; i++) {
tn = yaffs_GetTnode(dev);
if (tn) {
tn->internal[0] = fStruct->top;
fStruct->top = tn;
} else {
T(YAFFS_TRACE_ERROR,
(TSTR("yaffs: no more tnodes" TENDSTR)));
}
}
fStruct->topLevel = requiredTallness;
}
for 循環完成增加新層的功能。新增的每一層都只有一個節點(即一組
Tnode),fStruct->top 始終指向最新分配的節點。將映射樹擴展到所需的高度之后,再
根據需要將其“增肥”,擴展其“寬度”:
l = fStruct->topLevel;
tn = fStruct->top;
if(l > 0) {
while (l > 0 && tn) {
x = (chunkId >>
( YAFFS_TNODES_LEVEL0_BITS +
(l - 1) * YAFFS_TNODES_INTERNAL_BITS)) &
YAFFS_TNODES_INTERNAL_MASK;
if((l>1) && !tn->internal[x]){
/* Add missing non-level-zero tnode */
tn->internal[x] = yaffs_GetTnode(dev);
} else if(l == 1) {
/* Looking from level 1 at level 0 */
if (passedTn) {
/* If we already have one, then release it.*/
if(tn->internal[x])
yaffs_FreeTnode(dev,tn->internal[x]);
tn->internal[x] = passedTn;
} else if(!tn->internal[x]) {
/* Don't have one, none passed in */
tn->internal[x] = yaffs_GetTnode(dev);
}
}
tn = tn->internal[x];
l--;
}
}
上面“拔高”的時候是從下往上“蓋樓”,這里“增肥”的時候是從上往下“擴展”。
tn->internal[x]為空表示下層節點尚未創建,需要通過 yaffs_GetTnode 分配之,就是“
增肥”了。如果函數參數 passedTn 有效,就用該組 Tnode 代替 level0 上原先的那組
Tnode;否則按需分配新的 Tnode 組。所以這里的函數名似乎應該取作
yaffs_AddOrFindOrReplaceLevel0Tnode 更加恰當。不過這個新名字也太長了些......
樹的創建、搜索和擴展說完了,下面該說什么?......對了,收縮和刪除。不過看過創建搜
索擴展之后,收縮和刪除已經沒什么味道了。主要函數有:
yaffs_DeleteWorker()
yaffs_SoftDeleteWorker()
yaffs_PruneWorker()
前兩者用於刪除,第三個用於收縮。都是從 level0 開始,以遞歸的方式從葉節點向上刪,
並釋放被刪除 Tnode 所對應的物理 chunk。遞歸,偉大的遞歸啊......俺不想把這篇文章做
成遞歸算法教程,除了遞歸這三個函數也就不剩啥了,所以一概從略。唯一要說的就是
yaffs_DeleteWorker 和 yaffs_SoftDeleteWorker 的區別,這兩個函數非常類似,只是在
釋放物理 chunk 的時候分別調用 yaffs_DeleteChunk 和 yaffs_SoftDeleteChunk。其中函
數 yaffs_DeleteWorker 在 yaffs2 中似乎是不用的,而 yaffs_SoftDeleteWorker 主要用於
在刪除文件時資源的釋放。

7.文件系統對象
在 yaffs2 中,不管是文件還是目錄或者是鏈接,在內存都用一個結構體
yaffs_ObjectStruct 來描述。我們先簡要介紹一下這個結構體中的幾個關鍵字段,然后
再來看代碼。在后文中提到“文件”或“文件對象”,若不加特別說明,都指廣義的“文
件”,既可以是文件,也可以是目錄。
__u8 deleted:1; /* This should only apply to unlinked files. */
__u8 softDeleted:1; /* it has also been soft deleted */
__u8 unlinked:1; /* An unlinked file. The file should be in the unlinked
directory.*/
這三個字段用於描述該文件對象在刪除過程中所處的階段。在刪除文件時,首先要將文件
從原目錄移至一個特殊的系統目錄/unlinked,以此拒絕應用程序對該文件的訪問,此時
將 unlinked 置 1;然后判斷該文件長度是否為 0,如果為 0,該文件就可以直接刪除,此時
將 deleted 置 1;如果不為 0,就將 deleted 和 softDelted 都置 1,表明該文件數據所占據
的 chunk 還沒有釋放,要留待后繼處理。
struct yaffs_ObjectStruct *parent;
看名字就知道,該指針指向上層目錄。
int chunkId;
每個文件在 flash 上都有一個文件頭,存儲着該文件的大小、所有者、創建修改時間等信
息。chunkId 就是該文件頭在 flash 上的 chunk 序號。
__u32 objectId; /* the object id value */
每一個文件系統對象都被賦予一個唯一的編號,作為對象標識,也用於將該對象掛入一個
散列表,加快對象的搜索速度。
yaffs_ObjectType variantType;
yaffs_ObjectVariant variant;
前者表示該對象的類型,是目錄、普通文件還是鏈接文件。后者是一個聯合體,根據對象
類型的不同有不同的解釋。
其余的成員變量,我們在后面結合函數一起分析。
下面我們來看相關的函數。先看一個簡單的:
static yaffs_Object *yaffs_CreateFakeDirectory(yaffs_Device * dev, int number,
__u32 mode)
所謂 Fake Directory,就是僅存在於內存中,用於管理目的的目錄對象,比如我們上面提
到的 unlinked 目錄。這種類型的目錄有一些特別的地方,如禁止改名、禁止刪除等。由
於對象僅存在於內存中,因此不涉及對硬件的操作,所以函數體很簡單。首先通過
yaffs_CreateNewObject 獲得一個新對象,然后對其中的一些字段初始化。先把字段初始
化看一下,順便再介紹一些字段:
renameAllowed 表示是否允許改名,對於 fake 對象為 0;
unlinkAllowed 表示是否允許刪除,對於 fake 對象同樣為 0;
yst_mode 就是 linux 中的訪問權限位;
chunkId 是對象頭所在 chunk,由於 fake 對象不占 flash 存儲空間,所以置 0。
回過頭來看 yaffs_CreateNewObject:
[yaffs_CreateFakeDirectory --> yaffs_CreateNewObject]
yaffs_Object *yaffs_CreateNewObject(yaffs_Device * dev, int number,
yaffs_ObjectType type)
{
yaffs_Object *theObject;
if (number < 0) {
number = yaffs_CreateNewObjectNumber(dev);
}
theObject = yaffs_AllocateEmptyObject(dev);
前面說過,每個 yaffs_Object 都有一個唯一的序列號,這個序號既可以在創建對象的時
候由上層函數指定,也可以由系統分配。如果 number < 0,那就表示由系統分配。序列號
分配函數是 yaffs_CreateNewObjectNumber。我們就不深入到這個函數內部了,只說明一
下該函數做了些什么:
系統為了方便根據對象 id 找到對象本身,將每個對象都通過指針 hashLink 掛入了一個散
列表,散列函數是 number % 256,所以這個散列表有 256 個表項。
yaffs_CreateNewObjectNumber 函數每次搜索 10 個表項,從中選取掛接鏈表長度最短的那
一項,再根據表索引試圖計算出一個和該索引上掛接對象的 id 號不重復的 id。
分配到了 id 號和空閑對象后,再根據對象類型的不同作不同的處理。我們主要關心兩種
情況,就是對象類型分別為文件和目錄的時候:
case YAFFS_OBJECT_TYPE_FILE:
theObject->variant.fileVariant.fileSize = 0;
theObject->variant.fileVariant.scannedFileSize = 0;
theObject->variant.fileVariant.shrinkSize = 0xFFFFFFFF; /* max __u32 */
theObject->variant.fileVariant.topLevel = 0;
theObject->variant.fileVariant.top = yaffs_GetTnode(dev);
break;
case YAFFS_OBJECT_TYPE_DIRECTORY:
INIT_LIST_HEAD(&theObject->variant.directoryVariant.children);
break;
fileSize 很好理解;topLevel 就是映射樹層高,新建的文件層高為 0。還要預先分配一組
Tnode 供該對象使用。 scannedFileSize 和 shrinkSize 用於 yaffs2 初始化時的 flash 掃描
階段,這里先跳過。如果該對象是目錄,那么所做的工作只是初始化子對象(就是該目
錄下的文件或子目錄)雙向鏈表指針,前后指針都指向鏈表頭自身。
看過 Fake 對象創建,我們再看看普通對象的創建。按對象類型的不同,有四個函數分別
用於創建普通文件、目錄、設備文件、符號鏈接和硬鏈接,它們分別是:
yaffs_MknodFile;
yaffs_MknodDirectory;
yaffs_MknodSpecial;
yaffs_MknodSymLink;
yaffs_Link
這四個函數最終都調用 yaffs_MknodObject 來完成創建對象的工作,只是調用參數不一樣。
static yaffs_Object *yaffs_MknodObject(yaffs_ObjectType type,
yaffs_Object * parent,
const YCHAR * name,
__u32 mode,
__u32 uid,
__u32 gid,
yaffs_Object * equivalentObject,
const YCHAR * aliasString, __u32 rdev)
函數參數中,前面幾個都很好理解,分別是對象類型,上級目錄對象,文件名,訪問權限,
文件所屬 user id 和 group id; equivalentObject 是創建硬鏈接時的原始文件對象;
aliasString 是 symLink 名稱;rdev 是設備文件的設備號。
函數首先檢查在父目錄中是否已存在同名文件,然后同樣調用 yaffs_CreateNewObject 創
建新對象。參數-1 表示由系統自行選擇對象 id。
if (in) {
in->chunkId = -1;
in->valid = 1;
in->variantType = type;
in->yst_mode = mode;
in->yst_atime = in->yst_mtime = in->yst_ctime = Y_CURRENT_TIME;
in->yst_rdev = rdev;
in->yst_uid = uid;
in->yst_gid = gid;
in->nDataChunks = 0;
yaffs_SetObjectName(in, name);
in->dirty = 1;
yaffs_AddObjectToDirectory(parent, in);
in->myDev = parent->myDev;
這里列出的代碼省略了和 wince 相關的條件編譯部分。chunkId 是對象頭所在 chunk,現在
還沒有將對象寫入 flash,所以置為-1;該新對象暫時還沒有數據,所以 nDataChunks 是
0。in->dirty = 1 表示該新對象信息還沒有寫入 flash。然后通過
yaffs_AddObjectToDirectory 將新對象掛入父對象的子對象鏈表。接下來根據對象類型
作不同處理:
switch (type) {
case YAFFS_OBJECT_TYPE_SYMLINK:
in->variant.symLinkVariant.alias =
yaffs_CloneString(aliasString);
break;
case YAFFS_OBJECT_TYPE_HARDLINK:
in->variant.hardLinkVariant.equivalentObject =
equivalentObject;
in->variant.hardLinkVariant.equivalentObjectId =
equivalentObject->objectId;
list_add(&in->hardLinks, &equivalentObject->hardLinks);
break;
case YAFFS_OBJECT_TYPE_FILE:
case YAFFS_OBJECT_TYPE_DIRECTORY:
case YAFFS_OBJECT_TYPE_SPECIAL:
case YAFFS_OBJECT_TYPE_UNKNOWN:
/* do nothing */
break;
}
對於最常用的文件對象和目錄對象不做任何處理;如果是 hardlink,就將新對象掛入原對
象的 hardLinks 鏈表。從這里我們可以看出,yaffs2 在內存中是以鏈表的形式處理
hardlink 的。在將 hardlink 存儲到 flash 上的時候,則是通過 objectId 將兩者關聯起來。
Hardlink 本身占用一個 chunk 存儲對象頭。
最后,通過 yaffs_UpdateObjectHeader 將新對象頭寫入 flash。

8. Yaffs2的垃圾收集機制
yaffs2的垃圾收集過程實際上包括兩個方面：
·一是對那些不再使用的page作物理上的刪除。我們在前面介紹chunk釋放函數的時候曾經看到，yaffs2在刪除chunk的時候僅僅是修改內存中的統計量，而真正的刪除工作要留到垃圾收集的時候做。
·二是處理壞塊。在對flash進行寫操作的時候，我們也許要使用過一個block上的若干page之后才發現這是一個壞塊，此時該塊上已經有部分有用數據了，在垃圾收集的時候要對這種情況進行處理。
flash在使用過一段時間之后，滿足以上兩種情況的block也許不止一個，那么，yaffs2按照什么樣的原則挑選合適的塊進行回收呢？我們看下面的函數：
static int yaffs_BlockNotDisqualifiedFromGC(yaffs_Device * dev,
yaffs_BlockInfo * bi)
這個函數用來判定給定的塊bi是否可以回收。
if (!dev->isYaffs2)
return 1; /* disqualification only applies to yaffs2. */
if (!bi->hasShrinkHeader)
return 1; /* can gc */
我們主要關心yaffs2。首先介紹一下什么是 hasShrinkHeader。
還是要提到yaffs2的“軟”刪除機制。假定我們現在需要減小一個文件的長度，比如從128K縮減到64K，在執行close()系統調用之后，yaffs2會將新的大小寫入文件頭，而這個文件頭是會立即寫入flash的，但是由於yaffs2使用軟刪除機制，原先那后面64K數據仍然殘留在 flash上，也就是說，出現了文件頭和文件內容不一致的情況。此時就將文件頭所在block的描述信息中的一個字段hasShrinkHeader置 1，表明在垃圾回收時需要特別的處理。如果hasShrinkHeader＝0，那么該塊是不需要特別的處理，是可以回收的；但是如果 hasShrinkHeader＝1，那就需要注意了：如果我們所做的不僅僅是文件尺寸的收縮，而是文件的刪除，並且在物理刪除文件內容之前通過垃圾收集機制將文件頭刪掉了，那么殘留的文件內容就成了“沒娘要的孩子”，難以處理了。所以，我們必須先處理文件的殘留內容，然后處理文件頭。下面我們來看看yaffs2是如何實現處理這個目標的：

/* Find the oldest dirty sequence number if we don't know it and save it
* so we don't have to keep recomputing it.
*/
if (!dev->oldestDirtySequence) {
seq = dev->sequenceNumber;
for (i = dev->internalStartBlock; i <= dev->internalEndBlock; i++) {
b = yaffs_GetBlockInfo(dev, i);
if (b->blockState == YAFFS_BLOCK_STATE_FULL && (b->pagesInUse - b->softDeletions) <
dev->nChunksPerBlock && b->sequenceNumber < seq) {
seq = b->sequenceNumber;
}
}
dev->oldestDirtySequence = seq;
}
/* Can't do gc of this block if there are any blocks older than this one that have
* discarded pages.
*/
return (bi->sequenceNumber <= dev->oldestDirtySequence);

在分析這段代碼之前，我們再來回顧一下yaffs2的chunk分配過程和特點。如前文所述，yaffs2在分配chunk的時候遵循兩個原則：一是在block內部嚴格從低地址的chunk向高地址的chunk按次序分配，二是一定要將一個block內的page全部分配完畢后才另行選擇 block進行分配。而且在分配的時候每挑選一個block就會遞增一個序號。這樣我們從block的序號就可以推斷出該block的分配順序。
除此之外，yaffs2會在應用程序作clsoe()系統調用的時候將新的文件頭寫入flash。因此，我們可以作出這樣的結論：文件頭所在block的序號，一定大於等於文件內容所在block的序號。這樣，如果一個block信息結構內的hasShrinkHeader字段為1，並且該block的序號在系統中最小，我們就可以認為該block上的所有文件頭對應的文件已經沒有殘余信息留在flash上了——這些殘余信息如果存在，它們所在block的序號一定更小。有了這個結論，上面的代碼就不難理解了，所以就不作解釋了。
這個函數返回之后，我們就知道函數參數所指向的block是否可以回收了。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 u-boot-2016.03 支持yaffs2文件系統燒寫之添加nand write.yaffs2命令 btrfs文件系統分析 Sys文件系統分析 Linux根文件系統分析之init和busybox 【轉】星際2技能系統分析嵌入式系統中的幾種文件系統的比較和優缺點(CRAMFS JFFS2 YAFFS2 Initrd SquashFS EXT4)【轉】 Mini2440之linux根文件系統yaffs2移植 yaffs文件系統 stm32 fatfs 文件系統分析和代碼解析 Ext4文件系統架構分析(二)