YAFFS2文件系統分析(轉)


http://blog.chinaunix.net/uid-25314474-id-343665.html

1.前言
略。

2.yaffs 文件系統簡介
按理說這里應該出現一些諸如“yaffs 是一種適合於 NAND Flash 的文件系統 XXXXX”之類
的字眼,不過考慮到網絡上關於 yaffs/yaffs2 的介紹已經多如牛毛,所以同上,略。
3.本文內容組織

本文將模仿《linux 內核源代碼情景分析》一書,以情景分析的方式對 yaffs2 文件系統的
源代碼進行分析。首先將分析幾組底層函數,如存儲空間的分配和釋放等;其次分析文件
邏輯地址映射;然后是垃圾收集機制;接下來......Sorry,本人還沒想好。:-)

4.說明
因為 yaffs2 貌似還在持續更新中,所以本文所列代碼可能和讀者手中的代碼不完全一致。
另外,本文讀者應熟悉 C 語言,熟悉 NAND Flash 的基本概念(如 block 和 page)。
Ok,步入正題。首先分析存儲空間的分配。

5.NAND Flash 存儲空間分配和釋放
我們知道,NAND Flash 的基本擦除單位是 Block,而基本寫入單位是 page。yaffs2 在分配
存儲空間的時候是以 page 為單位的,不過在 yaffs2 中把基本 存儲單位稱為 chunk,和
page 是一樣的大小,在大多數情況下和 page 是一個意思。在下文中我們使用 chunk 這個
詞,以保持和 yaffs2 的源代 碼一致。
我們先看存儲空間的分配(在 yaffs_guts.c 中。這個文件也是 yaffs2 文件系統的核心部分):
static int yaffs_AllocateChunk(yaffs_Device * dev, int useReserve,
yaffs_BlockInfo **blockUsedPtr)
{
int retVal;
yaffs_BlockInfo *bi;
if (dev->allocationBlock < 0) {
/* Get next block to allocate off */
dev->allocationBlock = yaffs_FindBlockForAllocation(dev);
dev->allocationPage = 0;
}
函數有三個參數,dev 是 yaffs_Device 結構的指針,yaffs2 用這個結構來記錄一個 NAND
器件的屬性(如 block 和 page 的大小)和 系統運行過程中的一些統計值(如器件中可用
chunk 的總數),還用這個結構維護着一組 NAND 操作函數(如讀、寫、刪除)的指針。
整個結構體比較大,我 們會按情景的不同分別分析。useReserve 表示是否使用保留空間。
yaffs2 文件系統並不會將所有的存儲空間全部用於存儲文件系統數據,而要空出 部分
block 用於垃圾收集時使用。一般情況下這個參數都是 0,只有在垃圾收集時需要分配存
儲空間的情況下將該參數置 1。yaffs_BlockInfo 是描述 block 屬性的結構,主要由一些統
計變量組成,比如該 block 內還剩多少空閑 page 等。我們同樣在具體情景中再分析這個結
構中的字段含義。
函數首先判斷 dev->allocationBlock 的值是否小於 0。yaffs_Device 結構內的
allocationBlock 字段用於 記錄當前從中分配 chunk(page)的那個 block 的序號。當一
個 block 內的所有 page 全部分配完畢時,就將這個字段置為-1,下次進入該函 數時就會
重新挑選空閑的 block。這里我們假定需要重新挑選空閑 block,因此進入
yaffs_FindBlockForAllocation 函數:
[yaffs_AllocateChunk() => yaffs_FindBlockForAllocation()]
static int yaffs_FindBlockForAllocation(yaffs_Device * dev)
{
int i;
yaffs_BlockInfo *bi;
if (dev->nErasedBlocks < 1) {
/* Hoosterman we've got a problem.
* Can't get space to gc
*/
T(YAFFS_TRACE_ERROR,
(TSTR("yaffs tragedy: no more eraased blocks" TENDSTR)));
return -1;
}
dev->nErasedBlocks 記錄着器件內所有可供分配的 block 的數量。如果該值小於 1,那顯
然是有問題了。不但正常的分配請求無法完成,就連垃圾收集都辦不到了。
for (i = dev->internalStartBlock; i <= dev->internalEndBlock; i++) {
dev->allocationBlockFinder++;
if (dev->allocationBlockFinder < dev->internalStartBlock
|| dev->allocationBlockFinder > dev->internalEndBlock) {
dev->allocationBlockFinder = dev->internalStartBlock;
internalStartBlock 和 internalEndBlock 分別是 yaffs2 使用的 block 的起始序號和結束
序號。也就是說 yaffs2 文件系統不一定要占據整個 Flash,可以只占用其中的一部分。
dev->allocationBlockFinder 記錄着上次分配的塊的序號。如果已經分配到系統尾部,就
從頭重新開始搜索可用塊。
bi = yaffs_GetBlockInfo(dev, dev->allocationBlockFinder);
if (bi->blockState == YAFFS_BLOCK_STATE_EMPTY) {
bi->blockState = YAFFS_BLOCK_STATE_ALLOCATING;
dev->sequenceNumber++;
bi->sequenceNumber = dev->sequenceNumber;
dev->nErasedBlocks--;
T(YAFFS_TRACE_ALLOCATE,
(TSTR("Allocated block %d, seq %d, %d left" TENDSTR),
dev->allocationBlockFinder, dev->sequenceNumber,
dev->nErasedBlocks));
return dev->allocationBlockFinder;
}
yaffs_GetBlockInfo 函數獲取指向 block 信息結構的指針,該函數比較簡單,就不詳細介
紹了。yaffs_BlockInfo 結構中的 blockState 成員描述該 block 的狀態,比如空,滿,已
損壞,當前分配中,等等。因為是要分配空閑塊,所以塊狀態必須是
YAFFS_BLOCK_STATE_EMPTY,如果不是,就繼續測試下一個 block。找到以后將 block 狀
態修改為 YAFFS_BLOCK_STATE_ALLOCATING,表示當前正從該 block 中分配存儲空間。正
常情況下,系統中只會有一個 block 處於該狀 態。另外還要更新統計量 ErasedBlocks 和
sequenceNumber。這個 sequenceNumber 記錄着各 block 被分配出去的先后 順序,以后在
垃圾收集的時候會以此作為判斷該 block 是否適合回收的依據。
現在讓我們返回到函數 yaffs_AllocateChunk 中。yaffs_CheckSpaceForAllocation()函數
檢查 Flash 上是否有足夠的可用空間,通過檢查后,就從當前供分配的 block 上切下一個
chunk:
if (dev->allocationBlock >= 0) {
bi = yaffs_GetBlockInfo(dev, dev->allocationBlock);
retVal = (dev->allocationBlock * dev->nChunksPerBlock) +
dev->allocationPage;
bi->pagesInUse++;
yaffs_SetChunkBit(dev, dev->allocationBlock,
dev->allocationPage);
dev->allocationPage++;
dev->nFreeChunks--;
/* If the block is full set the state to full */
if (dev->allocationPage >= dev->nChunksPerBlock) {
bi->blockState = YAFFS_BLOCK_STATE_FULL;
dev->allocationBlock = -1;
}
if(blockUsedPtr)
*blockUsedPtr = bi;
return retVal;
}
dev->allocationPage 記錄着上次分配的 chunk 在 block 中的序號,每分配一次加 1。從這
里我們可以看出,系統在分配 chunk 的時候是從 block 的開頭到結尾按序分配的,直到一
個 block 內的所有 chunk 全部分配完畢為止。retVal 是該 chunk 在整個 device 內的總序
號。PagesInUse 記錄着該 block 中已分配使用的 page 的數量。
系統在設備描述結構 yaffs_Device 中維護着一張位圖,該位圖的每一位都代表着 Flash
上的一個 chunk 的狀態。yaffs_SetChunkBit()將剛分配得到的 chunk 在位圖中的對應位置
1,表明該塊已被使用。更新一些統計量后,就可以返回了。
看過 chunk 分配以后,我們再來 chunk 的釋放。和 chunk 分配不同的是,chunk 的
釋放在大多數情況下並不釋放對應的物理介質,這是因為 NAND 雖然可以按 page 寫,但
只能按 block 擦除,所以物理介質的釋放要留到垃圾收集或一個 block 上的所有 page 全部
變成空閑的時候才進行。 根據應用場合的不同,chunk 的釋放方式並不唯一,分別由
yaffs_DeleteChunk 函數和 yaffs_SoftDeleteChunk 函數完 成。我們先看
yaffs_DeleteChunk:
void yaffs_DeleteChunk(yaffs_Device * dev, int chunkId, int markNAND, int lyn)
chunkId 就是要刪除的 chunk 的序號,markNand 參數用於 yaffs 一代的代碼中,yaffs2 不
使用該參數。
參數 lyn 在調用該函數時置成當前行號(__LINE__),用於調試。
首先通過 yaffs_GetBlockInfo 獲得 chunk 所在 block 的信息描述結構指針,然后就跑到
else 里面去了。if 語句的判斷條件中有一 條!dev->isYaffs2,所以對於 yaffs2 而言是不
會執行 if 分支的。在 else 分支里面只是遞增一下統計計數就出來了,我們接着往下 看。
if (bi->blockState == YAFFS_BLOCK_STATE_ALLOCATING ||
bi->blockState == YAFFS_BLOCK_STATE_FULL ||
bi->blockState == YAFFS_BLOCK_STATE_NEEDS_SCANNING ||
bi->blockState == YAFFS_BLOCK_STATE_COLLECTING) {
dev->nFreeChunks++;
yaffs_ClearChunkBit(dev, block, page);
bi->pagesInUse--;
if (bi->pagesInUse == 0 &&
!bi->hasShrinkHeader &&
bi->blockState != YAFFS_BLOCK_STATE_ALLOCATING &&
bi->blockState != YAFFS_BLOCK_STATE_NEEDS_SCANNING) {
yaffs_BlockBecameDirty(dev, block);
}
} else {
/* T(("Bad news deleting chunk %d\n",chunkId)); */
}
首先要判斷一下該 block 上是否確實存在着可釋放的 chunk。block 不能為空,不能是壞塊。
YAFFS_BLOCK_STATE_NEEDS_SCANNING 表明正對該塊進行垃圾回收,我們后面會分析;
YAFFS_BLOCK_STATE_NEEDS_SCANNING 在我手上的源代碼中似乎沒有用到。
通過判斷以后,所做的工作和 chunk 分配函數類似,只是一個遞增統計值,一個遞減。遞
減統計值以后還要判斷該 block 上的 page 是否已全部釋放,如 果已全部釋放,並且不是
當前分配塊,就通過 yaffs_BlockBecameDirty 函數刪除該 block,只要能通過刪除操作
(不是壞塊),該 block 就又可以用於分配了。
相比較來說,yaffs_SoftDeleteChunk 所做的工作就簡單多了。關鍵的代碼只有兩行:
static void yaffs_SoftDeleteChunk(yaffs_Device * dev, int chunk)
{
......
theBlock->softDeletions++;
dev->nFreeChunks++;
......
}
這里遞增的是 yaffs_blockInfo 結構中的另一個統計量 softDeletions,而沒有修改
pagesInUse 成員,也沒有修改 chunk 狀態位圖。那么,這兩個函數的應用場合有什么區別
呢?
一般來說,yaffs_DeleteChunk 用於文件內容的更新。比如我們要修改文件中的部分內容,
這時候 yaffs2 會分配新的 chunk,將更改后的內容寫入新 chunk 中,原 chunk 的內容自然
就沒有用了,所以要將 pageInUse 減 1,並修改位圖;
yaffs_SoftDeleteChunk 用於文件的刪除。yaffs2 在刪除文件的時候只是刪除該文件在內
存中的一些描述結構,而被刪除的文件所占用 的 chunk 不會立即釋放,也就是不會刪除
文件內容,在后續的文件系統操作中一般也不會把這些 chunk 分配出去,直到系統進行垃
圾收集的時候才有選擇地 釋放這些 chunk。熟悉 DOS 的朋友可能還記得,DOS 在刪除的文
件的時候也不會立即刪除文件內容,只是將文件名的第一個字符修改為 0xA5,事后還可
以恢復文件內容。yaffs2 在這點上是類似的。

6.文件地址映射
上面說到,yaffs 文件系統在更新文件數據的時候,會分配一塊新的 chunk,也就是說,
同樣的文件偏移地址,在該地址上的數據更新前和更新后,其對應 的 flash 上的存儲地
址是不一樣的。那么,如何根據文件內偏移地址確定 flash 存儲地址呢?最容易想到的辦
法,就是在內存中維護一張映射表。由於 flash 基本存儲單位是 chunk,因此,只要將以
chunk 描述的文件偏移量作為表索引,將 flash chunk 序號作為表內容,就可以解決該問
題了。但是這個方法有幾個問題,首先就是在做 seek 操作的時候,要從表項 0 開始按序搜
索,對於大文件會消耗很 多時間;其次是在建立映射表的時候,無法預計文件大小的變
化,於是就可能在后來的操作中頻繁釋放分配內存以改變表長,造成內存碎片。yaffs 的
解決方法 是將這張大的映射表拆分成若干個等長的小表,並將這些小表組織成樹的結構,
方便管理。我們先看小表的定義:
union yaffs_Tnode_union {
union yaffs_Tnode_union *internal[YAFFS_NTNODES_INTERNAL];
}
YAFFS_NTNODES_INTERNAL 定義為(YAFFS_NTNODES_LEVEL0 / 2),而
YAFFS_NTNODES_LEVEL0 定義為 16,所以這實際上是一個長度為 8 的指針數組。不管是葉
子節點還是非葉節點,都是這個結構。當節點為非葉 節點時,數組中的每個元素都指向
下一層子節點;當節點為葉子節點時,該數組拆分為 16 個 16 位長的短整數(也有例外,后
面會說到),該短整數就是文件內容 在 flash 上的存儲位置(即 chunk 序號)。至於如何
通過文件內偏移找到對應的 flash 存儲位置,源代碼所附文檔
(Development/yaffs/Documentation/yaffs-notes2.html)已經有說明,俺就不在此處饒
舌了。下面看具體 函數。
為了行文方便,后文中將 yaffs_Tnode 這個指針數組稱為“一組”Tnode,而將數組
中的每個元素稱為“一個”Tnode。樹中的每個節點,都是“一組”Tnode。
先看映射樹的節點的分配。
static yaffs_Tnode *yaffs_GetTnode(yaffs_Device * dev)
{
yaffs_Tnode *tn = yaffs_GetTnodeRaw(dev);
if(tn)
memset(tn, 0, (dev->tnodeWidth * YAFFS_NTNODES_LEVEL0)/8);
return tn;
}
調用 yaffs_GetTnodeRaw 分配節點,然后將得到的節點初始化為零。
static yaffs_Tnode *yaffs_GetTnodeRaw(yaffs_Device * dev)
{
yaffs_Tnode *tn = NULL;
/* If there are none left make more */
if (!dev->freeTnodes) {
yaffs_CreateTnodes(dev, YAFFS_ALLOCATION_NTNODES);
}
當前所有空閑節點組成一個鏈表,dev->freeTnodes 是這個鏈表的表頭。我們假定已經沒
有空閑節點可用,需通過 yaffs_CreateTnodes 創建一批新的節點。
static int yaffs_CreateTnodes(yaffs_Device * dev, int nTnodes)
{
......
tnodeSize = (dev->tnodeWidth * YAFFS_NTNODES_LEVEL0)/8;
newTnodes = YMALLOC(nTnodes * tnodeSize);
mem = (__u8 *)newTnodes;
上面說過,葉節點中一個 Tnode 的位寬默認為 16 位,也就是可以表示 65536 個 chunk。對
於時下的大容量 flash,chunk 的大小為 2K,因 此在默認情況下 yaffs2 所能尋址的最大
flash 空間就是 128M。為了能將 yaffs2 用於大容量 flash 上,代碼作者試圖通過兩種手段
解決這個 問題。第一種手段就是這里的 dev->tnodeWidth,通過增加單個 Tnode 的位寬,
就可以增加其所能表示的最大 chunk Id;另一種手段是我們后面將看到的 chunk group,
通過將若干個 chunk 合成一組用同一個 id 來表示,也可以增加系統所能尋址的 chunk 范圍。
俺為了簡單,分析的時候不考慮這兩種情況,因 此 tnodeWidth 取默認值 16,也不考慮將
多個 chunk 合成一組的情況,只在遇到跟這兩種情況有關的代碼時作簡單說明。
在 32 位的系統中,指針的寬度為 32 位,而 chunk id 的寬度為 16 位,因此相同大小的
Tnode 組,可以用來表示 N 個非葉 Tnode(作為指針使用),也可以用來表示 N * 2 個葉子
Tnode(作為 chunk id 使用)。代碼中分別用 YAFFS_NTNODES_INTERNAL 和
YAFFS_NTNODES_LEVEL0 來表示。前者取值為 8,后者取值為 16。從這里我們也可以看出
若將 yaffs2 用於 64 位系統需要作哪些修改。 針對上一段敘述的問題,俺以為在內存不緊
張的情況下,不如將葉節點 Tnode 和非葉節點 Tnode 都設為一個指針的長度。
分配得到所需的內存后,就將這些空閑空間組成 Tnode 鏈表:
for(i = 0; i < nTnodes -1; i++) {
curr = (yaffs_Tnode *) &mem[i * tnodeSize];
next = (yaffs_Tnode *) &mem[(i+1) * tnodeSize];
curr->internal[0] = next;
}
每組 Tnode 的第一個元素作為指針指向下一組 Tnode。完成鏈表構造后,還要遞增統計量,
並將新得到的 Tnodes 掛入一個全局管理鏈表 yaffs_TnodeList:
dev->nFreeTnodes += nTnodes;
dev->nTnodesCreated += nTnodes;
tnl = YMALLOC(sizeof(yaffs_TnodeList));
if (!tnl) {
T(YAFFS_TRACE_ERROR,
(TSTR
("yaffs: Could not add tnodes to management list" TENDSTR)));
} else {
tnl->tnodes = newTnodes;
tnl->next = dev->allocatedTnodeList;
dev->allocatedTnodeList = tnl;
}
回到 yaffs_GetTnodeRaw,創建了若干組新的 Tnode 以后,從中切下所需的 Tnode,並修
改空閑鏈表表頭指針:
if (dev->freeTnodes) {
tn = dev->freeTnodes;
dev->freeTnodes = dev->freeTnodes->internal[0];
dev->nFreeTnodes--;
}
至此,分配工作就完成了。相比較來說,釋放 Tnodes 的工作就簡單多了,簡單的鏈表和
統計值操作:
static void yaffs_FreeTnode(yaffs_Device * dev, yaffs_Tnode * tn)
{
if (tn) {
tn->internal[0] = dev->freeTnodes;
dev->freeTnodes = tn;
dev->nFreeTnodes++;
}
}
看過 Tnode 的分配和釋放,我們再來看看這些 Tnode 是如何使用的。在后文中,我
們把以 chunk 為單位的文件內偏移稱作邏輯 chunk id,文件內容在 flash 上的實際存儲位
置稱作物理 chunk id。先看一個比較簡單的函數。
void yaffs_PutLevel0Tnode(yaffs_Device *dev, yaffs_Tnode *tn, unsigned pos,
unsigned val)
這個函數將某個 Tnode 設置為指定的值。tn 是指向一組 Tnode 的指針;pos 是所要設置的
那個 Tnode 在該組 Tnode 中的索引;val 就是所要設置的值,也就是物理 chunk id。函數
名中的 Level0 指映射樹的葉節點。函數開頭幾行如下:
pos &= YAFFS_TNODES_LEVEL0_MASK;
val >>= dev->chunkGroupBits;
bitInMap = pos * dev->tnodeWidth;
wordInMap = bitInMap /32;
bitInWord = bitInMap & (32 -1);
mask = dev->tnodeMask << bitInWord;
上面說過,一組 Tnode 中的 8 個指針在葉節點這一層轉換成 16 個 16 位寬的 chunk Id,因
此需要 4 位二進制碼對其進行索引,這就是 YAFFS_TNODES_LEVEL0_MASK 的值。我們還說
過這個 16 位值就是 chunk 在 flash 上的序號,當 flash 容量比較大, chunk 數量多時,16
位可能無法給 flash 上的所有 chunk 編號,這種情況下可以增加 chunk id 的位寬,具體位
寬的值記錄在 dev->tnodeWidth 中。yaffs2 允許使用非字節對齊的 tnodeWidth,因此可
能出現某個 chunk id 跨 32 位邊界存儲的情況。所以在下面的代碼中,需要分邊界前和邊
界后兩部分處理:
map[wordInMap] &= ~mask;
map[wordInMap] |= (mask & (val << bitInWord));
if(dev->tnodeWidth > (32-bitInWord)) {
bitInWord = (32 - bitInWord);
wordInMap++;;
mask = dev->tnodeMask >> (/*dev->tnodeWidth -*/ bitInWord);
map[wordInMap] &= ~mask;
map[wordInMap] |= (mask & (val >> bitInWord));
}
if 語句判斷當前 chunk 序號是否跨越當前 32 位邊界。整個代碼初看起來比較難理解,其
實只要將 dev->tnodeWidth 以 16 或 32 代入, 就很好懂了。還有一個類似的函數
yaffs_GetChunkGroupBase,返回由 tn 和 pos 確定的一組 chunk 的起始序號,就不詳細分
析了。
現在我們假設有這樣一個情景:已知文件偏移地址,要找到 flash 上對應的存儲地址,該
怎么做呢?這項工作的主體是由函數 yaffs_FindLevel0Tnode 完成的。
static yaffs_Tnode *yaffs_FindLevel0Tnode(yaffs_Device * dev,
yaffs_FileStructure * fStruct,
__u32 chunkId)
{
yaffs_Tnode *tn = fStruct->top;
__u32 i;
int requiredTallness;
int level = fStruct->topLevel;
函數參數中,fStruct 是指向文件描述結構的指針,該結構保存着文件大小、映射樹層高、
映射樹頂層節點指針等信息。chunkId 是邏輯 chunk id。
fStruct->top 是映射樹頂層節點指針,fStruct->topLevel 是映射樹層高。注意:當只有
一層時,層高為 0。
/* First check we're tall enough (ie enough topLevel) */
i = chunkId >> YAFFS_TNODES_LEVEL0_BITS;
requiredTallness = 0;
while (i) {
i >>= YAFFS_TNODES_INTERNAL_BITS;
requiredTallness++;
}
if (requiredTallness > fStruct->topLevel) {
/* Not tall enough, so we can't find it, return NULL. */
return NULL;
}
在 看這段代碼之前,我們先用一個例子來回顧一下映射樹的組成。假定我們有一個大小
為 128K 的文件,flash 的 page 大小為 2K,那么我們就需要 64 個 page(或者說 chunk)來
存儲該文件。一組 Tnode 的 size 是 8 個指針,或者 16 個 16 位整數,所以我們需要 64 / 16
= 4 組 Tnode 來存儲物理 chunk 序號。這 4 組 Tnode 就是映射樹的葉節點,也就是 Level0
節點。由於這 4 組 Tnode 在內存中不一定連續,所以 我們需要另外一組 Tnode,將其作為
指針數組使用,這個指針數組的前 4 個元素分別指向 4 組 Level0 節點,而 fStruct->top
就指向這 組作為指針數組使用的 Tnode。隨着文件長度的增大,所需的葉節點越多,非葉
節點也越多,樹也就越長越高。
回過頭來看代碼,首先是檢查函數參數 chunkId 是否超過文件長度。作為非葉節點使用的
Tnode 每組有 8 個指針,需要 3 位二進制碼對其進行索引,因此 樹每長高一層,邏輯
chunkId 就多出 3 位。相反,每 3 位非零 chunkId 就代表一層非葉節點。while 循環根據這
個原則計算參數 chunkId 所 對應的樹高。如果樹高超過了文件結構中保存的樹高,那就
說明該邏輯 chunkId 已經超出文件長度了。通過文件長度檢查之后,同樣根據上面的原則,
就可以 找到邏輯 chunkId 對應的物理 chunkId 了。具體的操作通過一個 while 循環完成:
/* Traverse down to level 0 */
while (level > 0 && tn) {
tn = tn->
internal[(chunkId >>
( YAFFS_TNODES_LEVEL0_BITS +
(level - 1) *
YAFFS_TNODES_INTERNAL_BITS)
) &
YAFFS_TNODES_INTERNAL_MASK];
level--;
}
return tn;
將返回值和邏輯 chunk id 作為參數調用 yaffs_GetChunkGroupBase,就可以得到物理
chunk id 了。
下面我們看另一個情景,看看當文件長度增加的時候,映射樹是如何擴展的。主要
函數為
static yaffs_Tnode *yaffs_AddOrFindLevel0Tnode(yaffs_Device * dev,
yaffs_FileStructure * fStruct,
__u32 chunkId,
yaffs_Tnode *passedTn)
函數的前幾行和 yaffs_FindLevel0Tnode 一樣,對函數參數作一些檢查。通過檢查之后,
首先看原映射樹是否有足夠的高度,如果高度不夠,就先將其“拔高”:
if (requiredTallness > fStruct->topLevel) {
/* Not tall enough,gotta make the tree taller */
for (i = fStruct->topLevel; i < requiredTallness; i++) {
tn = yaffs_GetTnode(dev);
if (tn) {
tn->internal[0] = fStruct->top;
fStruct->top = tn;
} else {
T(YAFFS_TRACE_ERROR,
(TSTR("yaffs: no more tnodes" TENDSTR)));
}
}
fStruct->topLevel = requiredTallness;
}
for 循環完成增加新層的功能。新增的每一層都只有一個節點(即一組
Tnode),fStruct->top 始終指向最新分配的節點。將映射樹擴展到所需的高度之后,再
根據需要將其“增肥”,擴展其“寬度”:
l = fStruct->topLevel;
tn = fStruct->top;
if(l > 0) {
while (l > 0 && tn) {
x = (chunkId >>
( YAFFS_TNODES_LEVEL0_BITS +
(l - 1) * YAFFS_TNODES_INTERNAL_BITS)) &
YAFFS_TNODES_INTERNAL_MASK;
if((l>1) && !tn->internal[x]){
/* Add missing non-level-zero tnode */
tn->internal[x] = yaffs_GetTnode(dev);
} else if(l == 1) {
/* Looking from level 1 at level 0 */
if (passedTn) {
/* If we already have one, then release it.*/
if(tn->internal[x])
yaffs_FreeTnode(dev,tn->internal[x]);
tn->internal[x] = passedTn;
} else if(!tn->internal[x]) {
/* Don't have one, none passed in */
tn->internal[x] = yaffs_GetTnode(dev);
}
}
tn = tn->internal[x];
l--;
}
}
上面“拔高”的時候是從下往上“蓋樓”,這里“增肥”的時候是從上往下“擴展”。
tn->internal[x]為空表示下層節點尚未創建,需要通過 yaffs_GetTnode 分配之,就是“
增肥”了。如果函數參數 passedTn 有效,就用該組 Tnode 代替 level0 上原先的那組
Tnode;否則按需分配新的 Tnode 組。所以這里的函數名似乎應該取作
yaffs_AddOrFindOrReplaceLevel0Tnode 更加恰當。不過這個新名字也太長了些......
樹的創建、搜索和擴展說完了,下面該說什么?......對了,收縮和刪除。不過看過創建搜
索擴展之后,收縮和刪除已經沒什么味道了。主要函數有:
yaffs_DeleteWorker()
yaffs_SoftDeleteWorker()
yaffs_PruneWorker()
前兩者用於刪除,第三個用於收縮。都是從 level0 開始,以遞歸的方式從葉節點向上刪,
並釋放被刪除 Tnode 所對應的物理 chunk。遞歸,偉大的遞 歸啊......俺不想把這篇文章做
成遞歸算法教程,除了遞歸這三個函數也就不剩啥了,所以一概從略。唯一要說的就是
yaffs_DeleteWorker 和 yaffs_SoftDeleteWorker 的區別,這兩個函數非常類似,只是在
釋放物理 chunk 的時候分別調用 yaffs_DeleteChunk 和 yaffs_SoftDeleteChunk。其中函
數 yaffs_DeleteWorker 在 yaffs2 中似乎是不用的,而 yaffs_SoftDeleteWorker 主要用於
在刪除文件時資源的釋放。

7.文件系統對象
在 yaffs2 中,不管是文件還是目錄或者是鏈接,在內存都用一個結構體
yaffs_ObjectStruct 來描述。我們先簡要介紹一下這個結構體中的 幾個關鍵字段,然后
再來看代碼。在后文中提到“文件”或“文件對象”,若不加特別說明,都指廣義的“文
件”,既可以是文件,也可以是目錄。
__u8 deleted:1; /* This should only apply to unlinked files. */
__u8 softDeleted:1; /* it has also been soft deleted */
__u8 unlinked:1; /* An unlinked file. The file should be in the unlinked
directory.*/
這三個字段用於描述該文件對象在刪除過程中所處的階段。在刪除文件時,首先要將文件
從原目錄移至一個特殊的系統目錄/unlinked,以此拒絕應用程序 對該文件的訪問,此時
將 unlinked 置 1;然后判斷該文件長度是否為 0,如果為 0,該文件就可以直接刪除,此時
將 deleted 置 1;如果不為 0,就 將 deleted 和 softDelted 都置 1,表明該文件數據所占據
的 chunk 還沒有釋放,要留待后繼處理。
struct yaffs_ObjectStruct *parent;
看名字就知道,該指針指向上層目錄。
int chunkId;
每個文件在 flash 上都有一個文件頭,存儲着該文件的大小、所有者、創建修改時間等信
息。chunkId 就是該文件頭在 flash 上的 chunk 序號。
__u32 objectId; /* the object id value */
每一個文件系統對象都被賦予一個唯一的編號,作為對象標識,也用於將該對象掛入一個
散列表,加快對象的搜索速度。
yaffs_ObjectType variantType;
yaffs_ObjectVariant variant;
前者表示該對象的類型,是目錄、普通文件還是鏈接文件。后者是一個聯合體,根據對象
類型的不同有不同的解釋。
其余的成員變量,我們在后面結合函數一起分析。
下面我們來看相關的函數。先看一個簡單的:
static yaffs_Object *yaffs_CreateFakeDirectory(yaffs_Device * dev, int number,
__u32 mode)
所謂 Fake Directory,就是僅存在於內存中,用於管理目的的目錄對象,比如我們上面提
到的 unlinked 目錄。這種類型的目錄有一些特別的地方,如禁止改 名、禁止刪除等。由
於對象僅存在於內存中,因此不涉及對硬件的操作,所以函數體很簡單。首先通過
yaffs_CreateNewObject 獲得一個新對 象,然后對其中的一些字段初始化。先把字段初始
化看一下,順便再介紹一些字段:
renameAllowed 表示是否允許改名,對於 fake 對象為 0;
unlinkAllowed 表示是否允許刪除,對於 fake 對象同樣為 0;
yst_mode 就是 linux 中的訪問權限位;
chunkId 是對象頭所在 chunk,由於 fake 對象不占 flash 存儲空間,所以置 0。
回過頭來看 yaffs_CreateNewObject:
[yaffs_CreateFakeDirectory --> yaffs_CreateNewObject]
yaffs_Object *yaffs_CreateNewObject(yaffs_Device * dev, int number,
yaffs_ObjectType type)
{
yaffs_Object *theObject;
if (number < 0) {
number = yaffs_CreateNewObjectNumber(dev);
}
theObject = yaffs_AllocateEmptyObject(dev);
前面說過,每個 yaffs_Object 都有一個唯一的序列號,這個序號既可以在創建對象的時
候由上層函數指定,也可以由系統分配。如果 number < 0,那就表示由系統分配。序列號
分配函數是 yaffs_CreateNewObjectNumber。我們就不深入到這個函數內部了,只說明一
下該函數做了些什么:
系統為了方便根據對象 id 找到對象本身,將每個對象都通過指針 hashLink 掛入了一個散
列表,散列函數是 number % 256,所以這個散列表有 256 個表項。
yaffs_CreateNewObjectNumber 函數每次搜索 10 個表項,從中選取掛接鏈表長度最短的那
一項,再根據表索引試圖計算出一個和該索引上掛接對象的 id 號不重復的 id。
分配到了 id 號和空閑對象后,再根據對象類型的不同作不同的處理。我們主要關心兩種
情況,就是對象類型分別為文件和目錄的時候:
case YAFFS_OBJECT_TYPE_FILE:
theObject->variant.fileVariant.fileSize = 0;
theObject->variant.fileVariant.scannedFileSize = 0;
theObject->variant.fileVariant.shrinkSize = 0xFFFFFFFF; /* max __u32 */
theObject->variant.fileVariant.topLevel = 0;
theObject->variant.fileVariant.top = yaffs_GetTnode(dev);
break;
case YAFFS_OBJECT_TYPE_DIRECTORY:
INIT_LIST_HEAD(&theObject->variant.directoryVariant.children);
break;
fileSize 很好理解;topLevel 就是映射樹層高,新建的文件層高為 0。還要預先分配一組
Tnode 供該對象使用。 scannedFileSize 和 shrinkSize 用於 yaffs2 初始化時的 flash 掃描
階段,這里先跳過。如果該對象是目錄,那么所做的工作只 是初始化子對象(就是該目
錄下的文件或子目錄)雙向鏈表指針,前后指針都指向鏈表頭自身。
看過 Fake 對象創建,我們再看看普通對象的創建。按對象類型的不同,有四個函數分別
用於創建普通文件、目錄、設備文件、符號鏈接和硬鏈接,它們分別是:
yaffs_MknodFile;
yaffs_MknodDirectory;
yaffs_MknodSpecial;
yaffs_MknodSymLink;
yaffs_Link
這四個函數最終都調用 yaffs_MknodObject 來完成創建對象的工作,只是調用參數不一樣。
static yaffs_Object *yaffs_MknodObject(yaffs_ObjectType type,
yaffs_Object * parent,
const YCHAR * name,
__u32 mode,
__u32 uid,
__u32 gid,
yaffs_Object * equivalentObject,
const YCHAR * aliasString, __u32 rdev)
函數參數中,前面幾個都很好理解,分別是對象類型,上級目錄對象,文件名,訪問權限,
文件所屬 user id 和 group id; equivalentObject 是創建硬鏈接時的原始文件對象;
aliasString 是 symLink 名稱;rdev 是設備文件的設備號。
函數首先檢查在父目錄中是否已存在同名文件,然后同樣調用 yaffs_CreateNewObject 創
建新對象。參數-1 表示由系統自行選擇對象 id。
if (in) {
in->chunkId = -1;
in->valid = 1;
in->variantType = type;
in->yst_mode = mode;
in->yst_atime = in->yst_mtime = in->yst_ctime = Y_CURRENT_TIME;
in->yst_rdev = rdev;
in->yst_uid = uid;
in->yst_gid = gid;
in->nDataChunks = 0;
yaffs_SetObjectName(in, name);
in->dirty = 1;
yaffs_AddObjectToDirectory(parent, in);
in->myDev = parent->myDev;
這里列出的代碼省略了和 wince 相關的條件編譯部分。chunkId 是對象頭所在 chunk,現在
還沒有將對象寫入 flash,所以置為-1;該新對象 暫時還沒有數據,所以 nDataChunks 是
0。in->dirty = 1 表示該新對象信息還沒有寫入 flash。然后通過
yaffs_AddObjectToDirectory 將新對象掛入父對象的子對象鏈表。接下來根據對 象類型
作不同處理:
switch (type) {
case YAFFS_OBJECT_TYPE_SYMLINK:
in->variant.symLinkVariant.alias =
yaffs_CloneString(aliasString);
break;
case YAFFS_OBJECT_TYPE_HARDLINK:
in->variant.hardLinkVariant.equivalentObject =
equivalentObject;
in->variant.hardLinkVariant.equivalentObjectId =
equivalentObject->objectId;
list_add(&in->hardLinks, &equivalentObject->hardLinks);
break;
case YAFFS_OBJECT_TYPE_FILE:
case YAFFS_OBJECT_TYPE_DIRECTORY:
case YAFFS_OBJECT_TYPE_SPECIAL:
case YAFFS_OBJECT_TYPE_UNKNOWN:
/* do nothing */
break;
}
對於最常用的文件對象和目錄對象不做任何處理;如果是 hardlink,就將新對象掛入原對
象的 hardLinks 鏈表。從這里我們可以看出,yaffs2 在內存中是以鏈表的形式處理
hardlink 的。在將 hardlink 存儲到 flash 上的時 候,則是通過 objectId 將兩者關聯起來。
Hardlink 本身占用一個 chunk 存儲對象頭。
最后,通過 yaffs_UpdateObjectHeader 將新對象頭寫入 flash。

8. Yaffs2的垃圾收集機制
yaffs2的垃圾收集過程實際上包括兩個方面:
·一是對那些不再使用的page作物理上的刪除。我們在前面介紹chunk釋放函數的時候曾經看到,yaffs2在刪除chunk的時候僅僅是修改內存中的統計量,而真正的刪除工作要留到垃圾收集的時候做。
·二是處理壞塊。在對flash進行寫操作的時候,我們也許要使用過一個block上的若干page之后才發現這是一個壞塊,此時該塊上已經有部分有用數據了,在垃圾收集的時候要對這種情況進行處理。
flash在使用過一段時間之后,滿足以上兩種情況的block也許不止一個,那么,yaffs2按照什么樣的原則挑選合適的塊進行回收呢?我們看下面的函數:
static int yaffs_BlockNotDisqualifiedFromGC(yaffs_Device * dev,
yaffs_BlockInfo * bi)
這個函數用來判定給定的塊bi是否可以回收。
if (!dev->isYaffs2)
return 1; /* disqualification only applies to yaffs2. */
if (!bi->hasShrinkHeader)
return 1; /* can gc */
我們主要關心yaffs2。首先介紹一下什么是 hasShrinkHeader。
還是要提到yaffs2的“軟”刪除機制。假定我們現在需要減小一個文件的長度,比如從128K縮減到64K,在執行close()系統調用之 后,yaffs2會將新的大小寫入文件頭,而這個文件頭是會立即寫入flash的,但是由於yaffs2使用軟刪除機制,原先那后面64K數據仍然殘留在 flash上,也就是說,出現了文件頭和文件內容不一致的情況。此時就將文件頭所在block的描述信息中的一個字段hasShrinkHeader置 1,表明在垃圾回收時需要特別的處理。如果hasShrinkHeader=0,那么該塊是不需要特別的處理,是可以回收的;但是如果 hasShrinkHeader=1,那就需要注意了:如果我們所做的不僅僅是文件尺寸的收縮,而是文件的刪除,並且在物理刪除文件內容之前通過垃圾收集 機制將文件頭刪掉了,那么殘留的文件內容就成了“沒娘要的孩子”,難以處理了。所以,我們必須先處理文件的殘留內容,然后處理文件頭。下面我們來看看yaffs2是如何實現處理這個目標的:

  1. /* Find the oldest dirty sequence number if we don't know it and save it
  2. * so we don't have to keep recomputing it.
  3. */
  4. if (!dev->oldestDirtySequence) {
  5.    seq = dev->sequenceNumber;
  6.    for (i = dev->internalStartBlock; i <= dev->internalEndBlock; i++) {
  7.        b = yaffs_GetBlockInfo(dev, i);
  8.        if (b->blockState == YAFFS_BLOCK_STATE_FULL && (b->pagesInUse - b->softDeletions) <
  9. dev->nChunksPerBlock && b->sequenceNumber < seq) {
  10.             seq = b->sequenceNumber;
  11.        }
  12.    }
  13.    dev->oldestDirtySequence = seq;
  14. }
  15. /* Can't do gc of this block if there are any blocks older than this one that have
  16. * discarded pages.
  17. */
  18. return (bi->sequenceNumber <= dev->oldestDirtySequence);


在分析這段代碼之前,我們再來回顧一下yaffs2的chunk分配過程和特點。如前文所述,yaffs2在分配chunk的時候遵循兩個原則: 一是在block內部嚴格從低地址的chunk向高地址的chunk按次序分配,二是一定要將一個block內的page全部分配完畢后才另行選擇 block進行分配。而且在分配的時候每挑選一個block就會遞增一個序號。這樣我們從block的序號就可以推斷出該block的分配順序。
除此之外,yaffs2會在應用程序作clsoe()系統調用的時候將新的文件頭寫入flash。因此,我們可以作出這樣的結論:文件頭所在block的序號,一定大於等於文件內容所在block的序號。 這樣,如果一個block信息結構內的hasShrinkHeader字段為1,並且該block的序號在系統中最小,我們就可以認為該block上的所 有文件頭對應的文件已經沒有殘余信息留在flash上了——這些殘余信息如果存在,它們所在block的序號一定更小。有了這個結論,上面的代碼就不難理 解了,所以就不作解釋了。
這個函數返回之后,我們就知道函數參數所指向的block是否可以回收了。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM