【原創】（二）Linux物理內存初始化

本文轉載自查看原文 2019-08-31 23:13 2335 linux/ Linux內存管理/ 內存管理

背景

Read the fucking source code! --By 魯迅
A picture is worth a thousand words. --By 高爾基

說明：

Kernel版本：4.14
ARM64處理器，Contex-A53，雙核
使用工具：Source Insight 3.5， Visio

1. 介紹

讓我們思考幾個朴素的問題？

系統是怎么知道物理內存的？
在內存管理真正初始化之前，內核的代碼執行需要分配內存該怎么處理？

我們先來嘗試回答第一個問題，看過dts文件的同學應該見過memory的節點，以arch/arm64/boot/dts/freescale/fsl-ls208xa.dtsi為例：

	memory@80000000 {
		device_type = "memory";
		reg = <0x00000000 0x80000000 0 0x80000000>;
		      /* DRAM space - 1, size : 2 GB DRAM */
	};

這個節點描述了內存的起始地址及大小，事實上內核在解析dtb文件時會去讀取該memory節點的內容，從而將檢測到的內存注冊進系統。

那么新的問題又來了？Uboot會將kernel image和dtb拷貝到內存中，並且將dtb物理地址告知kernel，kernel需要從該物理地址上讀取到dtb文件並解析，才能得到最終的內存信息，dtb的物理地址需要映射到虛擬地址上才能訪問，但是這個時候paging_init還沒有調用，也就是說物理地址的映射還沒有完成，那該怎么辦呢？沒錯，Fixed map機制出現了。

第二個問題答案：當所有物理內存添加進系統后，在mm_init之前，系統會使用memblock模塊來對內存進行管理。

開啟探索之旅吧！

2. early_fixmap_init

簡單來說，Fixed map指的是虛擬地址中的一段區域，在該區域中所有的線性地址是在編譯階段就確定好的，這些虛擬地址需要在boot階段去映射到物理地址上。
來張圖片看看虛擬地址空間：

圖中 fixed: 0xffffffbefe7fd000 - 0xffffffbefec00000，描述的就是Fixed map的區域。

那么這段區域中的詳細一點的布局是怎樣呢？看看arch/arm64/include/asm/fixmap.h中的enum fixed_address結構就清晰了，圖來了：

從圖中可以看出，如果要訪問DTB所在的物理地址，那么需要將該物理地址映射到Fixed map中的區域，然后訪問該區域中的虛擬地址即可。訪問IO空間也是一樣的道理，下文也會講述到。

那么來看看early_fixmap_init函數的關鍵代碼吧：

void __init early_fixmap_init(void)
{
	pgd_t *pgd;
	pud_t *pud;
	pmd_t *pmd;
	unsigned long addr = FIXADDR_START;              /* (1) */

	pgd = pgd_offset_k(addr);           /* (2) */
	if (CONFIG_PGTABLE_LEVELS > 3 &&
	    !(pgd_none(*pgd) || pgd_page_paddr(*pgd) == __pa_symbol(bm_pud))) {
		/*
		 * We only end up here if the kernel mapping and the fixmap
		 * share the top level pgd entry, which should only happen on
		 * 16k/4 levels configurations.
		 */
		BUG_ON(!IS_ENABLED(CONFIG_ARM64_16K_PAGES));
		pud = pud_offset_kimg(pgd, addr);
	} else {
		if (pgd_none(*pgd))
			__pgd_populate(pgd, __pa_symbol(bm_pud), PUD_TYPE_TABLE);          /* (3) */
		pud = fixmap_pud(addr);
	}
	if (pud_none(*pud))
		__pud_populate(pud, __pa_symbol(bm_pmd), PMD_TYPE_TABLE);    /* (4) */
	pmd = fixmap_pmd(addr);
	__pmd_populate(pmd, __pa_symbol(bm_pte), PMD_TYPE_TABLE);        /* (5) */
......
}

關鍵點：

FIXADDR_START，定義了Fixed map區域的起始地址，位於arch/arm64/include/asm/fixmap.h中；
pgd_offset_k(addr)，獲取addr地址對應pgd全局頁表中的entry，而這個pgd全局頁表正是swapper_pg_dir全局頁表；
將bm_pud的物理地址寫到pgd全局頁目錄表中；
將bm_pmd的物理地址寫到pud頁目錄表中；
將bm_pte的物理地址寫到pmd頁表目錄表中；

bm_pud/bm_pmd/bm_pte是三個全局數組，相當於是中間的頁表，存放各級頁表的entry，定義如下：

static pte_t bm_pte[PTRS_PER_PTE] __page_aligned_bss;
static pmd_t bm_pmd[PTRS_PER_PMD] __page_aligned_bss __maybe_unused;
static pud_t bm_pud[PTRS_PER_PUD] __page_aligned_bss __maybe_unused;

事實上，early_fixmap_init只是建立了一個映射的框架，具體的物理地址和虛擬地址的映射沒有去填充，這個是由使用者具體在使用時再去填充對應的pte entry。比如像fixmap_remap_fdt()函數，就是典型的填充pte entry的過程，完成最后的一步映射，然后才能讀取dtb文件。

來一張圖片就懂了，是透徹的懂了：

3. early_ioremap_init

如果在boot早期需要操作IO設備的話，那么ioremap就用上場了，由於跟實際的內存管理關系不太大，不再太深入的分析。

簡單來說，ioremap的空間為7 * 256K的區域，保存在slot_vir[]數組中，當需要進行IO操作的時候，最終會調用到__early_ioremap函數，在該函數中去填充對應的pte entry，從而完成最終的虛擬地址和物理地址的映射。

4. memblock

上文講的內容都只是鋪墊，為了能正確訪問DTB文件並且解析得到物理地址信息。從入口到最終添加的調用過程如下圖：

所以，這個章節的重點就是memblock模塊，這個是早期的內存分配管理器，我不禁想起了之前在Nuttx中的內存池實現了，細節已然不太清晰了，但是框架性的思維都大同小異。

4.1 結構體

總共由三個數據結構來描述：

struct memblock定義了一個全局變量，用來維護所有的物理內存；
struct memblock_type代表系統中的內存類型，包括實際使用的內存和保留的內存；
struct memblock_region用來描述具體的內存區域，包含在struct memblock_type中的regions數組中，最多可以存放128個。

直接上個代碼吧：

static struct memblock_region memblock_memory_init_regions[INIT_MEMBLOCK_REGIONS] __initdata_memblock;
static struct memblock_region memblock_reserved_init_regions[INIT_MEMBLOCK_REGIONS] __initdata_memblock;
#ifdef CONFIG_HAVE_MEMBLOCK_PHYS_MAP
static struct memblock_region memblock_physmem_init_regions[INIT_PHYSMEM_REGIONS] __initdata_memblock;
#endif

struct memblock memblock __initdata_memblock = {
	.memory.regions		= memblock_memory_init_regions,
	.memory.cnt		= 1,	/* empty dummy entry */
	.memory.max		= INIT_MEMBLOCK_REGIONS,
	.memory.name		= "memory",

	.reserved.regions	= memblock_reserved_init_regions,
	.reserved.cnt		= 1,	/* empty dummy entry */
	.reserved.max		= INIT_MEMBLOCK_REGIONS,
	.reserved.name		= "reserved",

#ifdef CONFIG_HAVE_MEMBLOCK_PHYS_MAP
	.physmem.regions	= memblock_physmem_init_regions,
	.physmem.cnt		= 1,	/* empty dummy entry */
	.physmem.max		= INIT_PHYSMEM_REGIONS,
	.physmem.name		= "physmem",
#endif

	.bottom_up		= false,
	.current_limit		= MEMBLOCK_ALLOC_ANYWHERE,
};

定義的memblock為全局變量，在定義的時候就進行了初始化。初始化的時候，regions指向的也是靜態全局的數組，其中數組的大小為INIT_MEMBLOCK_REGIONS，也就是128個，限制了這些內存塊的個數了，實際在代碼中可以看到，當超過這個數值時，數組會以2倍的速度動態擴大。

初始化完了后，大體是這個樣子的：

4.2 memblock_add/memblock_remove

memblock子模塊，基本的邏輯都是圍繞內存的添加和移除操作來展開，最終是通過調用memblock_add_range/memblock_remove_range來實現的。

memblock_add_range：

圖中的左側是函數的執行流程圖，執行效果是右側部分。右側部分畫的是一個典型的情況，實際的情況可能有多種，但是核心的邏輯都是對插入的region進行判斷，如果出現了物理地址范圍重疊的部分，那就進行split操作，最終對具有相同flag的region進行merge操作。

memblock_remove_range
該函數執行的一個典型case效果如下圖所示：

假如現在需要移除掉一片區域，而該區域跨越了多個region，則會先調用memblock_isolate_range來對這片區域進行切分，最后再調用memblock_remove_region對區域范圍內的region進行移除操作。

當調用memblock_alloc函數進行地址分配時，最后也是調用memblock_add_range來實現的，申請的這部分內存最終會添加到reserved類型中，畢竟已經分配出去了，其他人也不應該使用了。

5. arm64_memblock_init

當物理內存都添加進系統之后，arm64_memblock_init會對整個物理內存進行整理，主要的工作就是將一些特殊的區域添加進reserved內存中。函數執行完后，如下圖所示：

其中淺綠色的框表示的都是保留的內存區域，剩下的部分就是可以實際去使用的內存了。

物理內存大體面貌就有了，后續就需要進行內存的頁表映射，完成實際的物理地址到虛擬地址的映射了。

那就待續吧。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Linux內存管理 (1)物理內存初始化 Linux讀寫物理內存 Linux內存初始化(一) Linux物理內存和虛擬內存 Linux內存初始化(三) 內存布局 LInux中的物理內存管理 Linux 物理內存 buffer cache 避免物理內存碎片化 Linux查看物理內存信息 Linux 虛擬內存和物理內存的理解