[Mark] KVM 虛擬化基本原理

使用巨頁，KVM的虛擬機的頁表將使用更少的內存，並且將提高CPU的效率。最高情況下，可以提高20%的效率！

大頁面和透明大頁面（THP）

x86 CPU 通常會在 4kB 頁面中處理內存，但可以使用更大的 2MB 或 1GB 頁面，即 huge page（大頁面）。大頁面內存可以支持 KVM 客機部署，通過增加點擊轉換后備緩沖器（TLB）的 CPU 緩存以改善性能。

kernel 功能將在 Red Hat Enterprise Linux 7 中默認啟用，大頁面可以大幅提高性能，尤其是對於較大的內存和內存密集型的負載。Red Hat Enterprise Linux 7 可以通過使用大頁面增加頁面大小，以便有效管理大量內存。

過程 7.1. 為客機啟用 1GB 大頁面

Red Hat Enterprise Linux 7.1 系統支持 2MB 或 1GB 大頁面，分配將在啟動或運行時進行。頁面大小均可以在運行時被釋放。例如，在啟動時分配 4 個 1GB 的大頁面和 1,024 個 2MB 的大頁面，請使用以下命令行：
```
'default_hugepagesz=1G hugepagesz=1G hugepages=4 hugepagesz=2M hugepages=1024'
```
此外，大頁面還可以在運行時分配。運行時分配允許系統管理員選擇從何種 NUMA 模式分配頁面。然而由於內存碎片的存在，運行時的頁面分配會比啟動時分配更容易造成分配失敗。以下運行時的分配示例顯示了從 node1 分配 4 個 1GB 的大頁面以及從 node3 分配 1,024 個 2MB 的大頁面：
```
# echo 4 > /sys/devices/system/node/node1/hugepages/hugepages-1048576kB/nr_hugepages
# echo 1024 > /sys/devices/system/node/node3/hugepages/hugepages-2048kB/nr_hugepages
```

接下來，將 2MB 和 1GB 的大頁面掛載到主機：

# mkdir /dev/hugepages1G
# mount -t hugetlbfs -o pagesize=1G none /dev/hugepages1G
# mkdir /dev/hugepages2M
# mount -t hugetlbfs -o pagesize=2M none /dev/hugepages2M

默認1GB 大頁面現在對客機不可用。客戶機中要想使用1G大內存頁，需要如下配置：

在以下示例中，客機 NUMA 節點 0-5（不包括 NUMA 節點 4）將會使用 1 GB 的大頁面，客機 NUMA 節點 4 將使用 2 MB 的大頁面，無論客機 NUMA 節點在主機的任何位置。

<memoryBacking>
        <hugepages/>
          <page size="1" unit="G" nodeset="0-3,5"/>
          <page size="2" unit="M" nodeset="4"/>
        </hugepages>
</memoryBacking>

透明大頁面（THP，transparent huge page）將為性能自動優化系統設置。通過允許所有的空余內存被用作緩存以提高性能。

一旦 /sys/kernel/mm/transparent_hugepage/enabled 被設置為 always，透明大頁面將被默認使用。運行以下命令禁用透明大頁面：

# echo never > /sys/kernel/mm/transparent_hugepage/enabled

透明大頁面支持不能阻止 hugetlbfs 的使用。但在 hugetlbfs 未使用時，KVM 將使用透明大頁面來替代常規的 4KB 頁面大小

例子：

使用方法，需要三部：

mkdir /dev/hugepages

mount -t hugetlbfs hugetlbfs /dev/hugepages

#保留一些內存給巨頁
sysctl vm.nr_hugepages=2048 （使用 x86_64 系統時，這相當於從物理內存中保留了2048 x 2M = 4GB 的空間來給虛擬機使用）

#給 kvm 傳遞參數 hugepages
qemu-kvm - qemu-kvm -mem-path /dev/hugepages

也可以在配置文件里加入：

<memoryBacking>
<hugepages/>
</memoryBacking>

驗證方式，當虛擬機正常啟動以后，在物理機里查看：

cat /proc/meminfo |grep -i hugepages

smp 設置的值	線程數	線程
4	8	1 個主線程（I/O 線程）、4 個 vCPU 線程、3 個其它線程
6	10	1 個主線程（I/O 線程）、6 個 vCPU 線程、3 個其它線程

[Mark] KVM 虛擬化基本原理

1.1 基於二進制翻譯的全虛擬化（Full Virtualization with Binary Translation）

1.2. 超虛擬化（或者半虛擬化/操作系統輔助虛擬化 Paravirtualization）

1.3. 硬件輔助的全虛擬化

大頁面和透明大頁面（THP）

免責聲明！