/proc/<pid>/maps簡要分析

定位內存泄漏基本上是從宏觀到微觀，進而定位到代碼位置。

從/proc/meminfo可以看到整個系統內存消耗情況，使用top可以看到每個進程的VIRT(虛擬內存)和RES(實際占用內存)，基本上就可以將泄漏內存定位到進程范圍。

之前也大概了解過/proc/self/maps，基於里面信息能大概判斷泄露的內存的屬性，是哪個區域在泄漏、對應哪個文件。輔助工具procmem輸出更可讀的maps信息。

下面分別從進程地址空間各段划分、maps和段如何對應、各段異常如何定位三方面展開。

1.進程地址空間划分

1.1 段及其作用

首先通過下圖簡單看一下，進程地址空間從低地址開始依次是代碼段(Text)、數據段(Data)、BSS段、堆、內存映射段(mmap)、棧。

1.1.1 代碼段(text)

代碼段也稱正文段或文本段，通常用於存放程序執行代碼(即CPU執行的機器指令)。一般C語言執行語句都編譯成機器代碼保存在代碼段。通常代碼段是可共享的，因此頻繁執行的程序只需要在內存中擁有一份拷貝即可。

代碼段通常屬於只讀，以防止其他程序意外地修改其指令(對該段的寫操作將導致段錯誤)。某些架構也允許代碼段為可寫，即允許修改程序。

代碼段指令根據程序設計流程依次執行，對於順序指令，只會執行一次(每個進程)；若有反復，則需使用跳轉指令；若進行遞歸，則需要借助棧來實現。

代碼段指令中包括操作碼和操作對象(或對象地址引用)。若操作對象是立即數(具體數值)，將直接包含在代碼中；若是局部數據，將在棧區分配空間，然后引用該數據地址；若位於BSS段和數據段，同樣引用該數據地址。

代碼段最容易受優化措施影響。

1.1.2 數據段(Data)

數據段通常用於存放程序中已初始化且初值不為0的全局變量和靜態局部變量。數據段屬於靜態內存分配(靜態存儲區)，可讀可寫。

數據段保存在目標文件中(在嵌入式系統里一般固化在鏡像文件中)，其內容由程序初始化。例如，對於全局變量int gVar = 10，必須在目標文件數據段中保存10這個數據，然后在程序加載時復制到相應的內存。

數據段與BSS段的區別如下：

1) BSS段不占用物理文件尺寸，但占用內存空間；數據段占用物理文件，也占用內存空間。

對於大型數組如int ar0[10000] = {1, 2, 3, ...}和int ar1[10000]，ar1放在BSS段，只記錄共有10000*4個字節需要初始化為0，而不是像ar0那樣記錄每個數據1、2、3...，此時BSS為目標文件所節省的磁盤空間相當可觀。

2) 當程序讀取數據段的數據時，系統會出發缺頁故障，從而分配相應的物理內存；當程序讀取BSS段的數據時，內核會將其轉到一個全零頁面，不會發生缺頁故障，也不會為其分配相應的物理內存。

運行時數據段和BSS段的整個區段通常稱為數據區。某些資料中“數據段”指代數據段 + BSS段 + 堆。

1.1.3 BSS段

BSS(Block Started by Symbol)段中通常存放程序中以下符號：

未初始化的全局變量和靜態局部變量
初始值為0的全局變量和靜態局部變量(依賴於編譯器實現)
未定義且初值不為0的符號(該初值即common block的大小)

C語言中，未顯式初始化的靜態分配變量被初始化為0(算術類型)或空指針(指針類型)。由於程序加載時，BSS會被操作系統清零，所以未賦初值或初值為0的全局變量都在BSS中。BSS段僅為未初始化的靜態分配變量預留位置，在目標文件中並不占據空間，這樣可減少目標文件體積。但程序運行時需為變量分配內存空間，故目標文件必須記錄所有未初始化的靜態分配變量大小總和(通過start_bss和end_bss地址寫入機器代碼)。當加載器(loader)加載程序時，將為BSS段分配的內存初始化為0。在嵌入式軟件中，進入main()函數之前BSS段被C運行時系統映射到初始化為全零的內存(效率較高)。

注意，盡管均放置於BSS段，但初值為0的全局變量是強符號，而未初始化的全局變量是弱符號。若其他地方已定義同名的強符號(初值可能非0)，則弱符號與之鏈接時不會引起重定義錯誤，但運行時的初值可能並非期望值(會被強符號覆蓋)。因此，定義全局變量時，若只有本文件使用，則盡量使用static關鍵字修飾；否則需要為全局變量定義賦初值(哪怕0值)，保證該變量為強符號，以便鏈接時發現變量名沖突，而不是被未知值覆蓋。

某些編譯器將未初始化的全局變量保存在common段，鏈接時再將其放入BSS段。在編譯階段可通過-fno-common選項來禁止將未初始化的全局變量放入common段。

1.1.4 堆(heap)

堆用於存放進程運行時動態分配的內存段，可動態擴張或縮減。堆中內容是匿名的，不能按名字直接訪問，只能通過指針間接訪問。當進程調用malloc(C)/new(C++)等函數分配內存時，新分配的內存動態添加到堆上(擴張)；當調用free(C)/delete(C++)等函數釋放內存時，被釋放的內存從堆中剔除(縮減) 。

分配的堆內存是經過字節對齊的空間，以適合原子操作。堆管理器通過鏈表管理每個申請的內存，由於堆申請和釋放是無序的，最終會產生內存碎片。堆內存一般由應用程序分配釋放，回收的內存可供重新使用。若程序員不釋放，程序結束時操作系統可能會自動回收。

堆的末端由break指針標識，當堆管理器需要更多內存時，可通過系統調用brk()和sbrk()來移動break指針以擴張堆，一般由系統自動調用。

使用堆時經常出現兩種問題：1) 釋放或改寫仍在使用的內存(“內存破壞”)；2)未釋放不再使用的內存(“內存泄漏”)。當釋放次數少於申請次數時，可能已造成內存泄漏。泄漏的內存往往比忘記釋放的數據結構更大，因為所分配的內存通常會圓整為下個大於申請數量的2的冪次(如申請212B，會圓整為256B)。

1.1.5 內存映射段(mmap)

此處，內核將硬盤文件的內容直接映射到內存, 任何應用程序都可通過Linux的mmap()系統調用請求這種映射。內存映射是一種方便高效的文件I/O方式，因而被用於裝載動態共享庫。用戶也可創建匿名內存映射，該映射沒有對應的文件, 可用於存放程序數據。在 Linux中，若通過malloc()請求一大塊內存，C運行庫將創建一個匿名內存映射，而不使用堆內存。”大塊” 意味着比閾值 MMAP_THRESHOLD還大，缺省為128KB，可通過mallopt()調整。

該區域用於映射可執行文件用到的動態鏈接庫。在Linux 2.4版本中，若可執行文件依賴共享庫，則系統會為這些動態庫在從0x40000000開始的地址分配相應空間，並在程序裝載時將其載入到該空間。在Linux 2.6內核中，共享庫的起始地址被往上移動至更靠近棧區的位置。

從進程地址空間的布局可以看到，在有共享庫的情況下，留給堆的可用空間還有兩處：一處是從.bss段到0x40000000，約不到1GB的空間；另一處是從共享庫到棧之間的空間，約不到2GB。這兩塊空間大小取決於棧、共享庫的大小和數量。這樣來看，是否應用程序可申請的最大堆空間只有2GB？事實上，這與Linux內核版本有關。在上面給出的進程地址空間經典布局圖中，共享庫的裝載地址為0x40000000，這實際上是Linux kernel 2.6版本之前的情況了，在2.6版本里，共享庫的裝載地址已經被挪到靠近棧的位置，即位於0xBFxxxxxx附近，因此，此時的堆范圍就不會被共享庫分割成2個“碎片”，故kernel 2.6的32位Linux系統中，malloc申請的最大內存理論值在2.9GB左右。

1.1.6 棧(stack)

棧又稱堆棧，由編譯器自動分配釋放，行為類似數據結構中的棧(先進后出)。堆棧主要有三個用途：

為函數內部聲明的非靜態局部變量(C語言中稱“自動變量”)提供存儲空間。
記錄函數調用過程相關的維護性信息，稱為棧幀(Stack Frame)或過程活動記錄(Procedure Activation Record)。它包括函數返回地址，不適合裝入寄存器的函數參數及一些寄存器值的保存。除遞歸調用外，堆棧並非必需。因為編譯時可獲知局部變量，參數和返回地址所需空間，並將其分配於BSS段。
臨時存儲區，用於暫存長算術表達式部分計算結果或alloca()函數分配的棧內內存。

持續地重用棧空間有助於使活躍的棧內存保持在CPU緩存中，從而加速訪問。進程中的每個線程都有屬於自己的棧。向棧中不斷壓入數據時，若超出其容量就會耗盡棧對應的內存區域，從而觸發一個頁錯誤。此時若棧的大小低於堆棧最大值RLIMIT_STACK(通常是8M)，則棧會動態增長，程序繼續運行。映射的棧區擴展到所需大小后，不再收縮。

Linux中ulimit -s命令可查看和設置堆棧最大值，當程序使用的堆棧超過該值時, 發生棧溢出(Stack Overflow)，程序收到一個段錯誤(Segmentation Fault)。注意，調高堆棧容量可能會增加內存開銷和啟動時間。

堆棧既可向下增長(向內存低地址)也可向上增長, 這依賴於具體的實現。本文所述堆棧向下增長。

棧的大小在運行時由內核動態調整。

1.1.7 棧和堆的區別

①管理方式：棧由編譯器自動管理；堆由程序員控制，使用方便，但易產生內存泄露。

②生長方向：棧向低地址擴展(即”向下生長”)，是連續的內存區域；堆向高地址擴展(即”向上生長”)，是不連續的內存區域。這是由於系統用鏈表來存儲空閑內存地址，自然不連續，而鏈表從低地址向高地址遍歷。

③空間大小：棧頂地址和棧的最大容量由系統預先規定(通常默認2M或10M)；堆的大小則受限於計算機系統中有效的虛擬內存，32位Linux系統中堆內存可達2.9G空間。

④存儲內容：棧在函數調用時，首先壓入主調函數中下條指令(函數調用語句的下條可執行語句)的地址，然后是函數實參，然后是被調函數的局部變量。本次調用結束后，局部變量先出棧，然后是參數，最后棧頂指針指向最開始存的指令地址，程序由該點繼續運行下條可執行語句。堆通常在頭部用一個字節存放其大小，堆用於存儲生存期與函數調用無關的數據，具體內容由程序員安排。

⑤分配方式：棧可靜態分配或動態分配。靜態分配由編譯器完成，如局部變量的分配。動態分配由alloca函數在棧上申請空間，用完后自動釋放。堆只能動態分配且手工釋放。

⑥分配效率：棧由計算機底層提供支持：分配專門的寄存器存放棧地址，壓棧出棧由專門的指令執行，因此效率較高。堆由函數庫提供，機制復雜，效率比棧低得多。Windows系統中VirtualAlloc可直接在進程地址空間中分配一塊內存，快速且靈活。

⑦分配后系統響應：只要棧剩余空間大於所申請空間，系統將為程序提供內存，否則報告異常提示棧溢出。

操作系統為堆維護一個記錄空閑內存地址的鏈表。當系統收到程序的內存分配申請時，會遍歷該鏈表尋找第一個空間大於所申請空間的堆結點，然后將該結點從空閑結點鏈表中刪除，並將該結點空間分配給程序。若無足夠大小的空間(可能由於內存碎片太多)，有可能調用系統功能去增加程序數據段的內存空間，以便有機會分到足夠大小的內存，然后進行返回。，大多數系統會在該內存空間首地址處記錄本次分配的內存大小，供后續的釋放函數(如free/delete)正確釋放本內存空間。

此外，由於找到的堆結點大小不一定正好等於申請的大小，系統會自動將多余的部分重新放入空閑鏈表中。

⑧碎片問題：棧不會存在碎片問題，因為棧是先進后出的隊列，內存塊彈出棧之前，在其上面的后進的棧內容已彈出。而頻繁申請釋放操作會造成堆內存空間的不連續，從而造成大量碎片，使程序效率降低。

可見，堆容易造成內存碎片；由於沒有專門的系統支持，效率很低；由於可能引發用戶態和內核態切換，內存申請的代價更為昂貴。所以棧在程序中應用最廣泛，函數調用也利用棧來完成，調用過程中的參數、返回地址、棧基指針和局部變量等都采用棧的方式存放。所以，建議盡量使用棧，僅在分配大量或大塊內存空間時使用堆。

使用棧和堆時應避免越界發生，否則可能程序崩潰或破壞程序堆、棧結構，產生意想不到的后果。

1.2 段和mm_struct關系

struct mm_struct是進程內存結構體，里面的參數和各段地址對應關系如下圖。

struct mm_struct {
    struct vm_area_struct *mmap;        /* list of VMAs */
...
    unsigned long mmap_base;        /* base of mmap area */
    unsigned long mmap_legacy_base;         /* base of mmap area in bottom-up allocations */...
    unsigned long start_code, end_code, start_data, end_data;
    unsigned long start_brk, brk, start_stack;
    unsigned long arg_start, arg_end, env_start, env_end;
...
    struct mm_rss_stat rss_stat;
...
};

mm_strutc數據結構和段對應關系如下：

mm_struct 內存段

2. /proc/<pid>/maps

在了解了段及其作用之后，再來看看maps中各個vma對應哪個段？

static void
show_map_vma(struct seq_file *m, struct vm_area_struct *vma, int is_pid)
{
    struct mm_struct *mm = vma->vm_mm;
    struct file *file = vma->vm_file;
    struct proc_maps_private *priv = m->private;
    vm_flags_t flags = vma->vm_flags;
    unsigned long ino = 0;
    unsigned long long pgoff = 0;
    unsigned long start, end;
    dev_t dev = 0;
    const char *name = NULL;

    if (file) {
        struct inode *inode = file_inode(vma->vm_file);
        dev = inode->i_sb->s_dev;
        ino = inode->i_ino;
        pgoff = ((loff_t)vma->vm_pgoff) << PAGE_SHIFT;------------------------------此vma第一頁在地址空間中是第幾頁。
    }

    /* We don't show the stack guard page in /proc/maps */
    start = vma->vm_start;
    end = vma->vm_end;

    seq_setwidth(m, 25 + sizeof(void *) * 6 - 1);
    seq_printf(m, "%08lx-%08lx %c%c%c%c %08llx %02x:%02x %lu ",
            start,
            end,
            flags & VM_READ ? 'r' : '-',
            flags & VM_WRITE ? 'w' : '-',
            flags & VM_EXEC ? 'x' : '-',
            flags & VM_MAYSHARE ? 's' : 'p',
            pgoff,
            MAJOR(dev), MINOR(dev), ino);-------------------------------------------首先打印maps里面前5項數據，起訖地址、屬性、偏移地址、主從設備號、inode編號。

    /*
     * Print the dentry name for named mappings, and a
     * special [heap] marker for the heap:
     */
    if (file) {---------------------------------------------------------------------如果是個文件，那么打印文件完整路徑。
        seq_pad(m, ' ');
        seq_file_path(m, file, "\n");
        goto done;
    }

    if (vma->vm_ops && vma->vm_ops->name) {
        name = vma->vm_ops->name(vma);
        if (name)
            goto done;
    }

    name = arch_vma_name(vma);
    if (!name) {
        if (!mm) {
            name = "[vdso]";---------------------------------------------------------vDSO是系統調用相關，詳細信息見vDSO。
            goto done;
        }

        if (vma->vm_start <= mm->brk &&
            vma->vm_end >= mm->start_brk) {------------------------------------------滿足start_brk <= vma <= brk，則其vma是[heap]。
            name = "[heap]";
            goto done;
        }

        if (is_stack(priv, vma))-----------------------------------------------------滿足vma包含所在地址空間的start_stack地址，則vma是[stack]。
            name = "[stack]";
    }

done:
    if (name) {
        seq_pad(m, ' ');
        seq_puts(m, name);
    }
    seq_putc(m, '\n');
}

static int is_stack(struct proc_maps_private *priv,
            struct vm_area_struct *vma)
{
    return vma->vm_start <= vma->vm_mm->start_stack &&------------------------------判斷一個vma是否屬於stack，只需要判斷start_stack是否在其區域內。
        vma->vm_end >= vma->vm_mm->start_stack;
}

3. maps實例即如何異常定位

本實例中的用戶空間地址從0x00000000到0x80000000，從地址空間划分可知，從低到高依次是：

可執行文件的代碼段、數據段、BSS段。
堆heap。
文件映射和匿名映射，包括vdso、庫的映射、mmap映射的內存等等。
棧stack。

通過top或者procrank之類工具發現某個進程存在內存泄漏的風險，然后查看進程的maps信息，進而可以縮小泄漏點范圍。

一般情況下泄漏點常在堆和文件/匿名映射區域。

對於堆，需要了解哪些函數申請的內存在堆中，然后加以監控相關系統調用。

對於文件映射，定位較簡單，可以通過文件名找到對應代碼。

對於匿名映射，則需要根據大小或者地址范圍猜測用途。當然也可以通過strace 跟蹤和maps對應找到對應的泄漏點。

起始地址-結束地址    屬性  偏移地址 主從設備號 inode編號 文件名

00008000-00590000 r-xp 00000000 b3:01 1441836    /root/xxx----------------------------可執行文件的代碼段，下面分別是只讀和可讀寫的段。00590000-005b2000 r--p 00587000 b3:01 1441836    /root/xxx
005b2000-005c4000 rw-p 005a9000 b3:01 1441836    /root/xxx
005c4000-0280c000 rwxp 00000000 00:00 0          [heap]-------------------------------如果堆在業務穩定后，還繼續單向增加，則可能存在泄漏。
2aaa8000-2aac5000 r-xp 00000000 b3:01 786621     /lib/ld-2.28.9000.so-----------------下面是最復雜的部分，存在各種各種樣的內存使用情況，大體上有庫映射、匿名內存映射、文件內存映射等。
2aac5000-2aac6000 r--p 0001c000 b3:01 786621     /lib/ld-2.28.9000.so
2aac6000-2aac7000 rw-p 0001d000 b3:01 786621     /lib/ld-2.28.9000.so
2aac7000-2aac8000 r-xp 00000000 00:00 0          [vdso]
2aac8000-2aaca000 rw-p 00000000 00:00 0...
2d9aa000-2d9c8000 r-xp 00000000 b3:01 656126     /usr/lib/libv4lconvert.so.0.0.0
2d9c8000-2d9c9000 ---p 0001e000 b3:01 656126     /usr/lib/libv4lconvert.so.0.0.0
2d9c9000-2d9ca000 r--p 0001e000 b3:01 656126     /usr/lib/libv4lconvert.so.0.0.0
2d9ca000-2d9cb000 rw-p 0001f000 b3:01 656126     /usr/lib/libv4lconvert.so.0.0.0
2d9cb000-2da23000 rw-p 00000000 00:00 0...
3e8aa000-3e90c000 rw-s 00000000 00:06 5243       /dev/mem_cma
3ea00000-3ea42000 rw-p 00000000 00:00 0 
3ea42000-3eb00000 ---p 00000000 00:00 07fa4a000-7fa6b000 rwxp 00000000 00:00 0          [stack]--------------------------------棧的大小是可變的，但是不能超過RLIMIT_STACK規定的大小。

3.1 堆內存

堆內存主要由malloc()/calloc()/realloc()/fre()申請釋放，所以如果發生了堆泄漏就需要重點看着幾個函數調用情況。

malloc()對應的系統調用是brk()，但是當申請超過128KB內存時就會調用mmap()。

關於堆內存管理參考：《Linux堆內存管理深入分析(上)》、《Linux堆內存管理深入分析（下）》、《對堆棧中分析的比較好的文章進行的總結》、《Linux內存分配小結--malloc、brk、mmap》、《Linux C 堆內存管理函數malloc()、calloc()、realloc()、free()詳解》。

3.2 棧內存

棧的地址方向是從高到低，范圍由RLIMIT_STACK規定。

可以通過ulimit -s查看，一般是8MB。

棧相關問題多是溢出問題。

3.3 mmap映射區

重點關注mmap相關調用《Linux內存管理 (9)mmap》、《Linux內存管理 (9)mmap(補充)》。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 /proc/ /maps簡要分析 /proc/{pid}/maps解讀, 虛擬內存 /proc/$pid/maps文件中各個空間段的意義 PROC系列之---/proc/pid/stat stuff in /proc/PID/ /proc/ /status簡要分析 cat /proc/maps 進程內存映射【轉】 Linux /proc/pid目錄下各文件含義 /proc/stat解析 Linux內存管理 -- /proc/{pid}/smaps講解

/proc/ /maps解析