Linux exec族函數解析


背景

在提到 vfork 函數時,我們提到了這個概念。為了更好地學習與運用,我們對exec族函數進行展開。

exec函數族 介紹

有時我們希望子進程去執行另外的程序,exec函數族就提供了一個在進程中啟動另一個程序執行的方法。它可以根據指定的文件名或目錄名找到可執行文件,並用它來取代原調用進程的數據段、代碼段和堆棧段,在執行完之后,原調用進程的內容除了進程號外,其他全部被新程序的內容替換了。另外,這里的可執行文件既可以是二進制文件,也可以是Linux下任何可執行腳本文件。

在Linux中使用exec函數族主要有以下兩種情況

  • 當進程認為自己不能再為系統和用戶做出任何貢獻時,就可以調用任何exec 函數族讓自己重生。
  • 如果一個進程想執行另一個程序,那么它就可以調用fork函數新建一個進程,然后調用任何一個exec函數使子進程重生。

實際上,在Linux中並沒有exec函數,而是有6個以exec開頭的函數族:

#include <unistd.h>

int execl(const char *path, const char *arg, ...)
int execv(const char *path, char *const argv[])
int execle(const char *path, const char *arg, ..., char *const envp[])
int execve(const char *path, char *const argv[], char *const envp[])
int execlp(const char *file, const char *arg, ...)
int execvp(const char *file, char *const argv[])

參數介紹:

  • path:指定程序的具體路徑及程序名字
  • arg :傳入給程序的參數,最后參數必須為NULL;(NULL作為參數列表的結束標記)
  • file:命令名
  • envp:環境變量參數

函數返回值

函數返回值:

  • 成功 : 函數不會返回
  • 出錯 : 返回-1,失敗原因記錄在error中。

在平時的編程中,如果用到了exec函數族,一定記得要加錯誤判斷語句。因為與其他系統調用比起來,exec很容易受傷,被執行文件的位置,權限等很多因素都能導致該調用的失敗。最常見的錯誤是:

  • 找不到文件或路徑,此時errno被設置為ENOENT;
  • 數組argv和envp忘記用NULL結束,此時errno被設置為EFAULT;
  • 沒有對要執行文件的運行權限,此時errno被設置為EACCES。

exec函數執行后, 把該進程所有信號設為默認動作
exec函數執行后, 把原先要捕捉的信號設為默認, 其他不變

exec 函數族各成員比較

這6 個函數在函數名和使用語法的規則上都有細微的區別,下面就可執行文件查找方式、參數表傳遞方式及環境變量這幾個方面進行比較說明。

1)查找方式:上表其中前4個函數的查找方式都是完整的文件目錄路徑,而最后2個函數(也就是以p結尾的兩個函數)可以只給出文件名,系統就會自動從環境變量$PATH所指出的路徑中進行查找。

2)參數傳遞方式:exec函數族的參數傳遞有兩種方式,一種是逐個列舉的方式,而另一種則是將所有參數整體構造成指針數組進行傳遞。在這里參數傳遞方式是以函數名的第5位字母來區分的:

讀者可以觀察execl、execle、execlp的語法與execv、execve、execvp的區別。

  • 字母為“l”(list)的表示逐個列舉的方式,
  • 字母為“v”(vertor)的表示將所有參數整體構造成指針數組傳遞,然后將該數組的首地址當做參數傳給它,數組中的最后一個指針要求是NULL。

3)環境變量:exec函數族使用了系統默認的環境變量,也可以傳入指定的環境變量。這里以“e”(environment)結尾的兩個函數execle、execve就可以在envp[]中指定當前進程所使用的環境變量替換掉該進程繼承的所以環境變量。
(4)PATH環境變量說明
PATH環境變量包含了一張目錄表,系統通過PATH環境變量定義的路徑搜索執行碼,PATH環境變量定義時目錄之間需用用“:”分隔,以“.”號表示結束。PATH環境變量定義在用戶的.profile或.bash_profile中,下面是PATH環境變量定義的樣例,此PATH變量指定在“/bin”、“/usr/bin”和當前目錄三個目錄進行搜索執行碼。

PATH=/bin:/usr/bin:.
export $PATH

(5)進程中的環境變量說明
在Linux中,Shell進程是所有執行碼的父進程。當一個執行碼執行時,Shell進程會fork子進程然后調用exec函數去執行執行碼。Shell進程堆棧中存放着該用戶下的所有環境變量,使用execl、execv、execlp、execvp函數使執行碼重生時,Shell進程會將所有環境變量復制給生成的新進程;而使用execle、execve時新進程不繼承任何Shell進程的環境變量,而由envp[]數組自行設置環境變量。

(6)exec函數族關系
前4位統一為:exec
第5位:

  • l:參數傳遞為逐個列舉方式,execl、execle、execlp
  • v:參數傳遞為構造指針數組方式,execv、execve、execvp
    第6位:
  • e:可傳遞新進程環境變量, execle、execve
  • p:可執行文件查找方式為文件名,execlp、execvp

事實上,這6個函數中真正的系統調用只有execve,其他5個都是庫函數,它們最終都會調用execve這個系統調用,調用關系如下圖12-11所示:

(7)exec調用舉例如下:

char *const ps_argv[] ={"ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL};
char *const ps_envp[] ={"PATH=/bin:/usr/bin", "TERM=console", NULL};
execl("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL);
execv("/bin/ps", ps_argv);
execle("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL, ps_envp);
execve("/bin/ps", ps_argv, ps_envp);
execlp("ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL);
execvp("ps", ps_argv);

請注意exec函數族形參展開時的前兩個參數,第一個參數是帶路徑的執行碼(execlp、execvp函數第一個參數是無路徑的,系統會根據PATH自動查找然后合成帶路徑的執行碼),第二個是不帶路徑的執行碼,執行碼可以是二進制執行碼和Shell腳本。

(8)exec函數族使用注意點
在使用exec函數族時,一定要加上錯誤判斷語句。因為exec很容易執行失敗,其中最常見的原因有:
1)找不到文件或路徑,此時errno被設置為ENOENT。
2)數組argv和envp忘記用NULL結束,此時errno被設置為EFAULT。
3)沒有對應可執行文件的運行權限,此時errno被設置為EACCES。

(9)exec后新進程保持原進程以下特征

  • 環境變量(使用了execle、execve函數則不繼承環境變量);
  • 進程ID和父進程ID;
  • 實際用戶ID和實際組ID;
  • 附加組ID;
  • 進程組ID;
  • 會話ID;
  • 控制終端;
  • 當前工作目錄;
  • 根目錄;
  • 文件權限屏蔽字;
  • 文件鎖;
  • 進程信號屏蔽;
  • 未決信號;
  • 資源限制;
  • tms_utime、tms_stime、tms_cutime以及tms_ustime值。

對打開文件的處理與每個描述符的exec關閉標志值有關,進程中每個文件描述符有一個exec關閉標志(FD_CLOEXEC),若此標志設置,則在執行exec時關閉該描述符,否則該描述符仍打開。除非特地用fcntl設置了該標志,否則系統的默認操作是在exec后仍保持這種描述符打開,利用這一點可以實現I/O重定向。

execlp函數舉例

一、execlp.c源代碼如下:

#include <stdio.h>
#include <unistd.h>

int main()
{
    if(fork()== 0){
        if(execlp("/usr/bin/env","env",NULL)<0)
        {
            perror("execlp error!");
            return -1 ;
        }
    }
    return 0 ;
}

編譯 gcc execlp.c –o execlp。

由執行結果看出,execlp函數使執行碼重生時繼承了Shell進程的所有環境變量,其他三個不以e結尾的函數同理。

二、execle函數舉例 利用函數execle,將環境變量添加到新建的子進程中去。 execle.c源代碼如下:

#include <unistd.h>
#include <stdio.h>

int main()
{
    /*命令參數列表,必須以 NULL 結尾*/
    char *envp[]={"PATH=/tmp","USER=sun",NULL};
    if(fork()==0){
        /*調用 execle 函數,注意這里也要指出 env 的完整路徑*/
        if(execle("/usr/bin/env","env",NULL,envp)<0)
        {
            perror("execle error!");
            return -1 ;
        }
    }
    return 0 ;
}

編譯:gcc execle.c –o execle。執行./execle,執行結果如下:
可見,使用execle和execve可以自己向執行進程傳遞環境變量,但不會繼承Shell進程的環境變量,而其他四個exec函數則繼承Shell進程的所有環境變量。

-- 摘錄自《深入淺出Linux工具與編程》


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM