Python標准庫06 子進程 (subprocess包)


作者:Vamei 出處:http://www.cnblogs.com/vamei 歡迎轉載,也請保留這段聲明。謝謝!

謝謝Tolbkni Kao幫我糾正錯誤

 

這里的內容以Linux進程基礎Linux文本流為基礎。subprocess包主要功能是執行外部的命令和程序。比如說,我需要使用wget下載文件。我在Python中調用wget程序。從這個意義上來說,subprocess的功能與shell類似。

 

subprocess以及常用的封裝函數

當我們運行python的時候,我們都是在創建並運行一個進程。正如我們在Linux進程基礎中介紹的那樣,一個進程可以fork一個子進程,並讓這個子進程exec另外一個程序。在Python中,我們通過標准庫中的subprocess包來fork一個子進程,並運行一個外部的程序(fork,exec見Linux進程基礎)。

 

subprocess包中定義有數個創建子進程的函數,這些函數分別以不同的方式創建子進程,所以我們可以根據需要來從中選取一個使用。另外subprocess還提供了一些管理標准流(standard stream)和管道(pipe)的工具,從而在進程間使用文本通信

 

使用subprocess包中的函數創建子進程的時候,要注意:

1) 在創建子進程之后,父進程是否暫停,並等待子進程運行。

2) 函數返回什么

3) 當returncode不為0時,父進程如何處理。

 

subprocess.call()
父進程等待子進程完成
返回退出信息(returncode,相當於exit code,見Linux進程基礎)

 

subprocess.check_call()

父進程等待子進程完成

返回0

檢查退出信息,如果returncode不為0,則舉出錯誤subprocess.CalledProcessError,該對象包含有returncode屬性,可用try...except...來檢查(見Python錯誤處理)。

 

subprocess.check_output()

父進程等待子進程完成

返回子進程向標准輸出的輸出結果

檢查退出信息,如果returncode不為0,則舉出錯誤subprocess.CalledProcessError,該對象包含有returncode屬性和output屬性,output屬性為標准輸出的輸出結果,可用try...except...來檢查。

 

這三個函數的使用方法相類似,我們以subprocess.call()來說明:

import subprocess rc = subprocess.call(["ls","-l"])

我們將程序名(ls)和所帶的參數(-l)一起放在一個表中傳遞給subprocess.call()

 

可以通過一個shell來解釋一整個字符串:

import subprocess out = subprocess.call("ls -l", shell=True) out = subprocess.call("cd ..", shell=True)

我們使用了shell=True這個參數。這個時候,我們使用一整個字符串,而不是一個表來運行子進程。Python將先運行一個shell,再用這個shell來解釋這整個字符串。

shell命令中有一些是shell的內建命令,這些命令必須通過shell運行,$cd。shell=True允許我們運行這樣一些命令。

 

Popen()

實際上,我們上面的三個函數都是基於Popen()的封裝(wrapper)。這些封裝的目的在於讓我們容易使用子進程。當我們想要更個性化我們的需求的時候,就要轉向Popen類,該類生成的對象用來代表子進程。

 

與上面的封裝不同,Popen對象創建后,主程序不會自動等待子進程完成。我們必須調用對象的wait()方法,父進程才會等待 (也就是阻塞block):

import subprocess child = subprocess.Popen(["ping","-c","5","www.google.com"]) print("parent process")

從運行結果中看到,父進程在開啟子進程之后並沒有等待child的完成,而是直接運行print。

 

對比等待的情況:

import subprocess child = subprocess.Popen(["ping","-c","5","www.google.com"]) child.wait() print("parent process")

 

此外,你還可以在父進程中對子進程進行其它操作,比如我們上面例子中的child對象:

child.poll()           # 檢查子進程狀態

child.kill()           # 終止子進程

child.send_signal()    # 向子進程發送信號

child.terminate()      # 終止子進程

 

子進程的PID存儲在child.pid

 

子進程的文本流控制

(沿用child子進程) 子進程的標准輸入,標准輸出和標准錯誤也可以通過如下屬性表示:

child.stdin

child.stdout

child.stderr

 

我們可以在Popen()建立子進程的時候改變標准輸入、標准輸出和標准錯誤,並可以利用subprocess.PIPE將多個子進程的輸入和輸出連接在一起,構成管道(pipe):

import subprocess child1 = subprocess.Popen(["ls","-l"], stdout=subprocess.PIPE) child2 = subprocess.Popen(["wc"], stdin=child1.stdout,stdout=subprocess.PIPE)
out = child2.communicate()
print(out)

subprocess.PIPE實際上為文本流提供一個緩存區。child1的stdout將文本輸出到緩存區,隨后child2的stdin從該PIPE中將文本讀取走。child2的輸出文本也被存放在PIPE中,直到communicate()方法從PIPE中讀取出PIPE中的文本。

要注意的是,communicate()是Popen對象的一個方法,該方法會阻塞父進程,直到子進程完成。

 

我們還可以利用communicate()方法來使用PIPE給子進程輸入:

import subprocess child = subprocess.Popen(["cat"], stdin=subprocess.PIPE) child.communicate("vamei")

我們啟動子進程之后,cat會等待輸入,直到我們用communicate()輸入"vamei"。

 

通過使用subprocess包,我們可以運行外部程序。這極大的拓展了Python的功能。如果你已經了解了操作系統的某些應用,你可以從Python中直接調用該應用(而不是完全依賴Python),並將應用的結果輸出給Python,並讓Python繼續處理。shell的功能(比如利用文本流連接各個應用),就可以在Python中實現。

 

總結

subprocess.call, subprocess.check_call(), subprocess.check_output()

subprocess.Popen(), subprocess.PIPE

Popen.wait(), Popen.communicate()


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM