平常會經常用到多進程,可以用進程池pool來進行自動控制進程,下面介紹一下pool的簡單使用。
需要主動是,在Windows上要想使用進程模塊,就必須把有關進程的代碼寫if __name__ == ‘__main__’ :語句的下面,才能正常使用Windows下的進程模塊。Unix/Linux下則不需要。
Pool類
Pool類可以提供指定數量的進程供用戶調用,當有新的請求提交到Pool中時,如果池還沒有滿,就會創建一個新的進程來執行請求。如果池滿,請求就會告知先等待,直到池中有進程結束,
才會創建新的進程來執行這些請求。
下面介紹一下multiprocessing 模塊下的Pool類下的幾個方法:
1、apply()
函數原型:apply(func[, args=()[, kwds={}]])
該函數用於傳遞不定參數,同python中的apply函數一致,主進程會被阻塞直到函數執行結束(不建議使用,並且3.x以后不在出現)。
2、apply_async
函數原型:apply_async(func[, args=()[, kwds={}[, callback=None]]])
與apply用法一致,但它是非阻塞的且支持結果返回后進行回調。
3、map()
函數原型:map(func, iterable[, chunksize=None])
Pool類中的map方法,與內置的map函數用法行為基本一致,它會使進程阻塞直到結果返回。
注意:雖然第二個參數是一個迭代器,但在實際使用中,必須在整個隊列都就緒后,程序才會運行子進程。
4、map_async()
函數原型:map_async(func, iterable[, chunksize[, callback]])
與map用法一致,但是它是非阻塞的。其有關事項見apply_async。
5、close()
關閉進程池(pool),使其不在接受新的任務。
6、terminal()
結束工作進程,不在處理未處理的任務。
7、join()
主進程阻塞等待子進程的退出, join方法要在close或terminate之后使用。
簡單實現代碼
import multiprocessing import time def func(msg): print("msg:", msg) time.sleep(3) print("end,", msg) if __name__ == "__main__": # 這里設置允許同時運行的的進程數量要考慮機器cpu的數量,進程的數量最好別小於cpu的數量, # 因為即使大於cpu的數量,增加了任務調度的時間,效率反而不能有效提高 pool = multiprocessing.Pool(processes = 3) item_list = ['processes1' ,'processes2' ,'processes3' ,'processes4' ,'processes5' ,] count = len(item_list) for item in item_list: msg = "hello %s" %item # 維持執行的進程總數為processes,當一個進程執行完畢后會添加新的進程進去 pool.apply_async(func, (msg,)) pool.close() pool.join() # 調用join之前,先調用close函數,否則會出錯。執行完close后不會有新的進程加入到pool,join函數等待所有子進程結束