Map功能簡化Python並發代碼

本文轉載自查看原文 2014-09-01 10:53 4207

支持Map並發的包文件有兩個：

Multiprocessing,還有少為人知的但卻功能強大的子文件 multiprocessing.dummy.

Dummy是一個多進程包的完整拷貝。唯一不同的是，多進程包使用進程，而dummy使用線程（自然也有Python本身的一些限制）。所以一個有的另一個也有。這樣在兩種模式間切換就十分簡單，並且在判斷框架調用時使用的是IO還是CPU模式非常有幫助.

導入相關包

1 from multiprocessing import Pool
或者
2 from multiprocessing.dummy import Pool as ThreadPool

初始化

1 pool = ThreadPool()

 1 import urllib2 
 2 from multiprocessing.dummy import Pool as ThreadPool 
 3 
 4 urls = [
 5     'http://www.python.org', 
 6     'http://www.python.org/about/',
 7     'http://www.onlamp.com/pub/a/python/2003/04/17/metaclasses.html',
 8     'http://www.python.org/doc/',
 9     'http://www.python.org/download/',
10     'http://www.python.org/getit/',
11     'http://www.python.org/community/',
12     'https://wiki.python.org/moin/',
13     'http://planet.python.org/',
14     'https://wiki.python.org/moin/LocalUserGroups',
15     'http://www.python.org/psf/',
16     'http://docs.python.org/devguide/',
17     'http://www.python.org/community/awards/'
18     # etc.. 
19     ]
20 
21 # Make the Pool of workers
22 pool = ThreadPool(4) 
23 # Open the urls in their own threads
24 # and return the results
25 results = pool.map(urllib2.urlopen, urls)
26 #close the pool and wait for the work to finish 
27 pool.close() 
28 pool.join()

pool對象需要一些參數。它可以限定線程池中worker的數量。如果不填，它將采用系統的內核數作為初值.

如果你進行的是計算密集型多進程任務，內核越多意味着速度越快（當然這是有前提的）。但如果是涉及到網絡計算方面，影響的因素就千差萬別。所以最好還是能給出合適的線程池大小數

如果運行的線程很多，頻繁的切換線程會十分影響工作效率。所以最好還是能通過調試找出任務調度的時間平衡點

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 不計代價的簡化代碼關於Java代碼簡化的小技巧 Java代碼簡化神器-Lombok 開發一個python萬能分布式消費框架（基於mq redis中間件的函數調度框架）。只需要一行代碼就將任何函數實現分布式、並發、控頻、斷點接續運行、定時、指定時間不運行、消費確認、重試指定次數、重新入隊、超時殺死、計算消費次數速度、預估消費時間、函數運行日志記錄、任務過濾、任務過期丟棄等數十種功能。大大簡化比使用celery，很強大簡單，已在多個生產項目和模塊驗證。 SQL Server Management Object(SMO)大大簡化數據庫工具的開發幾行代碼開發功能強大的SQL工具 Python方法完成農歷日歷功能代碼 python基礎--注冊和登錄功能代碼 JAVA奇技淫巧簡化代碼之lombok 消息隊列並發處理基類-簡化版 Charles 的map local 功能實踐