近日工作中涉及到項目同時處理多個線程問題時,在網上找到了PHP的pthreads擴展以及curl_multi_init函數,具體如下:
一 、windows下安裝php真正的多線程擴展pthreads教程
擴展地址:http://docs.php.net/manual/zh/book.pthreads.php
注意事項
php5.3或以上,且為線程安全版本。apache和php使用的編譯器必須一致。
通過phpinfo()查看Thread Safety為enabled則為線程安全版。
通過phpinfo()查看Compiler項可以知道使用的編譯器。本人的為:MSVC9 (Visual C++ 2008)。
本人使用環境
32位windows xp sp3,wampserver2.2d(php5.3.10-vc9 + apache2.2.21-vc9)。
一、下載pthreads擴展
下載地址:http://windows.php.net/downloads/pecl/releases/pthreads
根據本人環境,我下載的是pthreads-2.0.8-5.3-ts-vc9-x86。
2.0.8代表pthreads的版本。
5.3代表php的版本。
ts表示php要線程安全版本的。
vc9表示php要Visual C++ 2008編譯器編譯的。
x86則表示32位的
二、安裝pthreads擴展
復制php_pthreads.dll 到目錄 bin\php\ext\ 下面。(本人路徑D:\wamp\bin\php\php5.3.10\ext)
復制pthreadVC2.dll 到目錄 bin\php\ 下面。(本人路徑D:\wamp\bin\php\php5.3.10)
復制pthreadVC2.dll 到目錄 C:\windows\system32 下面。
打開php配置文件php.ini。在后面加上extension=php_pthreads.dll
提示!Windows系統需要將 pthreadVC2.dll 所在路徑加入到 PATH 環境變量中。我的電腦--->鼠標右鍵--->屬性--->高級--->環境變量--->系統變量--->找到名稱為Path的--->編輯--->在變量值最后面加上pthreadVC2.dll的完整路徑(本人的為C:\WINDOWS\system32\pthreadVC2.dll)。
三、測試pthreads擴展
- class AsyncOperation extends \Thread {
- public function __construct($arg){
- $this->arg = $arg;
- }
- public function run(){
- if($this->arg){
- printf("Hello %s\n", $this->arg);
- }
- }
- }
- $thread = new AsyncOperation("World");
- if($thread->start())
- $thread->join();
- ?>
運行以上代碼出現 Hello World,說明pthreads擴展安裝成功!
附上一個Thinkphp3.2.2簡單例子
- <?php
- namespace Home\Controller;
- class test extends \Thread {
- public $url;
- public $result;
- public function __construct($url) {
- $this->url = $url;
- }
- public function run() {
- if ($this->url) {
- $this->result = model_http_curl_get($this->url);
- }
- }
- }
- function model_http_curl_get($url) {
- $curl = curl_init();
- curl_setopt($curl, CURLOPT_URL, $url);
- curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
- curl_setopt($curl, CURLOPT_TIMEOUT, 5);
- curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.2)');
- $result = curl_exec($curl);
- curl_close($curl);
- return $result;
- }
- for ($i = 0; $i < 10; $i++) {
- $urls[] = 'http://www.baidu.com/s?wd='. rand(10000, 20000);
- }
- /* 多線程速度測試 */
- $t = microtime(true);
- foreach ($urls as $key=>$url) {
- $workers[$key] = new test($url);
- $workers[$key]->start();
- }
- foreach ($workers as $key=>$worker) {
- while($workers[$key]->isRunning()) {
- usleep(100);
- }
- if ($workers[$key]->join()) {
- dump($workers[$key]->result);
- }
- }
- $e = microtime(true);
- echo "多線程耗時:".($e-$t)."秒<br>";
- /* 單線程速度測試 */
- $t = microtime(true);
- foreach ($urls as $key=>$url) {
- dump(model_http_curl_get($url));
- }
- $e = microtime(true);
- echo "For循環耗時:".($e-$t)."秒<br>";
測試結果如下:
多線程耗時:2.8371710777282714844秒
For循環耗時:10.941586017608642578秒
原文出自:http://www.thinkphp.cn/topic/22676.html
二 、curl_multi_init()
<?php
echo date("Y-m-d H:m:s",time());
echo " ";
echo floor(microtime()*1000);
echo "<br>";
$mtime = explode(" ", microtime());
$mtime = $mtime[1].($mtime[0] * 1000);
$mtime2 = explode(".", $mtime);
$mtime = $mtime2[0];
echo $mtime;
echo "<br>";
$urls = array(
'http://www.webkaka.com',
'http://www.webkaka.com',
'http://www.webkaka.com',
'http://www.webkaka.com',
'http://www.webkaka.com');
print_r(async_get_url($urls)); // [0] => example1, [1] => example2
echo "<br>";
echo date("Y-m-d H:m:s",time());
echo " ";
echo floor(microtime()*1000);
echo "<br>";
$mtime_ = explode(" ", microtime());
$mtime_ = $mtime_[1].($mtime_[0] * 1000);
$mtime2_ = explode(".", $mtime_);
$mtime_ = $mtime2_[0];
echo $mtime_;
echo "<br>";
echo $mtime_ - $mtime;
function async_get_url($url_array, $wait_usec = 0)
{
if (!is_array($url_array))
return false;
$wait_usec = intval($wait_usec);
$data = array();
$handle = array();
$running = 0;
$mh = curl_multi_init(); // multi curl handler
$i = 0;
foreach($url_array as $url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // return don't print
curl_setopt($ch, CURLOPT_TIMEOUT, 30);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)');
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // 302 redirect
curl_setopt($ch, CURLOPT_MAXREDIRS, 7);
curl_multi_add_handle($mh, $ch); // 把 curl resource 放進 multi curl handler 里
$handle[$i++] = $ch;
}
/* 執行 */
do {
curl_multi_exec($mh, $running);
if ($wait_usec > 0) /* 每個 connect 要間隔多久 */
usleep($wait_usec); // 250000 = 0.25 sec
} while ($running > 0);
/* 讀取資料 */
foreach($handle as $i => $ch) {
$content = curl_multi_getcontent($ch);
$data[$i] = (curl_errno($ch) == 0) ? $content : false;
}
/* 移除 handle*/
foreach($handle as $ch) {
curl_multi_remove_handle($mh, $ch);
}
curl_multi_close($mh);
return $data;
}
?>
關於curl_multi_init()
一般來說,想到要用curl_multi_init()時,目的是要同時請求多個url,而不是一個一個依次請求,否則就要curl_init()了。
不過,在使用curl_multi的時候,你可能遇到cpu消耗過高、網頁假死等現象,可以看看如何解決curl_multi導致網頁假死的問題
使用curl_multi的步驟總結如下:
第一步:調用curl_multi_init
第二步:循環調用curl_multi_add_handle
這一步需要注意的是,curl_multi_add_handle的第二個參數是由curl_init而來的子handle。
第三步:持續調用curl_multi_exec
第四步:根據需要循環調用curl_multi_getcontent獲取結果
第五步:調用curl_multi_remove_handle,並為每個字handle調用curl_close
第六步:調用curl_multi_close
各函數作用解釋:
curl_multi_init()
初始化一個curl批處理句柄資源。
curl_multi_add_handle()
向curl批處理會話中添加單獨的curl句柄資源。curl_multi_add_handle()函數有兩個參數,第一個參數表示一個curl批處理句柄資源,第二個參數表示一個單獨的curl句柄資源。
curl_multi_exec()
解析一個curl批處理句柄,curl_multi_exec()函數有兩個參數,第一個參數表示一個批處理句柄資源,第二個參數是一個引用值的參數,表示剩余需要處理的單個的curl句柄資源數量。
curl_multi_remove_handle()
移除curl批處理句柄資源中的某個句柄資源,curl_multi_remove_handle()函數有兩個參數,第一個參數表示一個curl批處理句柄資源,第二個參數表示一個單獨的curl句柄資源。
curl_multi_close()
關閉一個批處理句柄資源。
curl_multi_getcontent()
在設置了CURLOPT_RETURNTRANSFER的情況下,返回獲取的輸出的文本流。
curl_multi_info_read()
獲取當前解析的curl的相關傳輸信息。