PHP多進程一般應用在PHP_CLI命令行中執行php腳本,不要在web訪問時使用。
多進程處理分解任務一般要比單進程更快。
php查看是否安裝多進程模塊:
php -m | grep pcntl
(pcntl是process control的縮寫)
創建子進程的函數fork,了解過C語言的同學應該都知道這個。
php多進程的一些庫函數手冊:
http://php.net/manual/zh/function.pcntl-fork.php
pcntl_fork — 在當前進程當前位置產生分支(子進程)。譯注:fork是創建了一個子進程,父進程和子進程 都從fork的位置開始向下繼續執行,不同的是父進程執行過程中,得到的fork返回值為子進程號,而子進程得到的是0。
一個fork子進程的基礎示例:
<?php $pid = pcntl_fork(); //父進程和子進程都會執行下面代碼 if ($pid == -1) { //錯誤處理:創建子進程失敗時返回-1. die('could not fork'); } else if ($pid) { //父進程會得到子進程號,所以這里是父進程執行的邏輯 pcntl_wait($status); //等待子進程中斷,防止子進程成為僵屍進程。 } else { //子進程得到的$pid為0, 所以這里是子進程執行的邏輯。 }
如果一個任務被分解成多個進程執行,就會減少整體的耗時。
比如有一個比較大的數據文件要處理,這個文件由很多行組成。如果單進程執行要處理的任務,量很大時要耗時比較久。這時可以考慮多進程。
多進程處理分解任務,每個進程處理文件的一部分,這樣需要均分割一下這個大文件成多個小文件(進程數和小文件的個數等同就可以)。
比如該文件file.log有10萬行數據,現在想分4個進程處理。需要分割2.5萬行一個文件。命令split可以做到。
split的用法比較簡單,可以man split查看下手冊。
split -l 25000 -d file.log prefix_name
-l是按照行分割,-d是分割后的文件名按照數字,-a是分割后的文件個數位數(默認是2,做多就是99個;比如超過100個,-a可以寫3)。自己嘗試分割一下就知道了。
處理代碼:
<?php shell_exec('split -l 25000 -d file.log prefix_name'); // 3個子進程處理任務 for ($i = 0; $i < 3; $i++){ $pid = pcntl_fork(); if ($pid == -1) { die("could not fork"); } elseif ($pid) { echo "I'm the Parent $i\n"; } else {// 子進程處理 $content = file_get_contents("prefix_name0".$i); // 業務處理 begin // 業務處理 end exit;// 一定要注意退出子進程,否則pcntl_fork() 會被子進程再fork,帶來處理上的影響。 } } // 等待子進程執行結束 while (pcntl_waitpid(0, $status) != -1) { $status = pcntl_wexitstatus($status); echo "Child $status completed\n"; }