場景:日常任務中,有時需要通過php腳本執行一些日志分析,隊列處理等任務,當數據量比較大時,可以使用多進程來處理。
准備:php多進程需要pcntl,posix擴展支持,可以通過 php - m 查看,沒安裝的話需要重新編譯php,加上參數--enable-pcntl,posix一般默認會有。
創建子進程的函數fork
pcntl_fork — 在當前進程當前位置產生分支(子進程)。譯注:fork是創建了一個子進程,父進程和子進程 都從fork的位置開始向下繼續執行,不同的是父進程執行過程中,得到的fork返回值為子進程號,而子進程得到的是0。
一個fork子進程的基礎示例:
1 <?php 2 $pid = pcntl_fork();//父進程和子進程都會執行下面代碼 3 if ($pid == -1) { 4 //錯誤處理:創建子進程失敗時返回-1. 5 die('could not fork'); 6 } else if ($pid) { 7 //父進程會得到子進程號,所以這里是父進程執行的邏輯 8 pcntl_wait($status); 9 //等待子進程中斷,防止子進程成為僵屍進程。 10 } else { 11 //子進程得到的$pid為0, 所以這里是子進程執行的邏輯。 12 }
如果一個任務被分解成多個進程執行,就會減少整體的耗時。
比如有一個比較大的數據文件要處理,這個文件由很多行組成。如果單進程執行要處理的任務,量很大時要耗時比較久。這時可以考慮多進程。
多進程處理分解任務,每個進程處理文件的一部分,這樣需要均分割一下這個大文件成多個小文件(進程數和小文件的個數等同就可以)。
比如該文件file.log有10萬行數據,現在想分4個進程處理。需要分割2.5萬行一個文件。命令split可以做到。
split的用法比較簡單,可以man split查看下手冊。
split -l 25000 -d file.log prefix_name
-l是按照行分割,-d是分割后的文件名按照數字,-a是分割后的文件個數位數(默認是2,做多就是99個;比如超過100個,-a可以寫3)。自己嘗試分割一下就知道了。
處理代碼:
<?php shell_exec('split -l 25000 -d file.log prefix_name'); // 3個子進程處理任務 for ($i = 0; $i < 3; $i++){ $pid = pcntl_fork(); if ($pid == -1) { die("could not fork"); } elseif ($pid) { echo "I'm the Parent $i\n"; } else {// 子進程處理 $content = file_get_contents("prefix_name0".$i); // 業務處理 begin // 業務處理 end exit; // 一定要注意退出子進程,否則pcntl_fork() 會被子進程再fork,帶來處理上的影響。 } }// 等待子進程執行結束 while (pcntl_waitpid(0, $status) != -1) { $status = pcntl_wexitstatus($status); echo "Child $status completed\n";}
可以關注微信公眾號 lovephp 一起學習