一、隊列使用場景:為什么需要隊列
在web開發中,我們經常會遇到需要處理批量任務的時候,這些批量任務可能是用戶提交的,也可能是當系統被某個事件觸發時需要進行批量處理的,面對這樣的 任務,如果是用戶提交的批量任務,初級程序員只能讓用戶觸發提交動作后,等待服務器處理完畢,並且將結果返回到瀏覽器,期間用戶不能關掉瀏覽器窗口,如果 數據比較大,或者處理速度比較慢,那用戶體驗將會因此受到直接影響。但是當我們使用某訊或者某浪的郵箱時,點擊群發郵件之后,只需等待很短的時間,瀏覽器 提示提交成功,正在發送之類的信息時,用戶就可以關掉瀏覽器,稍后,收件地址欄里的郵箱將陸續收到該群發郵件,再比如群發定時郵件,以及當商城系統中有客 戶下單,客戶,客服,倉庫等相關人員收到訂單郵件信息。諸如此類,隊列的應用范圍是如此之廣。
二 :普通工程師的解決方案和架構師的解決方案
方案1:建表存郵件,消息等,用定時程序取出發送。
方案2:抽象到更高一層,開發一套通用異步處理隊列適用於任何復雜的業務邏輯
那么,作為架構師,使用隊列的做法,將抽象層和業務層分離,可具有良好的擴展性和可維護性。相比較而言就高明了許多,下面就我們介紹一下自定義隊列的實現思路和方法。
三 :隊列總體設計
1:需要隊列程序,提供加入隊列接口和取隊列接口等
2:需要存儲隊列,文件或者數據庫
3:需要定時程序取出隊列並執行
4:其它擴展功能:優先級,日志,定時等
代碼的目錄結構如下,每個文件的作用用//注釋來標明
|–addTask.php //添加任務到隊列的例子
|–cronMission.php //定時任務調度程序,例如linux中受crontab直接調用的文件,業務邏輯工程師可以在這個文件中靈活定義自己的隊列任務,從而不用每個隊列任務 都需要上服務器修改crontab,從而在安全性,便捷性方面有很大提高
|–db.php //數據庫操作
|–db.sql //建立隊列需要用到的基本表結構
|–doQueue.php //執行隊列任務
|–Queue.class.php //隊列核心業務在這里定義,包括將任務加入隊列,讀隊列,更改隊列任務狀態
|–sendMsg.php //隊列要實現具體任務的業務接口,比如現有系統的發送消息的接口,這里例子中因為將此隊列程序和現有系統系統集成,用寫入日志來演示
四 :隊列具體實現一:建任務存儲表
1:
先來個最基本的:
CREATE TABLE`queue` (id int(11) NOT NULL auto_increment primarykey,taskphp varchar(128) NOT NULLdefault'',param text not nulldefault'',status tinyint not nulldefault0,ctime timestamp NOT NULLdefaultCURRENT_TIMESTAMP,KEY (ctime)) ENGINE=InnoDBDEFAULT CHARSET=utf8;
字段解釋:
taskphp:處理業務的接口文件
param:處理業務的接口文件需要接收的參數
status:任務處理狀態,0為未處理,處理完畢更改為1
五 、隊列具體實現二:定義調用接口
<?php/**** 任務隊列實現**/include_once('db.php');classQueue{/*** 把任務扔到隊列** @param string $taskphp 執行任務的程序* @param string $param 執行任務程序所用的參數* 例如,群發消息加入隊列:* $arr = array(* "uid" => 4,//發信息的人的UID* "uids" => array(6,234,34,67,7888,2355), //接收信息的人的UID* "content" => 'xxxxx',//信息內容* );* $cqueue = new Queue();* $cqueue->add("/app/send_msg.php", serialize($arr));**/publicfunctionadd($taskphp,$param){$taskphp= mysql_real_escape_string($taskphp);//$param = mysql_real_escape_string($param);$param=$param;$sql="insert into queue (taskphp, param) values('".$taskphp."', '".$param."')";$re= execute($sql);if($re){$pid= mysql_insert_id();return$pid;}else{returnfalse;}}/*** 讀取任務隊列** @param string $limit 一次取多少條*/publicfunctiongetQueueTask($limit= 1000){$limit= (int)$limit;$sql="select id, taskphp, param from queue where status = 0 order by id asc";$re= query($sql);return$re;}/*** 更新任務狀態** @param string $limit 一次取多少條*/publicfunctionupdateTaskByID($id){$id= (int)$id;$mtime= time();$sql="update queue set status =1, mtime = ".$mtime." where id = ".$id;$re= execute($sql);return$re;}publicstaticfunctiona2s($arr){$str="";foreach($arras$key=>$value){if(is_array($value)){foreach($valueas$value2){$str.= urlencode($key) ."[]=". urlencode($value2) ."&";}}else{$str.= urlencode($key) ."=". urlencode($value) ."&";}}return$str;}publicstaticfunctions2a($str){$arr=array();parse_str($str,$arr);return$arr;}}?>
1:加入隊列接口
l //$param1 為執行任務的程序,$param2 為程序參數,可以為序列化的數據
l $cqueue->add($param1,$param2);
2: 讀取隊列接口
l $tasks = $cqueue->getQueueTask($limit = 1000);
3:更新任務狀態
l $cqueue->updateTaskStatus($id);
4:a2s是自定義的一個數組轉換字符串方法,這里不要使用json_encode,容易出現問題,同樣,從數據庫中取出轉換為數組的時候,使用s2a方法
l $re = $cqueue->add("sendMsg.php", Queue::a2s($arr));
六、隊列具體實現三:寫執行隊列的程序
根據設計,執行隊列的程序文件是 do_queue.php , 它的主要功能是把任務從隊列表里取出來,並且在后台執行。
do_queue.php部分代碼:
$phpcmd=exec("which php");//查找到php安裝位置$cqueue=newQueue();$tasks=$cqueue->getQueueTask(200);foreach($tasksas$t){$taskphp=$t['taskphp'];$param=$t['param'];$job=$phpcmd." ".escapeshellarg($taskphp) ." ".escapeshellarg($param);system($job);}
七、具體任務的業務實現
還是拿群發消息來做例子,我們需要寫好一個群發消息的程序,這個程序接收事先定義好的參數,然后根據參數調用發消息的接口把消息發送出去。
這個一般由做業務功能的工程師實現。但是架構師事先得寫文檔例子,教會別人使用。
send_msg.php:
$para=$argv[1];$arr= unserialize($para);$cmessage=newMessage();foreach($arr['uids']as$touid){$cmessage->send($arr['uid'],$touid,$arr['content']);}
八、服務器部署一:配置crontab
咱們執行隊列的程序都寫好了, 這個程序怎么觸發呢,當然就要用到linux的定時任務,每隔一定的時間,執行do_queue.php一次。但是呢,這里不是直接調用 do_queue.php,咱們再提高一層,加個調度程序cron_mission.php, 在cron_mission.php里面調用do_queue.php
配置定時任務 crontab:
l crontab –e
l * * * * * cd /ucai/schedule;php cron_mission.php >> cron_mission.log
#可以先使用crontab -l查看本機已經使用的定時任務
九、服務器部署二:寫定時任務調度程序
思路:將定時任務寫入到任務調度程序cron_mission.php中,這樣可以在cron_mission.php中靈活控制隊列任務。相比較直接通 過crontab控制doQueue.php而言,避免了頻繁修改服務器上的crontab,從安全,便於維護等角度來說,都是上策。
cron_mission.php 示例:
if($minute% 5 == 0){if(chdir($site_dir."app/")) {$cmd="$phpcmd do_queue.php > do_queue.log &";echo'[',$ymd,' ',$hour,':',$minute,'] ',$cmd,"n";system($cmd);}}
十、開啟多進程並發執行隊列
思路:對任務序列進行編號,數據庫中執行的時候
where條件加上id%每個隊列要執行任務總數=隊列編號
這樣可以避免重復處理
例如:每個進程執行10條任務,修改如下
1:定時任務的修改
修改前:
if($minute% 5 == 0){if(chdir($site_dir."app/")) {$cmd="$phpcmd do_queue.php > do_queue.log &";echo'[',$ymd,' ',$hour,':',$minute,'] ',$cmd,"n";system($cmd);}}
if($minute% 5 == 0){for($i=0;$i< 10;$i++) {$cmd="$phpcmd doQueue.php 10 $i>> doQueueMission".date('Y-m-d').".log ";echodate("Y-m-d H:i:s") ."t : ".$cmd."n";system($cmd);}}
//每次進行10個進程,$i來區分是當前的進程標示
2:隊列執行程序的修改
修改前:
$phpcmd='D:workwampbinphpphp5.3.10php ';$cqueue=newQueue();$tasks=$cqueue->getQueueTask(200);
修改后:
$phpcmd='D:workwampbinphpphp5.3.10php ';$total=$argv[1];$i=$argb[2];$cqueue=newQueue();$tasks=$cqueue->getQueueTask($total,$i,200);
3:取隊列接口的修改
修改前:
publicfunctiongetQueueTask($limit= 1000){$limit= (int)$limit;$sql="select id, taskphp, param from queue where status = 0 order by id asc";$re= query($sql);return$re;}
修改后:
publicfunctiongetQueueTask($total,$i,$limit= 1000){$limit= (int)$limit;$sql="select id, taskphp, param from queue where status = 0 and id%$total=$i order by id asc";$re= query($sql);return$re;}
4:需要關注服務器壓力
進程數定為多少,取決於服務器壓力
十一、實現任務優先級
1:任務存儲表加優先級字段
在數據表里,加一個優先級字段,按字段值的數值大小來區分優先級
2:修改取隊列任務接口,按優先級取
同樣是在sql語句中增加order by
十二、記錄隊列日志
1:關鍵地方加echo
2:shell腳本的>>和>的各自作用
總結:
我們這里的隊列實現借助了服務器的計划任務來實現,例如linux中的crontab,這本身是linux系統中的一個程序,平時我們還可以使用他來進行 定時執行.sh腳本,例如將數據庫備份打包並ftp傳送到指定服務器上,這個功能不需要借助php腳本,直接用.sh腳本就可以實現。在這里我們巧妙的將 crontab和php腳本結合,並且使用crontab來不斷調用一個隊列調度接口cronMission.php,再通過 cronMission.php直接來控制具體什么時候或者是滿足什么條件來執行什么隊列任務。
這里面幾個需要注意的地方
1:往數據庫中存取數據時,不要直接使用json_encode或者json_decode,容易造成一些意外問題,在代碼中,我們定義了a2s和s2a兩個方法,分別是處理數組轉為字符串,和從數據庫中讀取字符串后轉為數組。
2:當任務量比較大,同時服務器負載又沒有充分利用的時候,可以使用多進程並發處理,在並發處理的時候需要考慮一個問題,就是如何避免重復,在這里我們使 用了,對隊列任務進行標記,每次從數據庫中讀取一個進程需要處理的一批任務,使用數據庫中id與批次標示取余等於0的方法來區分,避免不同批次的隊列,重 復處理相同任務。(上面步驟10中有具體實現)
