一、隊列使用場景:為什么需要隊列
在web開發中,我們經常會遇到需要處理批量任務的時候,這些批量任務可能是用戶提交的,也可能是當系統被某個事件觸發時需要進行批量處理的,面對這樣的任務,如果是用戶提交的批量任務,初級程序員只能讓用戶觸發提交動作后,等待服務器處理完畢,並且將結果返回到瀏覽器,期間用戶不能關掉瀏覽器窗口,如果數據比較大,或者處理速度比較慢,那用戶體驗將會因此受到直接影響。但是當我們使用某訊或者某浪的郵箱時,點擊群發郵件之后,只需等待很短的時間,瀏覽器提示提交成功,正在發送之類的信息時,用戶就可以關掉瀏覽器,稍后,收件地址欄里的郵箱將陸續收到該群發郵件,再比如群發定時郵件,以及當商城系統中有客戶下單,客戶,客服,倉庫等相關人員收到訂單郵件信息。諸如此類,隊列的應用范圍是如此之廣。
二 :普通工程師的解決方案和架構師的解決方案
方案1:建表存郵件,消息等,用定時程序取出發送。
方案2:抽象到更高一層,開發一套通用異步處理隊列適用於任何復雜的業務邏輯
那么,作為架構師,使用隊列的做法,將抽象層和業務層分離,可具有良好的擴展性和可維護性。相比較而言就高明了許多,下面就我們介紹一下自定義隊列的實現思路和方法。
三 :隊列總體設計
1:需要隊列程序,提供加入隊列接口和取隊列接口等
2:需要存儲隊列,文件或者數據庫
3:需要定時程序取出隊列並執行
4:其它擴展功能:優先級,日志,定時等
代碼的目錄結構如下,每個文件的作用用//注釋來標明
|--addTask.php //添加任務到隊列的例子
|--cronMission.php //定時任務調度程序,例如linux中受crontab直接調用的文件,業務邏輯工程師可以在這個文件中靈活定義自己的隊列任務,從而不用每個隊列任務都需要上服務器修改crontab,從而在安全性,便捷性方面有很大提高
|--db.php //數據庫操作
|--db.sql //建立隊列需要用到的基本表結構
|--doQueue.php //執行隊列任務
|--Queue.class.php //隊列核心業務在這里定義,包括將任務加入隊列,讀隊列,更改隊列任務狀態
|--sendMsg.php //隊列要實現具體任務的業務接口,比如現有系統的發送消息的接口,這里例子中因為將此隊列程序和現有系統系統集成,用寫入日志來演示
四 :隊列具體實現一:建任務存儲表
1:
先來個最基本的:
- CREATE TABLE`queue` (
- id int(11) NOT NULL auto_increment primarykey,
- taskphp varchar(128) NOT NULL default '',
- param text not null default '',
- status tinyint not null default 0,
- ctime timestamp NOT NULL default CURRENT_TIMESTAMP,
- KEY (ctime)
- ) ENGINE=InnoDBDEFAULT CHARSET=utf8;
字段解釋:
taskphp:處理業務的接口文件
param:處理業務的接口文件需要接收的參數
status:任務處理狀態,0為未處理,處理完畢更改為1
五 、隊列具體實現二:定義調用接口
- <?php
- /**
- *
- * 任務隊列實現
- *
- */
- include_once('db.php');
- class Queue
- {
- /**
- * 把任務扔到隊列
- *
- * @param string $taskphp 執行任務的程序
- * @param string $param 執行任務程序所用的參數
- * 例如,群發消息加入隊列:
- * $arr = array(
- * "uid" => 4,//發信息的人的UID
- * "uids" => array(6,234,34,67,7888,2355), //接收信息的人的UID
- * "content" => 'xxxxx',//信息內容
- * );
- * $cqueue = new Queue();
- * $cqueue->add("/app/send_msg.php", serialize($arr));
- *
- */
- public function add($taskphp,$param)
- {
- $taskphp = mysql_real_escape_string($taskphp);
- //$param = mysql_real_escape_string($param);
- $param = $param;
- $sql = "insert into queue (taskphp, param) values('".$taskphp."', '".$param."')";
- $re = execute($sql);
- if ($re)
- {
- $pid = mysql_insert_id();
- return $pid;
- }
- else
- {
- return false;
- }
- }
- /**
- * 讀取任務隊列
- *
- * @param string $limit 一次取多少條
- */
- public function getQueueTask($limit = 1000)
- {
- $limit = (int)$limit;
- $sql = "select id, taskphp, param from queue where status = 0 order by id asc";
- $re = query($sql);
- return $re;
- }
- /**
- * 更新任務狀態
- *
- * @param string $limit 一次取多少條
- */
- public function updateTaskByID($id)
- {
- $id = (int)$id;
- $mtime = time();
- $sql = "update queue set status =1, mtime = ".$mtime." where id = ".$id;
- $re = execute($sql);
- return $re;
- }
- public static function a2s($arr)
- {
- $str = "";
- foreach ($arr as $key => $value)
- {
- if (is_array($value))
- {
- foreach ($value as $value2)
- {
- $str .= urlencode($key) . "[]=" . urlencode($value2) . "&";
- }
- }
- else
- {
- $str .= urlencode($key) . "=" . urlencode($value) . "&";
- }
- }
- return $str;
- }
- public static function s2a($str)
- {
- $arr = array();
- parse_str($str, $arr);
- return $arr;
- }
- }
- ?>
1:加入隊列接口
l //$param1 為執行任務的程序,$param2 為程序參數,可以為序列化的數據
l $cqueue->add($param1,$param2);
2: 讀取隊列接口
l $tasks = $cqueue->getQueueTask($limit = 1000);
3:更新任務狀態
l $cqueue->updateTaskStatus($id);
4:a2s是自定義的一個數組轉換字符串方法,這里不要使用json_encode,容易出現問題,同樣,從數據庫中取出轉換為數組的時候,使用s2a方法
l $re = $cqueue->add("sendMsg.php", Queue::a2s($arr));
六、隊列具體實現三:寫執行隊列的程序
根據設計,執行隊列的程序文件是 do_queue.php , 它的主要功能是把任務從隊列表里取出來,並且在后台執行。
do_queue.php部分代碼:
- $phpcmd = exec("which php"); //查找到php安裝位置
- $cqueue = new Queue();
- $tasks = $cqueue->getQueueTask(200);
- foreach ($tasks as $t)
- {
- $taskphp = $t['taskphp'];
- $param = $t['param'];
- $job = $phpcmd . " " . escapeshellarg($taskphp) . " " . escapeshellarg($param);
- system($job);
- }
七、具體任務的業務實現
還是拿群發消息來做例子,我們需要寫好一個群發消息的程序,這個程序接收事先定義好的參數,然后根據參數調用發消息的接口把消息發送出去。
這個一般由做業務功能的工程師實現。但是架構師事先得寫文檔例子,教會別人使用。
send_msg.php:
- $para = $argv[1];
- $arr = unserialize($para);
- $cmessage = new Message();
- foreach($arr['uids'] as $touid)
- {
- $cmessage->send($arr['uid'], $touid, $arr['content']);
- }
八、服務器部署一:配置crontab
咱們執行隊列的程序都寫好了, 這個程序怎么觸發呢,當然就要用到linux的定時任務,每隔一定的時間,執行do_queue.php一次。但是呢,這里不是直接調用do_queue.php,咱們再提高一層,加個調度程序cron_mission.php, 在cron_mission.php里面調用do_queue.php
配置定時任務 crontab:
l crontab –e
l * * * * * cd /ucai/schedule;php cron_mission.php >> cron_mission.log
#可以先使用crontab -l查看本機已經使用的定時任務
九、服務器部署二:寫定時任務調度程序
思路:將定時任務寫入到任務調度程序cron_mission.php中,這樣可以在cron_mission.php中靈活控制隊列任務。相比較直接通過crontab控制doQueue.php而言,避免了頻繁修改服務器上的crontab,從安全,便於維護等角度來說,都是上策。
cron_mission.php 示例:
- if ($minute % 5 == 0)
- {
- if(chdir($site_dir."app/")) {
- $cmd = "$phpcmd do_queue.php > do_queue.log &";
- echo '[' , $ymd , ' ' , $hour , ':' , $minute , '] ' , $cmd , "n";
- system($cmd);
- }
- }
十、開啟多進程並發執行隊列
思路:對任務序列進行編號,數據庫中執行的時候
where條件加上id%每個隊列要執行任務總數=隊列編號
這樣可以避免重復處理
例如:每個進程執行10條任務,修改如下
1:定時任務的修改
修改前:
- if ($minute % 5 == 0)
- {
- if(chdir($site_dir."app/")) {
- $cmd = "$phpcmd do_queue.php > do_queue.log &";
- echo '[' , $ymd , ' ' , $hour , ':' , $minute , '] ' , $cmd , "n";
- system($cmd);
- }
- }
修改后:
- if ($minute % 5 == 0)
- {
- for ($i=0; $i < 10; $i++) {
- $cmd = "$phpcmd doQueue.php 10 $i>> doQueueMission".date('Y-m-d').".log ";
- echo date("Y-m-d H:i:s") . "t : " .$cmd."n";
- system($cmd);
- }
- }
//每次進行10個進程,$i來區分是當前的進程標示
2:隊列執行程序的修改
修改前:
- $phpcmd = 'D:workwampbinphpphp5.3.10php ';
- $cqueue = new Queue();
- $tasks = $cqueue->getQueueTask(200);
修改后:
- $phpcmd = 'D:workwampbinphpphp5.3.10php ';
- $total=$argv[1];
- $i=$argb[2];
- $cqueue = new Queue();
- $tasks = $cqueue->getQueueTask($total,$i,200);
3:取隊列接口的修改
修改前:
- public function getQueueTask($limit = 1000)
- {
- $limit = (int)$limit;
- $sql = "select id, taskphp, param from queue where status = 0 order by id asc";
- $re = query($sql);
- return $re;
- }
修改后:
- public function getQueueTask($total,$i,$limit = 1000)
- {
- $limit = (int)$limit;
- $sql = "select id, taskphp, param from queue where status = 0 and id%$total=$i order by id asc";
- $re = query($sql);
- return $re;
- }
4:需要關注服務器壓力
進程數定為多少,取決於服務器壓力
十一、實現任務優先級
1:任務存儲表加優先級字段
在數據表里,加一個優先級字段,按字段值的數值大小來區分優先級
2:修改取隊列任務接口,按優先級取
同樣是在sql語句中增加order by
十二、記錄隊列日志
1:關鍵地方加echo
2:shell腳本的>>和>的各自作用
總結:
我們這里的隊列實現借助了服務器的計划任務來實現,例如linux中的crontab,這本身是linux系統中的一個程序,平時我們還可以使用他來進行定時執行.sh腳本,例如將數據庫備份打包並ftp傳送到指定服務器上,這個功能不需要借助php腳本,直接用.sh腳本就可以實現。在這里我們巧妙的將crontab和php腳本結合,並且使用crontab來不斷調用一個隊列調度接口cronMission.php,再通過cronMission.php直接來控制具體什么時候或者是滿足什么條件來執行什么隊列任務。
這里面幾個需要注意的地方
1:往數據庫中存取數據時,不要直接使用json_encode或者json_decode,容易造成一些意外問題,在代碼中,我們定義了a2s和s2a兩個方法,分別是處理數組轉為字符串,和從數據庫中讀取字符串后轉為數組。
2:當任務量比較大,同時服務器負載又沒有充分利用的時候,可以使用多進程並發處理,在並發處理的時候需要考慮一個問題,就是如何避免重復,在這里我們使用了,對隊列任務進行標記,每次從數據庫中讀取一個進程需要處理的一批任務,使用數據庫中id與批次標示取余等於0的方法來區分,避免不同批次的隊列,重復處理相同任務。(上面步驟10中有具體實現)
轉自:http://www.thinkphp.cn/topic/14728.html
