一、隊列使用場景:為什么需要隊列
在web開發中,我們經常會遇到需要處理批量任務的時候,這些批量任務可能是用戶提交的,也可能是當系統被某個事件觸發時需要進行批量處理的,面對這樣的 任務,如果是用戶提交的批量任務,初級程序員只能讓用戶觸發提交動作后,等待服務器處理完畢,並且將結果返回到瀏覽器,期間用戶不能關掉瀏覽器窗口,如果 數據比較大,或者處理速度比較慢,那用戶體驗將會因此受到直接影響。但是當我們使用某訊或者某浪的郵箱時,點擊群發郵件之后,只需等待很短的時間,瀏覽器 提示提交成功,正在發送之類的信息時,用戶就可以關掉瀏覽器,稍后,收件地址欄里的郵箱將陸續收到該群發郵件,再比如群發定時郵件,以及當商城系統中有客 戶下單,客戶,客服,倉庫等相關人員收到訂單郵件信息。諸如此類,隊列的應用范圍是如此之廣。
二 :普通工程師的解決方案和架構師的解決方案
方案1:建表存郵件,消息等,用定時程序取出發送。
方案2:抽象到更高一層,開發一套通用異步處理隊列適用於任何復雜的業務邏輯
那么,作為架構師,使用隊列的做法,將抽象層和業務層分離,可具有良好的擴展性和可維護性。相比較而言就高明了許多,下面就我們介紹一下自定義隊列的實現思路和方法。
三 :隊列總體設計
1:需要隊列程序,提供加入隊列接口和取隊列接口等
2:需要存儲隊列,文件或者數據庫
3:需要定時程序取出隊列並執行
4:其它擴展功能:優先級,日志,定時等
代碼的目錄結構如下,每個文件的作用用//注釋來標明
|–addTask.php //添加任務到隊列的例子
|–cronMission.php //定時任務調度程序,例如linux中受crontab直接調用的文件,業務邏輯工程師可以在這個文件中靈活定義自己的隊列任務,從而不用每個隊列任務 都需要上服務器修改crontab,從而在安全性,便捷性方面有很大提高
|–db.php //數據庫操作
|–db.sql //建立隊列需要用到的基本表結構
|–doQueue.php //執行隊列任務
|–Queue.class.php //隊列核心業務在這里定義,包括將任務加入隊列,讀隊列,更改隊列任務狀態
|–sendMsg.php //隊列要實現具體任務的業務接口,比如現有系統的發送消息的接口,這里例子中因為將此隊列程序和現有系統系統集成,用寫入日志來演示
四 :隊列具體實現一:建任務存儲表
1:
先來個最基本的:
CREATE TABLE`queue` (
id int(11) NOT NULL auto_increment primarykey,
taskphp varchar(128) NOT NULL
default
''
,
param text not null
default
''
,
status tinyint not null
default
0,
ctime timestamp NOT NULL
default
CURRENT_TIMESTAMP,
KEY (ctime)
) ENGINE=InnoDBDEFAULT CHARSET=utf8;
字段解釋:
taskphp:處理業務的接口文件
param:處理業務的接口文件需要接收的參數
status:任務處理狀態,0為未處理,處理完畢更改為1
五 、隊列具體實現二:定義調用接口
<?php
/**
*
* 任務隊列實現
*
*/
include_once
(
'db.php'
);
class
Queue
{
/**
* 把任務扔到隊列
*
* @param string $taskphp 執行任務的程序
* @param string $param 執行任務程序所用的參數
* 例如,群發消息加入隊列:
* $arr = array(
* "uid" => 4,//發信息的人的UID
* "uids" => array(6,234,34,67,7888,2355), //接收信息的人的UID
* "content" => 'xxxxx',//信息內容
* );
* $cqueue = new Queue();
* $cqueue->add("/app/send_msg.php", serialize($arr));
*
*/
public
function
add(
$taskphp
,
$param
)
{
$taskphp
= mysql_real_escape_string(
$taskphp
);
//$param = mysql_real_escape_string($param);
$param
=
$param
;
$sql
=
"insert into queue (taskphp, param) values('"
.
$taskphp
.
"', '"
.
$param
.
"')"
;
$re
= execute(
$sql
);
if
(
$re
)
{
$pid
= mysql_insert_id();
return
$pid
;
}
else
{
return
false;
}
}
/**
* 讀取任務隊列
*
* @param string $limit 一次取多少條
*/
public
function
getQueueTask(
$limit
= 1000)
{
$limit
= (int)
$limit
;
$sql
=
"select id, taskphp, param from queue where status = 0 order by id asc"
;
$re
= query(
$sql
);
return
$re
;
}
/**
* 更新任務狀態
*
* @param string $limit 一次取多少條
*/
public
function
updateTaskByID(
$id
)
{
$id
= (int)
$id
;
$mtime
= time();
$sql
=
"update queue set status =1, mtime = "
.
$mtime
.
" where id = "
.
$id
;
$re
= execute(
$sql
);
return
$re
;
}
public
static
function
a2s(
$arr
)
{
$str
=
""
;
foreach
(
$arr
as
$key
=>
$value
)
{
if
(
is_array
(
$value
))
{
foreach
(
$value
as
$value2
)
{
$str
.= urlencode(
$key
) .
"[]="
. urlencode(
$value2
) .
"&"
;
}
}
else
{
$str
.= urlencode(
$key
) .
"="
. urlencode(
$value
) .
"&"
;
}
}
return
$str
;
}
public
static
function
s2a(
$str
)
{
$arr
=
array
();
parse_str
(
$str
,
$arr
);
return
$arr
;
}
}
?>
1:加入隊列接口
l //$param1 為執行任務的程序,$param2 為程序參數,可以為序列化的數據
l $cqueue->add($param1,$param2);
2: 讀取隊列接口
l $tasks = $cqueue->getQueueTask($limit = 1000);
3:更新任務狀態
l $cqueue->updateTaskStatus($id);
4:a2s是自定義的一個數組轉換字符串方法,這里不要使用json_encode,容易出現問題,同樣,從數據庫中取出轉換為數組的時候,使用s2a方法
l $re = $cqueue->add("sendMsg.php", Queue::a2s($arr));
六、隊列具體實現三:寫執行隊列的程序
根據設計,執行隊列的程序文件是 do_queue.php , 它的主要功能是把任務從隊列表里取出來,並且在后台執行。
do_queue.php部分代碼:
$phpcmd
=
exec
(
"which php"
);
//查找到php安裝位置
$cqueue
=
new
Queue();
$tasks
=
$cqueue
->getQueueTask(200);
foreach
(
$tasks
as
$t
)
{
$taskphp
=
$t
[
'taskphp'
];
$param
=
$t
[
'param'
];
$job
=
$phpcmd
.
" "
.
escapeshellarg
(
$taskphp
) .
" "
.
escapeshellarg
(
$param
);
system(
$job
);
}
七、具體任務的業務實現
還是拿群發消息來做例子,我們需要寫好一個群發消息的程序,這個程序接收事先定義好的參數,然后根據參數調用發消息的接口把消息發送出去。
這個一般由做業務功能的工程師實現。但是架構師事先得寫文檔例子,教會別人使用。
send_msg.php:
$para
=
$argv
[1];
$arr
= unserialize(
$para
);
$cmessage
=
new
Message();
foreach
(
$arr
[
'uids'
]
as
$touid
)
{
$cmessage
->send(
$arr
[
'uid'
],
$touid
,
$arr
[
'content'
]);
}
八、服務器部署一:配置crontab
咱們執行隊列的程序都寫好了, 這個程序怎么觸發呢,當然就要用到linux的定時任務,每隔一定的時間,執行do_queue.php一次。但是呢,這里不是直接調用 do_queue.php,咱們再提高一層,加個調度程序cron_mission.php, 在cron_mission.php里面調用do_queue.php
配置定時任務 crontab:
l crontab –e
l * * * * * cd /ucai/schedule;php cron_mission.php >> cron_mission.log
#可以先使用crontab -l查看本機已經使用的定時任務
九、服務器部署二:寫定時任務調度程序
思路:將定時任務寫入到任務調度程序cron_mission.php中,這樣可以在cron_mission.php中靈活控制隊列任務。相比較直接通 過crontab控制doQueue.php而言,避免了頻繁修改服務器上的crontab,從安全,便於維護等角度來說,都是上策。
cron_mission.php 示例:
if
(
$minute
% 5 == 0)
{
if
(
chdir
(
$site_dir
.
"app/"
)) {
$cmd
=
"$phpcmd do_queue.php > do_queue.log &"
;
echo
'['
,
$ymd
,
' '
,
$hour
,
':'
,
$minute
,
'] '
,
$cmd
,
"n"
;
system(
$cmd
);
}
}
十、開啟多進程並發執行隊列
思路:對任務序列進行編號,數據庫中執行的時候
where條件加上id%每個隊列要執行任務總數=隊列編號
這樣可以避免重復處理
例如:每個進程執行10條任務,修改如下
1:定時任務的修改
修改前:
if
(
$minute
% 5 == 0)
{
if
(
chdir
(
$site_dir
.
"app/"
)) {
$cmd
=
"$phpcmd do_queue.php > do_queue.log &"
;
echo
'['
,
$ymd
,
' '
,
$hour
,
':'
,
$minute
,
'] '
,
$cmd
,
"n"
;
system(
$cmd
);
}
}
if
(
$minute
% 5 == 0)
{
for
(
$i
=0;
$i
< 10;
$i
++) {
$cmd
=
"$phpcmd doQueue.php 10 $i>> doQueueMission"
.
date
(
'Y-m-d'
).
".log "
;
echo
date
(
"Y-m-d H:i:s"
) .
"t : "
.
$cmd
.
"n"
;
system(
$cmd
);
}
}
//每次進行10個進程,$i來區分是當前的進程標示
2:隊列執行程序的修改
修改前:
$phpcmd
=
'D:workwampbinphpphp5.3.10php '
;
$cqueue
=
new
Queue();
$tasks
=
$cqueue
->getQueueTask(200);
修改后:
$phpcmd
=
'D:workwampbinphpphp5.3.10php '
;
$total
=
$argv
[1];
$i
=
$argb
[2];
$cqueue
=
new
Queue();
$tasks
=
$cqueue
->getQueueTask(
$total
,
$i
,200);
3:取隊列接口的修改
修改前:
public
function
getQueueTask(
$limit
= 1000)
{
$limit
= (int)
$limit
;
$sql
=
"select id, taskphp, param from queue where status = 0 order by id asc"
;
$re
= query(
$sql
);
return
$re
;
}
修改后:
public
function
getQueueTask(
$total
,
$i
,
$limit
= 1000)
{
$limit
= (int)
$limit
;
$sql
=
"select id, taskphp, param from queue where status = 0 and id%$total=$i order by id asc"
;
$re
= query(
$sql
);
return
$re
;
}
4:需要關注服務器壓力
進程數定為多少,取決於服務器壓力
十一、實現任務優先級
1:任務存儲表加優先級字段
在數據表里,加一個優先級字段,按字段值的數值大小來區分優先級
2:修改取隊列任務接口,按優先級取
同樣是在sql語句中增加order by
十二、記錄隊列日志
1:關鍵地方加echo
2:shell腳本的>>和>的各自作用
總結:
我們這里的隊列實現借助了服務器的計划任務來實現,例如linux中的crontab,這本身是linux系統中的一個程序,平時我們還可以使用他來進行 定時執行.sh腳本,例如將數據庫備份打包並ftp傳送到指定服務器上,這個功能不需要借助php腳本,直接用.sh腳本就可以實現。在這里我們巧妙的將 crontab和php腳本結合,並且使用crontab來不斷調用一個隊列調度接口cronMission.php,再通過 cronMission.php直接來控制具體什么時候或者是滿足什么條件來執行什么隊列任務。
這里面幾個需要注意的地方
1:往數據庫中存取數據時,不要直接使用json_encode或者json_decode,容易造成一些意外問題,在代碼中,我們定義了a2s和s2a兩個方法,分別是處理數組轉為字符串,和從數據庫中讀取字符串后轉為數組。
2:當任務量比較大,同時服務器負載又沒有充分利用的時候,可以使用多進程並發處理,在並發處理的時候需要考慮一個問題,就是如何避免重復,在這里我們使 用了,對隊列任務進行標記,每次從數據庫中讀取一個進程需要處理的一批任務,使用數據庫中id與批次標示取余等於0的方法來區分,避免不同批次的隊列,重 復處理相同任務。(上面步驟10中有具體實現)