APScheduler定時框架
終於找到了可以每天定時喊我起床的方式了
APScheduler是一個 Python 定時任務框架,使用起來十分方便。提供了基於日期、固定時間間隔以及 crontab 類型的任務,並且可以持久化任務、並以 daemon 方式運行應用。
使用 APScheduler 需要安裝
1 |
$ pip install apscheduler |
首先來看一個周一到周五每天早上6點半喊我起床的例子
1 2 3 4 5 6 7 8 9 |
from apscheduler.schedulers.blocking import BlockingScheduler from datetime import datetime # 輸出時間 def job(): print(datetime.now().strftime("%Y-%m-%d %H:%M:%S")) # BlockingScheduler scheduler = BlockingScheduler() scheduler.add_job(job, 'cron', day_of_week='1-5', hour=6, minute=30) scheduler.start() |
代碼中的 BlockingScheduler 是什么呢?
BlockingScheduler是APScheduler中的調度器,APScheduler 中有兩種常用的調度器,BlockingScheduler 和 BackgroundScheduler,當調度器是應用中唯一要運行的任務時,使用 BlockingSchedule,如果希望調度器在后台執行,使用 BackgroundScheduler。
- BlockingScheduler: use when the scheduler is the only thing running in your process
- BackgroundScheduler: use when you’re not using any of the frameworks below, and want the scheduler to run in the background inside your application
- AsyncIOScheduler: use if your application uses the asyncio module
- GeventScheduler: use if your application uses gevent
- TornadoScheduler: use if you’re building a Tornado application
- TwistedScheduler: use if you’re building a Twisted application
- QtScheduler: use if you’re building a Qt application
APScheduler四個組件
APScheduler 四個組件分別為:觸發器(trigger),作業存儲(job store),執行器(executor),調度器(scheduler)。
觸發器(trigger)
包含調度邏輯,每一個作業有它自己的觸發器,用於決定接下來哪一個作業會運行。除了他們自己初始配置意外,觸發器完全是無狀態的
APScheduler 有三種內建的 trigger:
date: 特定的時間點觸發
interval: 固定時間間隔觸發
cron: 在特定時間周期性地觸發
作業存儲(job store)
存儲被調度的作業,默認的作業存儲是簡單地把作業保存在內存中,其他的作業存儲是將作業保存在數據庫中。一個作業的數據講在保存在持久化作業存儲時被序列化,並在加載時被反序列化。調度器不能分享同一個作業存儲。
APScheduler 默認使用 MemoryJobStore,可以修改使用 DB 存儲方案
執行器(executor)
處理作業的運行,他們通常通過在作業中提交制定的可調用對象到一個線程或者進城池來進行。當作業完成時,執行器將會通知調度器。
最常用的 executor 有兩種:
ProcessPoolExecutor
ThreadPoolExecutor
調度器(scheduler)
通常在應用中只有一個調度器,應用的開發者通常不會直接處理作業存儲、調度器和觸發器,相反,調度器提供了處理這些的合適的接口。配置作業存儲和執行器可以在調度器中完成,例如添加、修改和移除作業。
配置調度器
APScheduler提供了許多不同的方式來配置調度器,你可以使用一個配置字典或者作為參數關鍵字的方式傳入。你也可以先創建調度器,再配置和添加作業,這樣你可以在不同的環境中得到更大的靈活性。
下面來看一個簡單的 BlockingScheduler 例子
1 2 3 4 5 6 7 8 9 |
from apscheduler.schedulers.blocking import BlockingScheduler from datetime import datetime def job(): print(datetime.now().strftime("%Y-%m-%d %H:%M:%S")) # 定義BlockingScheduler sched = BlockingScheduler() sched.add_job(job, 'interval', seconds=5) sched.start() |
上述代碼創建了一個 BlockingScheduler,並使用默認內存存儲和默認執行器。(默認選項分別是 MemoryJobStore 和 ThreadPoolExecutor,其中線程池的最大線程數為10)。配置完成后使用 start() 方法來啟動。
如果想要顯式設置 job store(使用mongo存儲)和 executor 可以這樣寫:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
from datetime import datetime from pymongo import MongoClient from apscheduler.schedulers.blocking import BlockingScheduler from apscheduler.jobstores.memory import MemoryJobStore from apscheduler.jobstores.mongodb import MongoDBJobStore from apscheduler.executors.pool import ThreadPoolExecutor, ProcessPoolExecutor # MongoDB 參數 host = '127.0.0.1' port = 27017 client = MongoClient(host, port) # 輸出時間 def job(): print(datetime.now().strftime("%Y-%m-%d %H:%M:%S")) # 存儲方式 jobstores = { 'mongo': MongoDBJobStore(collection='job', database='test', client=client), 'default': MemoryJobStore() } executors = { 'default': ThreadPoolExecutor(10), 'processpool': ProcessPoolExecutor(3) } job_defaults = { 'coalesce': False, 'max_instances': 3 } scheduler = BlockingScheduler(jobstores=jobstores, executors=executors, job_defaults=job_defaults) scheduler.add_job(job, 'interval', seconds=5, jobstore='mongo') scheduler.start() |
在運行程序5秒后,第一次輸出時間。
在 MongoDB 中可以看到 job 的狀態
對 job 的操作
添加 job
添加job有兩種方式:
- add_job()
- scheduled_job()
第二種方法只適用於應用運行期間不會改變的 job,而第一種方法返回一個apscheduler.job.Job 的實例,可以用來改變或者移除 job。
1 2 3 4 5 6 7 8 |
from apscheduler.schedulers.blocking import BlockingScheduler sched = BlockingScheduler() # 裝飾器 @sched.scheduled_job('interval', id='my_job_id', seconds=5) def job_function(): print("Hello World") # 開始 sched.start() |
@sched.scheduled_job() 是 Python 的裝飾器。
移除 job
移除 job 也有兩種方法:
- remove_job()
- job.remove()
remove_job 使用 jobID 移除
job.remove() 使用 add_job() 返回的實例
1 2 3 4 5 |
job = scheduler.add_job(myfunc, 'interval', minutes=2) job.remove() # id scheduler.add_job(myfunc, 'interval', minutes=2, id='my_job_id') scheduler.remove_job('my_job_id') |
暫停和恢復 job
暫停一個 job:
1 2 |
apscheduler.job.Job.pause() apscheduler.schedulers.base.BaseScheduler.pause_job() |
恢復一個 job:
1 2 |
apscheduler.job.Job.resume() apscheduler.schedulers.base.BaseScheduler.resume_job() |
希望你還記得 apscheduler.job.Job 是 add_job() 返回的實例
獲取 job 列表
獲得可調度 job 列表,可以使用get_jobs() 來完成,它會返回所有的 job 實例。
也可以使用print_jobs() 來輸出所有格式化的 job 列表。
修改 job
除了 jobID 之外 job 的所有屬性都可以修改,使用 apscheduler.job.Job.modify() 或者 modify_job() 修改一個 job 的屬性
1 2 |
job.modify(max_instances=6, name='Alternate name') modify_job('my_job_id', trigger='cron', minute='*/5') |
關閉 job
默認情況下調度器會等待所有的 job 完成后,關閉所有的調度器和作業存儲。將 wait 選項設置為 False 可以立即關閉。
1 2 |
scheduler.shutdown() scheduler.shutdown(wait=False) |
scheduler 事件
scheduler 可以添加事件監聽器,並在特殊的時間觸發。
1 2 3 4 5 6 7 |
def my_listener(event): if event.exception: print('The job crashed :(') else: print('The job worked :)') # 添加監聽器 scheduler.add_listener(my_listener, EVENT_JOB_EXECUTED | EVENT_JOB_ERROR) |
trigger 規則
date
最基本的一種調度,作業只會執行一次。若調用的函數中有參數值時,添加args=[參數一,參數二],它的參數如下:
- run_date (datetime|str) – the date/time to run the job at
- timezone (datetime.tzinfo|str) – time zone for run_date if it doesn’t have one already
1 2 3 4 5 6 7 8 9 10 11 12 |
from datetime import date from apscheduler.schedulers.blocking import BlockingScheduler sched = BlockingScheduler() def my_job(text): print(text) # The job will be executed on November 6th, 2009 sched.add_job(my_job, 'date', run_date=date(2009, 11, 6), args=['text']) sched.add_job(my_job, 'date', run_date=datetime(2009, 11, 6, 16, 30, 5), args=['text']) sched.add_job(my_job, 'date', run_date='2009-11-06 16:30:05', args=['text']) # The 'date' trigger and datetime.now() as run_date are implicit sched.add_job(my_job, args=['text']) sched.start() |
cron
- year (int|str) – 4-digit year
- month (int|str) – month (1-12)
- day (int|str) – day of the (1-31)
- week (int|str) – ISO week (1-53)
- day_of_week (int|str) – number or name of weekday (0-6 or mon,tue,wed,thu,fri,sat,sun)
- hour (int|str) – hour (0-23)
- minute (int|str) – minute (0-59)
- second (int|str) – second (0-59)
- start_date (datetime|str) – earliest possible date/time to trigger on (inclusive)
- end_date (datetime|str) – latest possible date/time to trigger on (inclusive)
- timezone (datetime.tzinfo|str) – time zone to use for the date/time calculations (defaults to scheduler timezone)
表達式:
1 2 3 4 5 6 7 8 9 10 11 12 |
from apscheduler.schedulers.blocking import BlockingScheduler def job_function(): print("Hello World") # BlockingScheduler sched = BlockingScheduler() # Schedules job_function to be run on the third Friday # of June, July, August, November and December at 00:00, 01:00, 02:00 and 03:00 sched.add_job(job_function, 'cron', month='6-8,11-12', day='3rd fri', hour='0-3') # Runs from Monday to Friday at 5:30 (am) until 2014-05-30 00:00:00 sched.add_job(job_function, 'cron', day_of_week='mon-fri', hour=5, minute=30, end_date='2014-05-30') sched.start() |
interval
參數:
- weeks (int) – number of weeks to wait
- days (int) – number of days to wait
- hours (int) – number of hours to wait
- minutes (int) – number of minutes to wait
- seconds (int) – number of seconds to wait
- start_date (datetime|str) – starting point for the interval calculation
- end_date (datetime|str) – latest possible date/time to trigger on
- timezone (datetime.tzinfo|str) – time zone to use for the date/time calculations
1 2 3 4 5 6 7 8 9 10 11 12 |
from datetime import datetime from apscheduler.schedulers.blocking import BlockingScheduler def job_function(): print("Hello World") # BlockingScheduler sched = BlockingScheduler() # Schedule job_function to be called every two hours sched.add_job(job_function, 'interval', hours=2) # The same as before, but starts on 2010-10-10 at 9:30 and stops on 2014-06-15 at 11:00 sched.add_job(job_function, 'interval', hours=2, start_date='2010-10-10 09:30:00', end_date='2014-06-15 11:00:00') sched.start() |
# BackgroundScheduler: 適合於要求任何在程序后台運行的情況,當希望調度器在應用后台執行時使用 scheduler = BackgroundScheduler() # 采用非阻塞的方式 # 采用corn的方式 scheduler.add_job(job, 'cron', day_of_week='fri', second='*/5') ''' year (int|str) – 4-digit year month (int|str) – month (1-12) day (int|str) – day of the (1-31) week (int|str) – ISO week (1-53) day_of_week (int|str) – number or name of weekday (0-6 or mon,tue,wed,thu,fri,sat,sun) hour (int|str) – hour (0-23) minute (int|str) – minute (0-59) econd (int|str) – second (0-59) start_date (datetime|str) – earliest possible date/time to trigger on (inclusive) end_date (datetime|str) – latest possible date/time to trigger on (inclusive) timezone (datetime.tzinfo|str) – time zone to use for the date/time calculations (defaults to scheduler timezone) * any Fire on every value */a any Fire every a values, starting from the minimum a-b any Fire on any value within the a-b range (a must be smaller than b) a-b/c any Fire every c values within the a-b range xth y day Fire on the x -th occurrence of weekday y within the month last x day Fire on the last occurrence of weekday x within the month last day Fire on the last day within the month x,y,z any Fire on any matching expression; can combine any number of any of the above expressions ''' scheduler.start()
定時任務設好后,我們需要在linux server上進行執行,使用nohup 執行的命令 &
現在有test.py程序要后台部署, 里面有輸出內容 使用命令: nohup python -u test.py > test.log 2>&1 & 最后的&表示后台運行 2 輸出錯誤信息到提示符窗口 1 表示輸出信息到提示符窗口, 1前面的&注意添加, 否則還會創建一個名為1的文件 最后會把日志文件輸出到test.log文件 查看 tail -f test.log如果要實時查看日志文件使用命令 cat test.log查看全部輸出使用命令