起源
最近參加公司里的一個比賽,比賽內容里有一項是盡量使用分布式實現項目。因為項目最終會跑在jetsonnano,一個賊卡的開發板,性能及其垃圾。而且要求使用python?
找了很多博客,講的真的是模棱兩可,最后結合官方文檔終於啃出來,寫出來分享一下。
目前本博客的幾個要點:
- 使用celery實現分布式
- 結合flask框架使用
- 使用Redis作為broker
- 使用Redis作為backend
准備工作
安裝環境
需要安裝的環境包括Redis、Celery、Pyhton3.6.9「開發板自帶」
這里需要填坑的是Redis的設置。因為在騰訊雲服務器、華為雲服務器、滴滴雲服務器上做的測試「窮,每個平台褥點羊毛」,一開始不知道在安全組里面開放端口,一直連接不上服務器,很坑。這里如果沒有使用雲服務器的話可以跳過安全組這一步的設置,使用了雲服務器的話,一件開放一下端口,自行百度開放方法。
首先是Redis的設置,Redis需要把默認的120.0.0.1 IP地址修改為0.0.0.0,並把守護進程關閉。
vim redis.conf
bind = 0.0.0.0
protected -mode no //從yes改為no
安裝celery
pip3 install celery -i https://pypi.tuna.tsinghua.edu.cn/simple
一個簡單的分布式Demo
網上關於創建Celery文件的描述都很模糊,這里我的理解是這樣,首先看一下官方給出的Demo:
from celery import Celery
app = Celery('tasks', broker='pyamqp://guest@localhost//')
@app.task
def add(x, y):
return x + y
將這個文件命名為tasks.py
這段代碼最關鍵的核心是app = Celery('tasks', broker='pyamqp://guest@localhost//')
既然是分布式,肯定要有worker,干活的人,也就是雲服務器,在雲服務器上需要做的事情是:celery -A tasks worker --loglevel=info
其中的celery -A *** worker --loglevel=info
*** 就是worker要拿到任務的任務板標志,只有有個這個標志,worker才知道到底誰在發任務。
broker='pyamqp://guest@localhost//'
因為我使用redis來作為任務的存放容器,所以改為 broker='redis://guest@localhost//'
broker是存放任務的地方,所以我把發放任務的服務器的地址填進去: app = Celery('tasks', broker='redis://121.***.***.190:6379')
6379為默認的端口號,其實broker這段url應該包括redis的用戶名、用戶密碼+IP地址。因為我們前面修改的redis的配置文件,所以這里可以無密碼訪問。
@app.task
def add(x, y):
return x + y
這一段就是服務器要發送出去的任務了。當然服務器里不需要包含執行任務所需要的庫,庫安裝在worker的服務器里就可以了。「當然add(x,y)啥庫也不需要」。
現在可以來見識一下celery的威力了,把上面修改后的tasks.py放到worker服務器上面,執行命令:celery -A tasks worker --loglevel=info
你會看到下面這行:
(base) zhaosi@zhaosideMBP *** % celery -A tasks worker --loglevel=info
-------------- celery@zhaosideMBP v4.4.7 (cliffs)
--- ***** -----
-- ******* ---- macOS-10.15.6-x86_64-64bit 2020-09-05 14:35:13
- *** --- * ---
- ** ---------- [config]
- ** ---------- .> app: tasks:0x7fd0bb1b16a0
- ** ---------- .> transport: redis://121.***.***.190:6379/8
- ** ---------- .> results: redis://121.***.***.190:6379/7
- *** --- * --- .> concurrency: 8 (prefork)
-- ******* ---- .> task events: OFF (enable -E to monitor tasks in this worker)
--- ***** -----
-------------- [queues]
.> celery exchange=celery(direct) key=celery
[tasks]
. tasks.add
[2020-09-05 14:35:15,566: INFO/MainProcess] Connected to redis://121.***.***.190:6379/8
[2020-09-05 14:35:15,773: INFO/MainProcess] mingle: searching for neighbors
[2020-09-05 14:35:17,484: INFO/MainProcess] mingle: all alone
[2020-09-05 14:35:18,789: INFO/MainProcess] celery@zhaosideMBP ready.
當你看到最后四行時,YES,最簡單的Demo被你跑起來了
[tasks]
. tasks.add
這里展示的是worker可以接到的任務,當然現在服務器還沒有發布任務,worker在持續監聽服務器上存儲發布任務的redis數據庫,等着接活。
驗收成果
打開雲服務器,准備發布任務「請在服務器上也創建一個tasks.py,不需要安裝任何依賴」
root@-x:~/pro# python3
Python 3.6.9 (default, Jul 17 2020, 12:50:27)
[GCC 8.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from tasks import add
>>> add.delay(1,1)
<AsyncResult: 71c49a0e-2d52-444e-b158-1ae9f1486767>
>>>
回到worker服務器,可以看到任務被接收並且完成了!
[2020-09-05 14:41:10,138: INFO/MainProcess] Received task: tasks.add[71c49a0e-2d52-444e-b158-1ae9f1486767]
[2020-09-05 14:41:10,223: WARNING/ForkPoolWorker-8] 2
可以通過result來接受結果:
>>> result = add.delay(1,1)
<AsyncResult: 71c49a0e-2d52-444e-b158-1ae9f1486767>
>>> result.get()
2
更復雜的返回值請各位自行探索啦
所謂萬事開頭難,有了這個Demo的幫助,后續的任務會簡單很多。
后續
還是官方文檔好啊。現在大多數博客寫的是個啥。