Rebuild 可以恢復損壞的 instance。
那如果是宿主機壞了怎么辦呢? 比如硬件故障或者斷電造成整台計算節點無法工作,該節點上運行的 instance 如何恢復呢?
用 Shelve 或者 Migrate 可不可以? 很不幸,這兩個操作都要求 instance 所在計算節點的 nova-compute 服務正常運行。 幸運的是,還有 Evacuate 操作。
Evacuate 可在 nova-compute 無法工作的情況下將節點上的 instance 遷移到其他計算節點上。但有個前提: Instance 的鏡像文件必須放在共享存儲上。
下面是 Evacuate instance 的流程圖
-
向 nova-api 發送請求
-
nova-api 發送消息
-
nova-scheduler 執行調度
-
nova-scheduler 發送消息
-
nova-compute 執行操作
下面我們詳細討論每一個步驟。
向 nova-api 發送請求
我們的實驗場景如下: Instance c2 運行在 devstack-compute1 上。
通過斷電模擬計算節點故障,然后執行 Evacuate 操作恢復 instance c2。 目前 Evacuate 只能通過 CLI 執行。
這里需要指定 --on-shared-storage 這個參數
查看日志 /opt/stack/logs/n-api.log
nova-api 發送消息
nova-api 向 Messaging(RabbitMQ)發送了一條消息:“Evacuate 這個 Instance” 查看源代碼 /opt/stack/nova/nova/compute/api.py,方法是 evacuate。
大家注意到沒有,evacuate 實際上是通過 rebuild 操作實現的。 這是可以理解的,因為 evacuate 是用共享存儲上 instance 的鏡像文件重新創建虛機
nova-scheduler 執行調度
nova-scheduler 收到消息后,會為 instance 選擇合適的計算節點。 查看日志 /opt/stack/logs/n-sch.log。
nova-scheduler 最后選擇在 devstack-controller 計算節點上重建 instance。
nova-scheduler 發送消息
nova-scheduler 發送消息,通知計算節點可以創建 instance 了。 源代碼在 /opt/stack/nova/nova/scheduler/filter_scheduler.py 第 95 行,方法為 select_destinations。
nova-compute 執行操作
計算節點上的工作是用共享存儲上的鏡像文件重建 instance。 日志在 devstack-controller:/opt/stack/logs/n-cpu.log。
為instance分配資源
使用共享存儲上的鏡像文件
啟動 instance
Evacuate 操作完成后,instance 在 devstack-controller 上運行。
以上是 Evacuate 操作的詳細分析。
至此,我們已經學習完 Nova 所有的操作,下一節將用一張圖總結這些操作的用途和使用場景。