這是 OpenStack 實施經驗分享系列的第 9 篇。
OpenStack 用多了,經常會遇到這種情況:對 instance 執行某個操作如果失敗了就會處於 “error” 狀態:
而且這時我們除了刪除 instance 外,幾乎做不了其他操作。
本節就教大家如何恢復 "error" 的 instance。以上面的情況為例,error 之后,可以點擊 instance 的鏈接,到詳情頁中看看 error 的具體原因。
可以看到當時執行 resize 操作時發生了異常情況,導致操作出錯。 其實這不是致命錯誤,instance 沒有受損,還能正常運行。現在我們要做到是想辦法將 instance 恢復到正常的狀態。
Web GUI 是沒有相應的操作,只能通過 nova reset-state 命令行操作。
reset-state 的使用方法還是很直接的,上面因為 instance 不屬於默認的 admin project,所以需要通過 --os-project-id 指定。執行成功后,instance 的狀態被重置為 “active”,我們又可以對其進行各種常規操作了。
下一節分享一個故障排查的實際案例。