前言
做好日常巡檢是數據庫管理和維護的重要步驟,而且需要對每次巡檢日期、結果進行登記,同時可能需要出一份巡檢報告。
本系列旨在解決一些常見的困擾:
- 不知道巡檢哪些東西
- 不知道怎么樣便捷體檢
- 機器太多體檢麻煩
- 生成報告困難,無法直觀呈現結果
服務器的硬件情況大多數情況會有硬件組專門負責巡檢,但是作為數據庫服務器的管理者,我們也要時刻警惕,萬一硬件的兄弟稍稍一偷懶,你管理的數據服務器出現問題也不能及時發現,或硬件配置縮水導致的性能問題,這也是必要的硬件巡檢的原因。
總體情況概覽
1.在【檢查項】-【全部】或【環境】頁可以整體查看系統硬件資源使用情況。如果硬件出現問題影響數據庫,則檢測會出現報警問題。
2.在【系統】-【硬件】頁可查看處理器、物理內存、磁盤、網卡等詳細信息。
運行環境與版本
在【系統】-【軟件環境】查看操作系統信息及SQL Server信息
磁盤使用情況
磁盤空間不必過多介紹當磁盤空間所剩無幾需要及時規划和清理,根據數據庫的增量情況規划磁盤也是必要的(在數據庫巡檢中將介紹數據增量的巡檢辦法)
1.在SQL專家雲的【概覽】頁面即可圖形化查看磁盤空間
2.在【系統】-【硬件】-【磁盤】中可以查看磁盤的使用及物理磁盤划分等詳細信息
3.磁盤壓力分析
磁盤壓力可通過【性能計數器】診斷(具體請詳見:系統磁盤壓力分析)
內存使用情況
1.在SQL專家雲的【概覽】頁面即可圖形化查看服務器目前的可用內存情況。
2.在【系統】-【硬件】頁可查看物理內存詳細信息。
3.分析內存壓力
內存壓力可通過【性能計數器】診斷(具體請詳見:系統內存壓力分析)
處理器情況
1.在SQL專家雲的【概覽】或【性能計數器】頁面即可圖形化查看服務器CPU情況。
2.CPU是否能被完全識別或使用
在【檢查項】-【全部】或【環境】頁可以整體查看系統硬件資源使用情況。如果CPU不能被CPU或檢測的CPU數少於系統配置,則會出現警告。
網絡環境
1.在【系統】-【硬件】頁可查看物網卡詳細信息。
2.在【性能計數器】頁查看系統網絡壓力情況
總結
日常巡檢旨在及時發現系統問題和潛在風險,是任何數據庫管理員、運維人員必要的操作,個人建議核心系統每月至少一次詳細的體檢,輔助系統每三個月至少一次體檢,以保證系統正常運行,消滅隱患,運維人員不在扮演救火隊員的角色,讓數據庫運維管理不再難以入手。