0. 數據庫運維做些什么

本文轉載自查看原文 2013-07-19 15:27 5662 DBA/ 運維/ 做什么/ SQL Server/ SQL Server 運維/ 維護

一. 數據庫生命周期
結合軟件生命周期、項目的開展，數據庫的生命周期大致可分為這么幾個階段。

1. 規划
在立項后，對於數據庫平台的軟硬件選型，以及大致的數據庫架構。
1.1 配置多少台服務器，服務器的內存大小/磁盤空間、IOPS/CPU核數/網絡帶寬等；
1.2 選擇的操作系統/數據庫產品/第三方工具，及相應版本；
1.3 整體架構，比如是否考慮：HA, Scale out, load balance, 讀寫分離等策略。

2. 開發
開發的工作，通常是在開發/測試環境上進行的，測試結束后搬到生產環境。
2.1 數據庫設計；
2.2 SQL編程及調試；
2.3 開發過程中的SQL優化。

3. 實施
開發的數據庫程序到生產環境的部署。到這里，基本是項目上線了。后面就進入了運維階段。
3.1 前期規划時數據庫物理架構的部署；
3.2 開發/測試完成的數據庫程序部署。

二. 運維做些什么
從上面的圖來看，運維是項目上線后的工作。看看從項目上線開始，運維都做了什么。
1. 部署環境
1.1 數據庫安裝（如果服務器太多，可以選擇靜默安裝）；
1.2 參數配置（操作系統、數據庫實例、數據庫參數）；
1.3 權限分配（登錄、數據庫用戶權限）。

2. 備份/還原
對於數據庫來說，有個可用的備份是非常重要的，防止有數據損壞，用戶誤操作等造成的數據丟失。保證了數據的存在，運維才有意義，否則其他工作做的再好也是白搭。

3. 監控
對於運維來說，首先要保證數據庫的運行，然后就是運行中系統的性能。所以監控主要分為這兩點：
3.1 數據庫運行狀態，有沒有什么數據庫中斷或異常、錯誤或警告？
3.2 數據庫性能，有沒有什么性能問題或者性能隱患？

4. 故障處理
在監控過程中發現，或者系統用戶反饋出來的數據庫錯誤或者警告，進行診斷並修復。

5. 性能優化
在監控過程中發現，或者系統用戶反饋出來的數據庫性能問題，進行優化。

6. 容災
容災只是手段，最終還是為了保證系統的可用性，通常選擇的策略有：故障轉移集群、鏡像、日志傳送、異地備份等。
如果在實施時，已經部署了容災策略，那么這時只要做一些狀態監視即可。
也有系統是在上線一段時間之后，才補充部署容災策略的。

7. 升級/遷移
7.1 升級
通常是在本機進行，硬件不變，比如：更換操作系統、數據庫的版本、打補丁；
7.2 遷移
通常是需要升級硬件，比如：更換新的服務器，所以把數據庫搬到新的服務器上；
也有在本機“遷移”，只是為了移動數據庫文件的位置。
7.3 遷移+升級
不過很多時候，都是在遷移中做升級，也就是換了新的服務器，也換了軟件版本。

8. 健康檢查
通常叫做巡檢或者Health Check。可能是每天、每月、每年的。
事實上如果把巡檢的內容做到每天、每小時、甚至每X分鍾，那就是一個准實時的系統監控。

9. 系統用戶反饋的數據庫問題
用戶反饋出來的任何數據庫問題，需要DBA去做處理，即便有時診斷出來並非數據庫的問題。
從廣義上來看，除去數據庫開發外的其他任務，都應該算在運維職責之內。

問：那么數據庫運維到底都有哪些日常任務？
答：把上面的每項任務要做的事情一個個羅列出來就可以了。
比如，3.1 數據庫運行狀態監控包括：
(1) 數據庫服務器是否可用；
(2) 數據庫服務是否啟用/中斷；
(3) 磁盤空間；
(4) 錯誤日志檢查；
(5) 數據庫一致性檢查；
(6) 作業運行狀態；
(7) 索引碎片檢查
(8) ……
后面會逐個分解各項任務的詳細清單。

三. 運維過程中的問題解決
運維過程中遇到問題時，如果能夠通過自己/他人的經驗解決，那么固然好；

但如果沒有解決思路的話，通常是這樣去查：
1. 查日志：操作系統/數據庫/應用程序日志中，有沒有相關的錯誤/信息提示；
2. 查錯誤號：官方文檔/網友分享中，有沒有解決方案；
3. 如果都沒有找到，那么就中獎了，自己分析不出就團隊分析，團隊分析不出找官方支持，當然有的時候，官方支持也不是一定能解決。

注意：對於在線系統，這么慢慢查下去，時間可能消耗太久，會影響用戶體驗。通常是優先快速解決問題，那怕只是用臨時應急方案，以保證系統的可用性，然后再去分析根本原因，以徹底解決，防止下次再發生。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 數據庫運維平台數據庫運維平台數據庫智能運維探索與實踐 MySQL數據庫運維的五大指標如何搭建數據庫自動化運維體系運維角度淺談MySQL數據庫優化輕松精通數據庫管理之道——運維巡檢之八（性能）《MySQL數據庫從入門到精通》高級運維人才的必備書籍 MySQL數據庫作發布系統的存儲，一天五萬條以上的增量，預計運維三年,怎么優化？ Redis開發與運維：數據遷移