運維常見問題及排查思路


防患未然

備份

  1. 做任何修改之前一定要備份,方便出問題進行回滾。
  2. 數據庫備份,安裝程序備份,條件允許最好異地備份。

權限

  1. 需要登錄服務器的人,分配可以完成工作的最小權限。
  2. 敏感操作要進行逐級確認之后進行操作。

對症下葯

重啟大法

  1. 重啟應用程序
  2. 重啟服務器
  3. 重啟數據庫服務

查看日志

  1. 檢索日志
grep keyValue foo.log
  1. 查看實時打印的日志
tail -f foo.log

系統指標

  1. 硬盤容量(比如日志文件耗盡了硬盤容量)
df -h
  1. 內存使用率(程序出現內存泄漏導致內存溢出)
free 
  1. CPU使用率(死循環耗盡CPU資源)
top

推薦使用gotop插件,可以從終端直觀的、實施的查看CPU、內存、磁盤等指標。

數據庫

  1. 與應用分開部署時,需要確定網絡是否連通
ping dataBaseServerIP
  1. Oracle表空間不足,擴大表空間
  2. Oracle監聽服務死掉,重啟監聽服務
  3. Oracle安裝目錄磁盤空間不足,擴容或刪除備份文件

網絡

  1. 服務器防火牆未設置永久關閉,應用程序安裝之后,發生服務器宕機,重啟后防火牆默認開啟,導致應用無法訪問。
  2. 網管平台對防火牆配置了新的規則而未接到通知,尤其涉及到內外網通信,如果發生詭異問題,要優先考慮下網絡原因。
  3. 有些服務之間的調用涉及到了IP與域名的映射,必要時候需要修改hosts文件。

其他

  1. 解壓備份的文件時最好指定解壓到的文件夾,防止誤操作覆蓋已有的文件
  2. 備份文件要加上備份的日期,必要時候附加說明,多個版本便於恢復。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM