原文:系統上線那點事 - 記一次線上系統故障

該項目是一個微信轉盤游戲抽獎營銷項目,由於運營營銷時間要求緊迫,開發測試部署上線用了 天不到,有些准備工作並沒有到位,如: .由於整體開發在上線前 天才完成,測試了解這個項目需求是在開發的第二周,並沒有充足的時間進行完善的功能,UI機型適配,系統壓力測試。 .技術上由於合作方的公眾號密鑰並不適合直接給出,所以由對方封裝微信接口獲取所需功能,對方封裝的微信接口給出比較遲,在預定開始時間前三天 微信的 ...

2015-07-08 11:24 9 1372 推薦指數:

查看詳情

一次文件系統故障的修復

1 故障起因 收到白盒告警:線上機器ip:x.x.x.x 文件系統沒有掛載(/search/odin)。 看來得登上機器排查了。 2 df -h看下情況 果然/search/odin沒了。 3 journalctl看日志 journalctl 用來查詢 ...

Thu Jun 13 00:23:00 CST 2019 0 577
一次線上商城系統高並發的優化

對於線上系統調優,它本身是個技術活,不僅需要很強的技術實戰能力,很強的問題定位,問題識別,問題排查能力,還需要很豐富的調優能力。 本篇文章從實戰角度,從問題識別,問題定位,問題分析,提出解決方案,實施解決方案,監控調優后的解決方案和調優后的觀察等角度來與大家一起交流分享本次線上 ...

Fri Jul 03 02:03:00 CST 2020 43 5282
Linux常見系統故障

Linux常見系統故障 1.修復MBR扇區故障 2.修復GRUB引導故障 3./etc/inittab文件丟失 4.遺忘root用戶密碼 5.修復文件系統 6.磁盤資源耗盡故障 一、修復MBR扇區故障 1.關機添加一塊硬盤,開機查看硬盤設備分區列表,是否存在/dev/sdb設備信息 ...

Thu Apr 04 08:16:00 CST 2019 2 1280
一次上線就跪的故障排查案例

這個是我很早以前解決的一個案例,其現象是系統每次上線后,20多台機器,總有兩三機器,出現假死的情況。如何判斷出系統假死?借助的是一個第三方公司運維監控平台;這種情況,前同事稱之為的“假死”,需要重新啟動系統才能恢復。因為我是新來乍到,覺得這種情況不正常,而且對研發(在這邊是研發上線)來說,是一個 ...

Tue Apr 30 20:22:00 CST 2019 4 1634
一次線上kafka一直rebalance故障

來源 https://www.jianshu.com/p/271f88f06eb3 今天我司線上kafka消息代理出現錯誤日志,異常rebalance,而且平均間隔2到3分鍾就會rebalance一次,分析日志發現比較嚴重。錯誤日志 ...

Mon Mar 02 04:10:00 CST 2020 0 1334
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM