在運維日常工作過程中遇到的一些問題,以及最終的解決方法!!(持續更新帖)


  進入IT行業差不多也有三年時間了,想着自己從一個小白,一路莫爬滾打走到現在,挺不容易的,因為大學學的不是計算機專業,實習公司又是一個軟件開發公司,自己的實習部門又是后端技術部門,也算是機緣巧合吧,成為我踏入IT的前因。

  本帖只是對我在這么久工作過程和以后工作過程中遇到的一些問題做一次匯總,可能有簡單的,希望大神不要見笑,也可能有棘手的,知道解決方法的小伙伴歡迎交流,希望能對看過帖子的小伙伴提供一些幫助:

  1,防火牆規則清空后在INPUT鏈上設置默認DROP規則,導致測試服務器‘自閉’了!

背景說明:公司新開發了一個小項目,想在測試服務器先試運行下,因為是針對不同的客戶端開放,需要設置iptables規則。新來的同事連上服務器后,直接先清空了原有規則,在不清楚要添加什么規則的時候,為了方式其他人連接使用測試服務器,就把INPUT鏈的默認規則由ACCEPT改成了DROP(注意:默認規則要么是ACCEPT要么是DROP,不可能是REJECT),結果就是測試服務器“自閉”了,拒絕一切連接。

處理辦法:接到這個問題時,我當時就驚呆了,小伙子,你怕不是個大傻子吧???就算你不想讓別人用,也不用這么搞呀?公司就這么幾個人,喊一嗓子就行了,沒人給你爭!不過我還得感謝他,感謝他沒有save,要不這個測試服務器估計要當廢品處理了!還好我知道點東西,沒有保存,重啟失效呀,於是我就跑到機房,把測試服務器重啟了下,嗯,然后就連上了,這是還好機房就在我們辦公樓,要是阿里的服務器,那我就只能呵呵了!!!

   2,數據庫做雙主雙漂移數據同步時,主從同步一直不成功,讓我頭疼了倆小時!

背景說明:這是我接到公司指示,自己給其他公司搭建一個官網的基礎架構,在做數據庫的互為主從雙漂移時,兩個數據庫的內容一直同步不成功,查看master狀態,查看salve狀態,在slave庫同步master,怎么都同步不成功。

處理辦法:在數據庫一直同步不成功后,心態有點炸了,但是我要告訴自己,要冷靜!我拿出來自己最初畫的架構圖,自己研究了下,發現了問題所在。我要做的是互為主從的雙漂移數據庫,重點是互為主從(假設s1為主1,s2為主2 s1為主時s2為從,s2為主時s1為從),我在s2作為從時同步了s1主庫的信息,我在s1為從時同步s2主庫的命令和s2為從同步s1為主時的命令的區別就是把主機名改了下,如果兩個數據庫都是新的數據庫,或許能成功,問題時兩個數據庫里面有了一些數據呀,這就但是兩個主的bin-log名和position點不一樣呀!於是我把命令拿過來,查看了s1的主庫狀態,然后到s2同步,又查看了s2的主庫狀態,到s1同步,然后就搞定了!當時我就想抽自己兩個巴掌,自己畫的圖自己建的庫還能搞錯,看了IT這個行業是真的容不得半點馬虎呀,做IT,一定要仔細。

  3、作為公司的VIP中P會員用戶,其信息的安全行必須得到保障,為了加強這些會員的信息安全,公司專門為其搭建了雙主雙漂移數據庫,每個主庫再掛兩個從庫,沒錯,VIP中P的待遇就是這么溜。問題是:突然有一個一個從節點從集群中掉了?沒錯,掉了,什么鬼情況?

檢查思路:看到報警郵件的那刻,我有點蒙,正常運作半年的集群架構,咋突然從庫就掉了呢?於是我遠程等上從庫,查看最后一次操作人員是誰,結果發現竟然是開發程序員?唉,小公司就是憋屈,讓程序員上服務器,搞宕機了讓我一個小運維背鍋,沒辦法,誰讓老板開心呢!!!看看他做了什么操作吧?修改了網站文件代碼,額,沒錯,他在從庫上修改了網站代碼,我當時心中是有一萬頭神獸崩騰而過,你修改主庫它還能同步運作,修改從庫是幾個意思???

處理辦法:看到這個后,我要做的首先是限制程序員登錄服務器的權利,給他的用戶權限修改為readonly,這樣的話他在從庫就只能看不能動了。那么主庫呢?總不能隨便讓他登錄數據庫吧?但是老板同意呀,沒辦法,隨他去吧!然后獲取當前數據庫二進制日志狀態,重新同步一次,保持數據的一致性,再加入集群就可以了!(讓程序員上服務器,唉真的是無發可脫……)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM