原文:記一次生產環境大面積404問題!

寫在前面 發布到線上的接口服務一直好端端的,今天突然運營反饋說很多功能無法正常使用。經過排查,發現前端調用后端接口時,部分接口出現 的現象。今天,我到公司比較晚,肯定是哪個小伙伴昨晚下班,走出辦公室前沒有祈禱服務器不要出問題。要把這個人揪出來,吊在服務器上 祭天 文章已收錄到: https: github.com sunshinelyz technology binghe https: gitee ...

2021-03-29 19:43 0 587 推薦指數:

查看詳情

一次生產環境presto刪表失敗的問題

場景,開發用java程序連接presto創建一個表,這個表在hdfs的權限為: 然后用presto去刪除這個表 報錯,沒有權限刪除,查看上一級目錄權限,發現權限正常 直連hive刪表 ...

Fri May 31 02:06:00 CST 2019 2 1451
一次生產dubbo線程池耗盡的問題

問題:   dubbo線程池耗盡,活躍線程數超過線程池最大線程數(dubbo默認線程池最大線程數為200) 登錄服務提供者所在服務器 通過命令行連接dubbo: 查看dubbo活躍線程: 可以通過增加線程池最大線程數來解決 ...

Fri Apr 03 19:04:00 CST 2020 0 3640
一次生產請求耗時的問題

最近發現lb上記錄的request_time比upstream_response_time大的比較多,例如upstream_response_time記錄是0.062,request_time記錄的就是5.064等等。整個耗時很反常。而且出現這個問題基本上都是一個返回值比較大的接口 ...

Sat Mar 30 16:34:00 CST 2019 3 1869
復盤一次生產問題

有整整 10 天木有更文了,這段時間確實比較忙。 有加我微信的朋友知道我上周末出去春游了,部門組織去了趟外伶仃島,環境挺不錯的,這段時間去的人也比較少,值得去玩。 今天講講上周末一次生產問題的復盤。 1 事情經過 周日中午從外伶仃島回來就直奔公司,因為生產出了些問題問題 ...

Mon Mar 25 17:18:00 CST 2019 1 755
【疑難雜症】一次生產問題之事務超時

現象和猜測 我們每日日終跑批,跑批的第一步要去NFS文件系統檢查信貸還款文件的標志文件,即dbas.ok文件,以便做相關賬務處理,該代碼使用了while(true),直到file.exist()返回 ...

Thu Nov 30 01:45:00 CST 2017 0 1020
一次生產環境docker服務CPU飆高排查

今天早上,運維同學發現生產某個服務 CPU 持續飆高,於是開始進行排查: 1、首先使用 top 命令,查看 CPU 占用高的進程,得到進程 ID    2、根據上一步找到的進程ID,ps -ef | grep [進程ID] 找到對應程序    3、進入程序對應docker容器 ...

Sat Dec 25 01:25:00 CST 2021 0 1148
一次生產環境tomcat線程數打滿情況分析

前言 旨在分享工作中遇到的各種問題及解決思路與方案,與大家一起學習. -- 學無止境, 加油 ! Just do it ! 問題描述 運行環境描述 tomcat-8.5 單節點(該應用集群20個節點 ...

Thu Aug 13 07:25:00 CST 2020 1 1109
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM