原文:記一次生產環境tomcat線程數打滿情況分析

前言 旨在分享工作中遇到的各種問題及解決思路與方案,與大家一起學習. 學無止境, 加油 Just do it 問題描述 運行環境描述 tomcat . 單節點 該應用集群 個節點 avg tps ,max tps tomcat max threads: 下圖藍色線 tomcat busy threads 正常 下圖綠色線 tomcat cur threads飛升 下圖黃色線 每次黃色線上升時可以 ...

2020-08-12 23:25 1 1109 推薦指數:

查看詳情

一次生產線程耗盡,導致內存溢出(outOfMemoryError)問題及解決

問題:   數據源連接池線程最大連接最初設置300,但是一周有2-3發生活躍連接超過最大線程,導致線程堵塞,服務查詢等待超時,所以運維將最大線程調至1500,這樣導致JVM創建的線程大大增多,原先配置的JVM內存不夠使用,導致內存溢出,無法創建線程。 解決:   后將最大線程 ...

Fri Apr 03 19:55:00 CST 2020 0 2556
一次生產dubbo線程池耗盡的問題

問題:   dubbo線程池耗盡,活躍線程超過線程池最大線程(dubbo默認線程池最大線程為200) 登錄服務提供者所在服務器 通過命令行連接dubbo: 查看dubbo活躍線程: 可以通過增加線程池最大線程數來解決 ...

Fri Apr 03 19:04:00 CST 2020 0 3640
一次生產環境presto刪表失敗的問題

場景,開發用java程序連接presto創建一個表,這個表在hdfs的權限為: 然后用presto去刪除這個表 報錯,沒有權限刪除,查看上一級目錄權限,發現權限正常 直連hive刪表 ...

Fri May 31 02:06:00 CST 2019 2 1451
一次生產環境大面積404問題!

寫在前面 發布到線上的接口服務一直好端端的,今天突然運營反饋說很多功能無法正常使用。經過排查,發現前端調用后端接口時,部分接口出現404的現象。今天,我到公司比較晚,肯定是哪個小伙伴昨晚下班,走出辦 ...

Tue Mar 30 03:43:00 CST 2021 0 587
一次生產事故--磁盤被占滿

寫在前面 今天,跑在阿里雲ECS上的生產環境,突然間訪問異常,接口各種報錯,無奈公司沒有專業的運維人員,只能硬着頭皮解決一下。 問題排查 先從表面看起,數據庫首先報錯 直觀上看,設備沒有可用空間,也就是磁盤滿了。 進入服務器后台,執行 發現確實磁盤滿了,而且滿的很徹底。系統盤 ...

Tue Feb 11 03:58:00 CST 2020 0 782
一次生產環境docker服務CPU飆高排查

今天早上,運維同學發現生產某個服務 CPU 持續飆高,於是開始進行排查: 1、首先使用 top 命令,查看 CPU 占用高的進程,得到進程 ID    2、根據上一步找到的進程ID,ps -ef | grep [進程ID] 找到對應程序    3、進入程序對應docker容器 ...

Sat Dec 25 01:25:00 CST 2021 0 1148
一次生產請求耗時的問題

最近發現lb上記錄的request_time比upstream_response_time大的比較多,例如upstream_response_time記錄是0.062,request_time記 ...

Sat Mar 30 16:34:00 CST 2019 3 1869
 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM