原文:记一次生产环境asp.net core内存暴增以及无法释放导致应用宕机

环境: PCF AWS 在production环境上传几张图片后,app 内存暴增以及无法释放导致crashed in a short time 解决方案: 解决内存不能主动释放问题 项目文件增加了GC工作模式 相关文档https: www.iaspnetcore.com blog blogpost a af d f f be net core two kinds of gc mode serve ...

2021-08-18 16:21 0 126 推荐指数:

查看详情

一次生产线程数耗尽,导致内存溢出(outOfMemoryError)问题及解决

问题:   数据源连接池线程数最大连接数最初设置300,但是一周有2-3发生活跃连接数超过最大线程数,导致线程堵塞,服务查询等待超时,所以运维将最大线程数调至1500,这样导致JVM创建的线程数大大增多,原先配置的JVM内存不够使用,导致内存溢出,无法创建线程。 解决:   后将最大线程数 ...

Fri Apr 03 19:55:00 CST 2020 0 2556
一次流量造成的“生产事故”优化经历!

欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 前言 “在一次正常的活动促销之后,客服开始陆续反馈有用户反应在抢标的时候打不开网页或者 APP,在打开的时候标的就已经被抢光了。 刚开始没有特别的上心,觉得抢标不就是这样吗,抢小米手机的时候不也是 ...

Fri Nov 24 18:22:00 CST 2017 4 899
一次生产环境presto删表失败的问题

场景,开发用java程序连接presto创建一个表,这个表在hdfs的权限为: 然后用presto去删除这个表 报错,没有权限删除,查看上一级目录权限,发现权限正常 直连hive删表 ...

Fri May 31 02:06:00 CST 2019 2 1451
一次生产环境大面积404问题!

写在前面 发布到线上的接口服务一直好端端的,今天突然运营反馈说很多功能无法正常使用。经过排查,发现前端调用后端接口时,部分接口出现404的现象。今天,我到公司比较晚,肯定是哪个小伙伴昨晚下班,走出办公室前没有祈祷服务器不要出问题。要把这个人揪出来,吊在服务器上——祭天! 文章已收 ...

Tue Mar 30 03:43:00 CST 2021 0 587
一次生产事故--磁盘被占满

写在前面 今天,跑在阿里云ECS上的生产环境,突然间访问异常,接口各种报错,无奈公司没有专业的运维人员,只能硬着头皮解决一下。 问题排查 先从表面看起,数据库首先报错 直观上看,设备没有可用空间,也就是磁盘满了。 进入服务器后台,执行 发现确实磁盘满了,而且满的很彻底。系统盘 ...

Tue Feb 11 03:58:00 CST 2020 0 782
一次生产环境docker服务CPU飙高排查

今天早上,运维同学发现生产某个服务 CPU 持续飙高,于是开始进行排查: 1、首先使用 top 命令,查看 CPU 占用高的进程,得到进程 ID    2、根据上一步找到的进程ID,ps -ef | grep [进程ID] 找到对应程序    3、进入程序对应docker容器 ...

Sat Dec 25 01:25:00 CST 2021 0 1148
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM