「JVM调优」-记录一次线上调优经历
lipiwang 2025-06-15 17:22 2 浏览 0 评论
背景
一款游戏运行卡顿,玩家一直进不去,连接游戏服务一直超时。游戏服务器情况2core2g
排查流程
1.先看服务端负载情况
2.再看磁盘情况
3.如果不是磁盘满了,查看服务端进程问题
3.进程没有问题,查看内存是不是不够,是不是有内存泄露问题
排查过程
1.top命令查看服务器负载情况
load average数值非常高,top显示有一个Java线程CPU达到 500%。当看到这里的时候我就怀疑是Java线程写的有问题。
2.排查磁盘情况
df -h
发现磁盘正常,说明不是磁盘满了。
3.排查进程情况
前面排查到了线程CPU高达500%,说明一定有线程有问题。
4.查看负载高的线程
top -Hp pid 这个pid是top命令中找到的进程pid
发现有只有一个线程pid高达500左右。
5.导出Java线程栈
jstack -l pid >> stack.log
在stack.log里面搜索这个负载非常高的线程pid
最终找到如下
6.定位代码
at com.xxxx.xx.game.ludo.logic.Room.getPropCheckerNumber(Room.java:259)
通过这行代码,找到了位置。发现该方法有一个while循环,产生了死循环。
这里就发现了代码确实有问题,修改后恢复正常。
笔者也是一个菜鸡程序员,为什么会写这样一个while函数,并且导致了死循环。
/**
* 获得棋子道具地方 而且不能有棋子在上面
* @return
*/
private int getPropCheckerNumber(){
int number = random.nextInt(CheckerBoard.maxNum) + 1 ;
while(checkerPropMap.containsKey(number) || checkerBoardChessMap.containsKey(number)){
number = random.nextInt(CheckerBoard.maxNum) + 1;
}
return number;
}
这是以前写的代码。背景是希望在棋牌空位上获取一个随机的位置放置道具。
笔者做法是,不停的随机一个位置,判断该位置有没有道具,或者没有玩家棋子,如果没有就说明有效,可以返回。
仔细一看是没有问题。
但是checkerPropMap这个位置,由于旧道具没有从map中清除掉(其他功能的问题),导致checkerPropMap最后整个棋牌都是道具,然后while循环退不出去,死循环,线程直接爆了,cpu直接爆了,服务器就挂了。
这种实现有两个问题。
1.不停的while循环,如果命中率不高,很有可能就性能不好。
2.一但while循环受到其他问题的影响,不能退出,可能对整个服务都造成影响。
后面笔者修改为
/**
* 获得棋子道具地方 而且不能有棋子在上面,只能是落在空白处
* @return
*/
private int getPropCheckerNumber(){
List<Integer> getAvailableNumbers = new ArrayList<>();
for (Integer i = 1; i <= CheckerBoard.maxNum; i++) {
if(checkerPropMap.containsKey(i) || checkerBoardChessMap.containsKey(i) || immunityChecker.contains(i) || cannotInitProp.contains(i)){
}else{
getAvailableNumbers.add(i);
}
}
if(getAvailableNumbers.size() == 0){
return 0;
}
return getAvailableNumbers.get(random.nextInt(getAvailableNumbers.size()));
}
做法是,找出棋盘上所有能用的空位置,随机一个空位置即可。问题解决。
后面笔者对于while循环特别慎重,希望读者不要犯笔者这个低级错误,原谅笔者这个菜鸡吧。
最后问题解决
当然如果不是线程问题,接下来如何处理呢?
7.导出dump堆
jmap -dump:format=b,file=文件名 [pid]
8.查看pid内存情况
jmap -heap pid
观察新生代,老年代,内存情况,看看老年代是不是满了,发生full gc
9.查看pid gc情况
jstat -gcutil pid 1000
每秒观察一次gc情况,看是否gc,full gc 次数多。
如果说gc次数多,有可能是新生代和老年代分配内存大小不合理,可以尝试调整下比率。
如果是full gc次数非常多,查看有没有可能由内存泄露,有内存一直没有释放。
10.jvisualvm查看内存情况
将导出来的堆信息,用jvisualvm来分析一下,看大内存到底是什么。
11.用Eclipse Memory Analyzer tool(MAT)来分析是否有内存泄露。
以上就是笔者的一次线上调优经验,笔者犯了一个低级错误,但是也成长了。希望这份经验能对你们有用。
相关推荐
- 软件测试|MySQL CROSS JOIN:交叉连接的详细解析
-
简介在MySQL数据库中,CROSSJOIN是一种用于生成两个或多个表的笛卡尔积的连接方法。CROSSJOIN不需要任何连接条件,它将左表的每一行与右表的每一行进行组合,从而生成一个包含所...
- 「MySQL笔记」left join-on-and 与 left join-on-where 的区别
-
1.摘要关于这两种写法的重要知识点摘要如下:left-join时,即使有相同的查询条件,二者的查询结果集也不同,原因是优先级导致的,on的优先级比where高on-and是进行韦恩运算连接...
- MySQL中的JOIN——联合查询的基本语法
-
MySQL中的JOIN指令用来将两个或多个表中的数据进行联合查询,根据连接条件来匹配记录,从而得到需要的结果集。在MySQL中,常见的JOIN类型包括INNERJOIN、LEFTJOIN和RIGH...
- MySQL 中的 CROSS JOIN:强大的连接工具
-
CROSSJOIN在MySQL里是一种挺特别的连接操作,它能弄出连接表的笛卡尔积。这就是说,要是表A有m行,表B有n行,那ACROSSJOINB的结果就会有m*n...
- 大厂必问:MySQL 三表 JOIN 操作的解析与性能优化,效率又如何?
-
大厂必问:MySQL三表JOIN操作的解析与性能优化策略,效率又如何?点击关注,开启技术之旅!大家好,这里是互联网技术学堂,无论你是一名程序员、设计师、还是对技术充满好奇心的普通人,都欢迎你加入...
- 面试题:MySQL 的 JOIN 查询优化(mysql查询优化方法)
-
MySQL的JOIN查询优化是提升数据库性能的关键环节。以下是综合多个技术文档的核心优化策略,按优先级和实现难度分类:一、索引优化:性能提升的基础为连接字段建立索引确保参与JOIN的列(通常...
- Flink中处理维表关联技术实现路径
-
在Flink中处理维表关联大体氛围TableSQLLookupJoin和DataStream算子函数,主要技术实现路径:I.FlinkSQL/TableAPI中的Lookup...
- 深入剖析Zookeeper原理(一)整体设计
-
1.ZK集群架构设计与特性1.ZK集群架构设计:ZK主要分为三种角色:Leader(领导者):一个Zookeeper集群同一时间只会有一个实际工作的Leader,它会发起并维护与各Follwer及...
- 多种负载均衡算法及其Java代码实现
-
首先给大家介绍下什么是负载均衡负载均衡建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。负载均衡,英...
- 一分钟了解SpringCloud中的ribbon到底是什么,原理是啥?
-
1.概念ribbon是一款客户端负载均衡器,用于微服务之间的负载均衡。首先,什么是客户端负载均衡?如图,ribbon可以通过注册中心获取服务列表,然后自己执行自己的负载均衡策略来决定要访问哪个微服务,...
- Step by Step之腾讯云短信-验证码实践
-
在商城小程序和前端上线用了一阵子之后,用户提出了体验提升的需求,如忘记密码、绑定用户、快捷注册等,作为业界最佳实践的短信验证码登录、重置密码和注册等功能开发也就提上日程了,本文就以重置密码为例,将验证...
- 10分钟入门响应式:Springboot整合kafka实现reactive
-
Springboot引入Reactor已经有一段时间了,笔者潜伏在各种技术群里暗中观察发现,好像scala圈子的同仁们,似乎对响应式更热衷一点。也许是因为他们对fp理解的更深吧,所以领悟起来障碍性更少...
- 使用java随机生成有个性的用户名,LOL地名+水浒传,合计2808个
-
*随机生成用户名*取水浒传108好汉名字*取LOL地名26个,组合而成*一共可以生成2808个不同特色的用户名如果你在上网的时候,用户名难取的话,这里有很多可选择的用户名,现提供100个...
- 深入理解Math.random()的概率分布特性
-
直接上源码/***Returnsa{@codedouble}valuewithapositivesign,*返回一个带符号的double类型的数字,说人话就是返回一个非负...
- 编程英文 - 创建/生成/构建 (create/generate/build)
-
在软件开发中,create、generate和build这三个词经常被用到,它们都与"创造"或"产生"某些东西有关,但在具体使用场景和含义上有所不同。基本含义creat...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 软件测试|MySQL CROSS JOIN:交叉连接的详细解析
- 「MySQL笔记」left join-on-and 与 left join-on-where 的区别
- MySQL中的JOIN——联合查询的基本语法
- MySQL 中的 CROSS JOIN:强大的连接工具
- 大厂必问:MySQL 三表 JOIN 操作的解析与性能优化,效率又如何?
- 面试题:MySQL 的 JOIN 查询优化(mysql查询优化方法)
- Flink中处理维表关联技术实现路径
- 深入剖析Zookeeper原理(一)整体设计
- 多种负载均衡算法及其Java代码实现
- 一分钟了解SpringCloud中的ribbon到底是什么,原理是啥?
- 标签列表
-
- maven镜像 (69)
- undefined reference to (60)
- zip格式 (63)
- oracle over (62)
- date_format函数用法 (67)
- 在线代理服务器 (60)
- shell 字符串比较 (74)
- x509证书 (61)
- localhost (65)
- java.awt.headless (66)
- syn_sent (64)
- settings.xml (59)
- 弹出窗口 (56)
- applicationcontextaware (72)
- my.cnf (73)
- httpsession (62)
- pkcs7 (62)
- session cookie (63)
- java 生成uuid (58)
- could not initialize class (58)
- beanpropertyrowmapper (58)
- word空格下划线不显示 (73)
- jar文件 (60)
- jsp内置对象 (58)
- makefile编写规则 (58)