
线上问题精准定位es问题排查应用报错 es访问超时部分人员定位 代码查询时间范围太大超过3个月了es索引按照天创建经过仔细观察es 监控发现有一个节点 cpu 使用率异常cpu使用较正常水平下降 60%进一步查看es集群日志发现 改节点 发生了持续了 14分钟的fullgc确认es集群 java版本是jdk11 垃圾回收器是cms 决定升级垃圾回收器为 g1测试环境压测对比上线后 没有再出现es超时服务重启k8s node组部署未添加反亲和性导致服务重启后 oom 被kill掉上游找不到服务大量报错