java實(shí)戰(zhàn)CPU占用過(guò)高問(wèn)題的排查及解決
最近一段時(shí)間 某臺(tái)服務(wù)器上的一個(gè)應(yīng)用總是隔一段時(shí)間就自己掛掉 用top看了看 從重新部署應(yīng)用開始沒有多長(zhǎng)時(shí)間CPU占用上升得很快
排查步驟
1.使用top 定位到占用CPU高的進(jìn)程PID
top
2.通過(guò)ps aux | grep PID命令
獲取線程信息,并找到占用CPU高的線程
ps -mp pid -o THREAD,tid,time | sort -rn
3.將需要的線程ID轉(zhuǎn)換為16進(jìn)制格式
printf "%x\n" tid
4.打印線程的堆棧信息 到了這一步具體看堆棧的日志來(lái)定位問(wèn)題了
jstack pid |grep tid -A 30
top 可以看出PID 733進(jìn)程 的占用CPU 172%

查找進(jìn)程733下的線程 可以看到TID 線程775占用了96%且持有了很長(zhǎng)時(shí)間 其實(shí)到這一步基本上能猜測(cè)到應(yīng)該是 肯定是那段代碼發(fā)生了死循環(huán)
ps -mp 733 -o THREAD,tid,time | sort -rn

線程ID轉(zhuǎn)換為16進(jìn)制格式
printf "%x\n" 775

查看java 的堆棧信息
jstack 733 |grep 307 -A 30


顯然是 SmsQueueServiceImpl 中的produceMissSms 和 consumeMissSms 方法有問(wèn)題
一下為精簡(jiǎn)的部分代碼
/** * Created by dongxc on 2015/7/7. 通知消息隊(duì)列 */
@Service("smsQueueService")
public class SmsQueueServiceImpl {
// 生產(chǎn)異常隊(duì)列方法
public void produceMissSms(SmsLogDo smsLogDo) {
/*
* try{ String key = EnumRedisPrefix.SMS_QUEUE_MISS_DEAL.getValue(); boolean result = redisService.lpush(key,
* smsLogDo, 0); if(result==false){ logger.error("通知消息異常隊(duì)列生產(chǎn)消息返回失?。?+smsLogDo.getId()); } }catch(Exception e){
* logger.error("通知消息異常隊(duì)列生產(chǎn)消息失?。?, e); }
*/
}
// 消費(fèi)異常隊(duì)列方法
public SmsLogDo consumeMissSms() {
try {
String destKey = EnumRedisPrefix.SMS_QUEUE_MISS_DEAL.getValue();
SmsLogDo smsLogDo = new SmsLogDo();
Object obj = null;
if (obj == null) {
return null;
} else {
smsLogDo = (SmsLogDo) obj;
}
return smsLogDo;
} catch (Exception e) {
logger.error("通知消息隊(duì)列消費(fèi)方法失?。?, e);
return null;
}
}
}
從很有年代感的垃圾代碼來(lái)看 這兩個(gè)方法并沒有什么問(wèn)題 繼續(xù)往調(diào)用這兩個(gè)方法的上層排查
/**
* Created by dongxc on 2015/7/7.
* 消息通知監(jiān)控線程
*/
@Service("smsMonitorComsumer")
public class SmsMonitorComsumerImpl {
@Autowired
private SmsQueueServiceImpl smsQueueService;
//取隊(duì)列里的任務(wù)消費(fèi)
@Transactional(propagation= Propagation.NOT_SUPPORTED)
public void run() {
while (true) {
try {
SmsLogDo smsLogDo = smsQueueService.consumeMissSms();
Boolean result = false;
if(smsLogDo!=null){
long diff = (new Date()).getTime() - smsLogDo.getSendtime().getTime() ;
long min = diff%(1000*24*60*60)%(1000*60*60)/(1000*60);//計(jì)算差多少分鐘
if(min>5){
result = true;
}
}
if(result){
smsQueueService.produceSms(smsLogDo);
}else{
smsQueueService.produceMissSms(smsLogDo);
}
} catch (Exception ex) {
try{
Thread.sleep(3000);
}catch(Exception e){
//logger.error("發(fā)送站內(nèi)信息短信時(shí)線程執(zhí)行失敗2!", e);
}
}
}
}
}
很顯然 這里有一個(gè)while(true) 基本定位到問(wèn)題了 while里面完全是沒有用的代碼

繼續(xù)往上層看誰(shuí)來(lái)調(diào)用
/**
* Created by dongxc on 2015/7/7.
* 通知消息隊(duì)列
*/
@Service("smsLogRunThread")
public class SmsLogRunThreadImpl {
public int flag;
@Autowired
private SmsLogConsumerImpl smsLogConsumer;
@Autowired
private SmsMonitorComsumerImpl smsMonitorComsumer;
@PostConstruct
public void init() {
if(ip!=""&&host!=""&&ip.equals(host)){
Thread thread = new Thread(){
public void run() {
smsLogConsumer.run();
}
};
thread.start();
Thread thread1 = new Thread(){
public void run() {
smsMonitorComsumer.run();
}
};
thread1.start();
}
}
}
在應(yīng)用一啟動(dòng)的時(shí)候 spring初始化的就會(huì)執(zhí)行這一段處理丟失消息的代碼 然后這段死循環(huán)代碼 沒有任何作用
解決方法 即 注釋掉whlie(true)這一段代碼
案例一下,其實(shí)之前也遇到過(guò)CPU占用很高的問(wèn)題, 但是那次是 頻繁的GC導(dǎo)致的
其實(shí)排查問(wèn)題 的過(guò)程中也是在不斷的學(xué)習(xí)的過(guò)程
相關(guān)文章
使用SpringCloud Gateway解決跨域問(wèn)題
本文給大家介紹了使用SpringCloud Gateway解決跨域問(wèn)題,Spring Cloud Gateway是一個(gè)基于Spring Framework的微服務(wù)網(wǎng)關(guān),使用Spring Cloud Gateway的跨域配置能夠有效管理不同服務(wù)之間的通信,提高系統(tǒng)的可維護(hù)性和安全性,需要的朋友可以參考下2024-02-02
Spring Boot非Web項(xiàng)目運(yùn)行的方法
這篇文章主要給大家介紹了關(guān)于Spring Boot非Web項(xiàng)目運(yùn)行的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用Spring Boot具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-09-09
Java應(yīng)用層協(xié)議WebSocket實(shí)現(xiàn)消息推送
后端向前端推送消息就需要長(zhǎng)連接,首先想到的就是websocket,下面這篇文章主要給大家介紹了關(guān)于java后端+前端使用WebSocket實(shí)現(xiàn)消息推送的詳細(xì)流程,需要的朋友可以參考下2023-02-02
java編譯時(shí)出現(xiàn)使用了未經(jīng)檢查或不安全的操作解決方法
這篇文章主要介紹了java編譯時(shí)出現(xiàn)使用了未經(jīng)檢查或不安全的操作的解決方法,需要的朋友可以參考下2014-03-03

