Linux系統(tǒng)中CPU占用率較高問題排查思路與解決方法
前言
作為 Linux 運維工程師,在日常工作中我們會遇到 Linux服務器上出現(xiàn)CPU負載達到100%居高不下的情況,如果CPU 持續(xù)跑高,則會影響業(yè)務系統(tǒng)的正常運行,帶來企業(yè)損失。
很多運維的同學遇到這種狀況往往會不知所措,對于CPU過載問題通常使用以下兩種方式即可快速定位:
方法一
第一步:使用
top命令,然后按shift+p按照CPU排序
找到占用CPU過高的進程的pid
第二步:使用
top -H -p [進程id]
找到進程中消耗資源最高的線程的id
第三步:使用
echo 'obase=16;[線程id]' | bc或者printf "%x\n" [線程id]
將線程id轉(zhuǎn)換為16進制(字母要小寫)
bc是linux的計算器命令
第四步:執(zhí)行
jstack [進程id] |grep -A 10 [線程id的16進制]”
查看線程狀態(tài)信息
方法二
第一步:使用
top命令,然后按shift+p按照CPU排序
找到占用CPU過高的進程
第二步:使用
ps -mp pid -o THREAD,tid,time | sort -rn
獲取線程信息,并找到占用CPU高的線程
第三步:使用
echo 'obase=16;[線程id]' | bc或者printf "%x\n" [線程id]
將需要的線程ID轉(zhuǎn)換為16進制格式
第四步:使用
jstack pid |grep tid -A 30 [線程id的16進制]
打印線程的堆棧信息
案例分析
場景描述
生產(chǎn)環(huán)境下JAVA進程高CPU占用故障排查
解決過程
1、根據(jù)top命令,發(fā)現(xiàn)PID為2633的Java進程占用CPU高達300%,出現(xiàn)故障。
2、找到該進程后,如何定位具體線程或代碼呢,首先顯示線程列表,并按照CPU占用高的線程排序:
[root@localhost ~]# ps -mp 2633 -o THREAD,tid,time | sort -rn
顯示結果如下:
找到了耗時最高的線程(TID)3626,占用CPU時間有12分鐘了!
3、將需要的線程TID轉(zhuǎn)換為16進制格式
[root@localhost ~]# printf "%x\n" 3626 e18
4、最后使用jstack命令打印出該進程下面的此線程的堆棧信息:
[root@localhost ~]# jstack 2633 |grep "e18" -A 30
相比故障的解決而言,發(fā)現(xiàn)故障也同等的重要!市場上的大多數(shù)監(jiān)控軟件都能實現(xiàn)服務器負載的實時觀測,比如:Zabbix、Nagios、阿里云監(jiān)控(針對云服務器)等。但是當中大部分的軟件都需要運維同學主動去設置規(guī)則或者檢測才能發(fā)現(xiàn)問題,如何被動的也能收到告警呢?
推薦大家一個實用的運維軟件——王教授,對于業(yè)務部署在阿里云上的用戶,只需綁定需要監(jiān)控的只讀AcessKey,即可將云上資源的告警信息及時通知給對應的團隊成員。
化主動為被動的方式,一方面減輕了運維工程師的工作,另一方面也減小了運維漏看或者忽略告警的情況發(fā)生。
總結
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。
相關文章
Linux一鍵安裝web環(huán)境全攻略(阿里云服務器)
這篇文章主要介紹了Linux一鍵安裝web環(huán)境全攻略,這些都是阿里云出的方便站長架設php運行環(huán)境的工具,需要的朋友可以參考下2016-10-10詳解Ubuntu14.04橋接網(wǎng)絡設置與SSH登陸
本篇文章主要介紹了詳解Ubuntu14.04橋接網(wǎng)絡設置與SSH登陸,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-01-01Apache啟動錯誤Permission denied: httpd: could not open error log
這篇文章主要介紹了Apache啟動錯誤Permission denied: httpd: could not open error log file解決方法,需要的朋友可以參考下2014-07-07linux grep查找的結果中顯示匹配行的上下行內(nèi)容方式
這篇文章主要介紹了linux grep查找的結果中顯示匹配行的上下行內(nèi)容方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-11-11Linux內(nèi)核設備驅(qū)動之內(nèi)存管理筆記整理
今天小編就為大家分享一篇關于Linux內(nèi)核設備驅(qū)動之內(nèi)存管理筆記整理,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2018-12-12