Linux服務(wù)器Java進(jìn)程消失問題解決
這篇文章主要介紹了Linux服務(wù)器Java進(jìn)程消失問題解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
問題描述
在實際生產(chǎn)環(huán)境下,如果我們遇見Java進(jìn)程突然消失,該如何去排查問題?
思路
可能有幾種原因:
①、Java應(yīng)用程序的問題:發(fā)生OOM導(dǎo)致進(jìn)程Crash
最常見的是發(fā)生堆內(nèi)存異?!癹ava.lang.OutOfMemoryError: Java heap space”,排查步驟如下:
- Step1: 查看JVM參數(shù) -XX:+HeapDumpOnOutOfMemoryError 和 -XX:HeapDumpPath=*/java.hprof;
- Step2: 根據(jù)HeapDumpPath指定的路徑查看是否產(chǎn)生dump文件;
- Step3: 若存在dump文件,使用Jhat、VisualVM等工具分析即可;
②、JVM出錯:JVM或JDK自身的Bug導(dǎo)致進(jìn)程Crash
當(dāng)JVM發(fā)生致命錯誤導(dǎo)致崩潰時,會生成一個hs_err_pid_xxx.log這樣的文件,該文件包含了導(dǎo)致 JVM crash 的重要信息,我們可以通過分析該文件定位到導(dǎo)致 JVM Crash 的原因,從而修復(fù)保證系統(tǒng)穩(wěn)定。
默認(rèn)情況下,該文件是生成在工作目錄下的,當(dāng)然也可以通過 JVM 參數(shù)指定生成路徑:
-XX:ErrorFile=/var/log/hs_err_pid<pid>.log
這個文件的內(nèi)容他主要有如下內(nèi)容
- 日志頭文件
- 導(dǎo)致 crash 的線程信息
- 所有線程信息
- 安全點和鎖信息
- 堆信息
- 本地代碼緩存
- 編譯事件
- gc 相關(guān)記錄
- jvm 內(nèi)存映射
- jvm 啟動參數(shù)
- 服務(wù)器信息
拿到這個文件后,不用說了,慢慢啃吧。說到這里,我要摸著良心說。這個文件巨復(fù)雜,如果要會讀這個文件,請下點功夫。
③被操作系統(tǒng)OOM-Killer
Linux 內(nèi)核有個機(jī)制叫OOM killer(Out-Of-Memory killer),該機(jī)制會監(jiān)控那些占用內(nèi)存過大,尤其是瞬間很快消耗大量內(nèi)存的進(jìn)程,為了防止內(nèi)存耗盡而內(nèi)核會把該進(jìn)程殺掉。
因此,你發(fā)現(xiàn)java進(jìn)程突然沒了,首先要懷疑是不是被linux的OOM killer給干掉了!
你可以去下面這個文件里翻
系統(tǒng)報錯日志:/var/log/messages
你執(zhí)行命令
egrep -i 'killed process' /var/log/messages # egrep = grep -E 可以使用基本的正則表達(dá)外, 還可以用擴(kuò)展表達(dá)式, -i代表忽略大小寫 #或者 grep “Out of memory” /var/log/messages
去日志里進(jìn)行查詢。
當(dāng)然,你也可以去內(nèi)核日志里頭查詢。有時Linux系統(tǒng)或者系統(tǒng)上運行的java或者其它進(jìn)程,會發(fā)生一些莫名其妙的問題,比如突然掛掉了,比如突然重啟等等。在軟件上找不到問題所在,此時我們應(yīng)該懷疑硬件或者內(nèi)核的問題,此時我們就可以使用 dmesg來查看:
dmesg -T| grep java #或者 dmesg -T | grep 'Out of memory' # -T 是顯示時間戳
再對比java日志停止時間,看來這里才是問題的根源,所以接下來從優(yōu)化java內(nèi)存占用、加內(nèi)存入手嘗試解決問題吧!
備注:
dmesg命令是用來在Unix-like系統(tǒng)中顯示內(nèi)核的相關(guān)信息的。dmesg全稱是display message (or display driver),即顯示信息。
實際上,dmesg命令是從內(nèi)核環(huán)形緩沖區(qū)中獲取數(shù)據(jù)的。當(dāng)我們在Linux上排除故障時,dmesg命令會十分方便,它能很好地幫我們鑒別硬件相關(guān)的error和warning。除此之外,dmesg命令還能打印出守護(hù)進(jìn)程相關(guān)的信息,已幫助我們debug。
相關(guān)文章
Java中Aspose組件進(jìn)行多文檔間的轉(zhuǎn)換方法總結(jié)
在本篇文章里我們給大家分享了關(guān)于Java中Aspose組件進(jìn)行多文檔間的轉(zhuǎn)換方法內(nèi)容,需要的朋友們學(xué)習(xí)下吧。2019-02-02基于rocketmq的有序消費模式和并發(fā)消費模式的區(qū)別說明
這篇文章主要介紹了基于rocketmq的有序消費模式和并發(fā)消費模式的區(qū)別說明,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-06-06使用JavaConfig代替xml實現(xiàn)Spring配置操作
這篇文章主要介紹了使用JavaConfig代替xml實現(xiàn)Spring配置操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-09-09使用Feign調(diào)用時添加驗證信息token到請求頭方式
這篇文章主要介紹了使用Feign調(diào)用時添加驗證信息token到請求頭方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-03-03Java基礎(chǔ)教程之?dāng)?shù)組的定義與使用
Java語言的數(shù)組是一個由固定長度的特定類型元素組成的集合,它們的數(shù)據(jù)類型必須相同,聲明變量的時候,必須要指定參數(shù)類型,這篇文章主要給大家介紹了關(guān)于Java基礎(chǔ)教程之?dāng)?shù)組的定義與使用的相關(guān)資料,需要的朋友可以參考下2021-09-09