Linux服務(wù)器Java進(jìn)程消失問題解決
這篇文章主要介紹了Linux服務(wù)器Java進(jìn)程消失問題解決,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
問題描述
在實(shí)際生產(chǎn)環(huán)境下,如果我們遇見Java進(jìn)程突然消失,該如何去排查問題?
思路
可能有幾種原因:
①、Java應(yīng)用程序的問題:發(fā)生OOM導(dǎo)致進(jìn)程Crash
最常見的是發(fā)生堆內(nèi)存異常“java.lang.OutOfMemoryError: Java heap space”,排查步驟如下:
- Step1: 查看JVM參數(shù) -XX:+HeapDumpOnOutOfMemoryError 和 -XX:HeapDumpPath=*/java.hprof;
- Step2: 根據(jù)HeapDumpPath指定的路徑查看是否產(chǎn)生dump文件;
- Step3: 若存在dump文件,使用Jhat、VisualVM等工具分析即可;
②、JVM出錯(cuò):JVM或JDK自身的Bug導(dǎo)致進(jìn)程Crash
當(dāng)JVM發(fā)生致命錯(cuò)誤導(dǎo)致崩潰時(shí),會(huì)生成一個(gè)hs_err_pid_xxx.log這樣的文件,該文件包含了導(dǎo)致 JVM crash 的重要信息,我們可以通過分析該文件定位到導(dǎo)致 JVM Crash 的原因,從而修復(fù)保證系統(tǒng)穩(wěn)定。
默認(rèn)情況下,該文件是生成在工作目錄下的,當(dāng)然也可以通過 JVM 參數(shù)指定生成路徑:
-XX:ErrorFile=/var/log/hs_err_pid<pid>.log
這個(gè)文件的內(nèi)容他主要有如下內(nèi)容
- 日志頭文件
- 導(dǎo)致 crash 的線程信息
- 所有線程信息
- 安全點(diǎn)和鎖信息
- 堆信息
- 本地代碼緩存
- 編譯事件
- gc 相關(guān)記錄
- jvm 內(nèi)存映射
- jvm 啟動(dòng)參數(shù)
- 服務(wù)器信息
拿到這個(gè)文件后,不用說了,慢慢啃吧。說到這里,我要摸著良心說。這個(gè)文件巨復(fù)雜,如果要會(huì)讀這個(gè)文件,請(qǐng)下點(diǎn)功夫。
③被操作系統(tǒng)OOM-Killer
Linux 內(nèi)核有個(gè)機(jī)制叫OOM killer(Out-Of-Memory killer),該機(jī)制會(huì)監(jiān)控那些占用內(nèi)存過大,尤其是瞬間很快消耗大量?jī)?nèi)存的進(jìn)程,為了防止內(nèi)存耗盡而內(nèi)核會(huì)把該進(jìn)程殺掉。
因此,你發(fā)現(xiàn)java進(jìn)程突然沒了,首先要懷疑是不是被linux的OOM killer給干掉了!
你可以去下面這個(gè)文件里翻
系統(tǒng)報(bào)錯(cuò)日志:/var/log/messages
你執(zhí)行命令
egrep -i 'killed process' /var/log/messages # egrep = grep -E 可以使用基本的正則表達(dá)外, 還可以用擴(kuò)展表達(dá)式, -i代表忽略大小寫 #或者 grep “Out of memory” /var/log/messages
去日志里進(jìn)行查詢。
當(dāng)然,你也可以去內(nèi)核日志里頭查詢。有時(shí)Linux系統(tǒng)或者系統(tǒng)上運(yùn)行的java或者其它進(jìn)程,會(huì)發(fā)生一些莫名其妙的問題,比如突然掛掉了,比如突然重啟等等。在軟件上找不到問題所在,此時(shí)我們應(yīng)該懷疑硬件或者內(nèi)核的問題,此時(shí)我們就可以使用 dmesg來查看:
dmesg -T| grep java #或者 dmesg -T | grep 'Out of memory' # -T 是顯示時(shí)間戳
再對(duì)比java日志停止時(shí)間,看來這里才是問題的根源,所以接下來從優(yōu)化java內(nèi)存占用、加內(nèi)存入手嘗試解決問題吧!
備注:
dmesg命令是用來在Unix-like系統(tǒng)中顯示內(nèi)核的相關(guān)信息的。dmesg全稱是display message (or display driver),即顯示信息。
實(shí)際上,dmesg命令是從內(nèi)核環(huán)形緩沖區(qū)中獲取數(shù)據(jù)的。當(dāng)我們?cè)贚inux上排除故障時(shí),dmesg命令會(huì)十分方便,它能很好地幫我們鑒別硬件相關(guān)的error和warning。除此之外,dmesg命令還能打印出守護(hù)進(jìn)程相關(guān)的信息,已幫助我們debug。
相關(guān)文章
Java中Aspose組件進(jìn)行多文檔間的轉(zhuǎn)換方法總結(jié)
在本篇文章里我們給大家分享了關(guān)于Java中Aspose組件進(jìn)行多文檔間的轉(zhuǎn)換方法內(nèi)容,需要的朋友們學(xué)習(xí)下吧。2019-02-02SpringBoot封裝JDBC的實(shí)現(xiàn)步驟
本文主要介紹了SpringBoot封裝JDBC的實(shí)現(xiàn)步驟,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-12-12Java中websocket消息推送的實(shí)現(xiàn)代碼
這篇文章主要介紹了Java中websocket消息推送的實(shí)現(xiàn)代碼,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下2017-02-02在SpringBoot項(xiàng)目中解決依賴沖突問題的方法
在SpringBoot項(xiàng)目中,依賴沖突是一個(gè)常見的問題,特別是當(dāng)項(xiàng)目引入多個(gè)第三方庫(kù)或框架時(shí),依賴沖突可能導(dǎo)致編譯錯(cuò)誤、運(yùn)行時(shí)異?;虿豢深A(yù)測(cè)的行為,本文給大家介紹了如何在SpringBoot項(xiàng)目中解決以來沖突問題的方法,需要的朋友可以參考下2024-01-01基于rocketmq的有序消費(fèi)模式和并發(fā)消費(fèi)模式的區(qū)別說明
這篇文章主要介紹了基于rocketmq的有序消費(fèi)模式和并發(fā)消費(fèi)模式的區(qū)別說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-06-06使用JavaConfig代替xml實(shí)現(xiàn)Spring配置操作
這篇文章主要介紹了使用JavaConfig代替xml實(shí)現(xiàn)Spring配置操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-09-09使用Feign調(diào)用時(shí)添加驗(yàn)證信息token到請(qǐng)求頭方式
這篇文章主要介紹了使用Feign調(diào)用時(shí)添加驗(yàn)證信息token到請(qǐng)求頭方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-03-03Java使用bcrypt實(shí)現(xiàn)對(duì)密碼加密效果詳解
bcrypt是一種自帶鹽值(自動(dòng)加鹽)的加密方案。本文將通過示例為大家詳細(xì)介紹這一對(duì)密碼進(jìn)行加密的算法,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2022-03-03Java基礎(chǔ)教程之?dāng)?shù)組的定義與使用
Java語言的數(shù)組是一個(gè)由固定長(zhǎng)度的特定類型元素組成的集合,它們的數(shù)據(jù)類型必須相同,聲明變量的時(shí)候,必須要指定參數(shù)類型,這篇文章主要給大家介紹了關(guān)于Java基礎(chǔ)教程之?dāng)?shù)組的定義與使用的相關(guān)資料,需要的朋友可以參考下2021-09-09