Java 內(nèi)存模型(JVM)
前言
在并發(fā)編程中,當多個線程同時訪問同一個共享的可變變量時,會產(chǎn)生不確定的結(jié)果,所以要編寫線程安全的代碼,其本質(zhì)上是對這些可變的共享變量的訪問操作進行管理。導(dǎo)致這種不確定結(jié)果的原因就是可見性、有序性和原子性問題,Java 為解決可見性和有序性問題引入了 Java 內(nèi)存模型,使用互斥方案(其核心實現(xiàn)技術(shù)是鎖)來解決原子性問題。這篇先來看看解決可見性、有序性問題的 Java 內(nèi)存模型(JMM)。
一、什么是 Java 內(nèi)存模型
Java 內(nèi)存模型定義如下:
內(nèi)存模型限制的是共享變量,也就是存儲在堆內(nèi)存中的變量,在 Java 語言中,所有的實例變量、靜態(tài)變量和數(shù)組元素都存儲在堆內(nèi)存之中。而方法參數(shù)、異常處理參數(shù)這些局部變量存儲在方法棧幀之中,因此不會在線程之間共享,不會受到內(nèi)存模型影響,也不存在內(nèi)存可見性問題。
通常,在線程之間的通訊方式有共享內(nèi)存和消息傳遞兩種,很明顯,Java 采用的是第一種即共享的內(nèi)存模型,在共享的內(nèi)存模型里,多線程之間共享程序的公共狀態(tài),通過讀-寫內(nèi)存的方式來進行隱式通訊。
從抽象的角度來看,JMM 其實是定義了線程和主內(nèi)存之間的關(guān)系,首先,多個線程之間的共享變量存儲在主內(nèi)存之中,同時每個線程都有一個自己私有的本地內(nèi)存,本地內(nèi)存中存儲著該線程讀或?qū)懝蚕碜兞康母北荆ㄗ⒁猓罕镜貎?nèi)存是 JMM 定義的抽象概念,實際上并不存在)。抽象模型如下圖所示:
在這個抽象的內(nèi)存模型中,在兩個線程之間的通信(共享變量狀態(tài)變更)時,會進行如下兩個步驟:
- 線程 A 把在本地內(nèi)存更新后的共享變量副本的值,刷新到主內(nèi)存中。
- 線程 B 在使用到該共享變量時,到主內(nèi)存中去讀取線程 A 更新后的共享變量的值,并更新線程 B 本地內(nèi)存的值。
JMM 本質(zhì)上是在硬件(處理器)內(nèi)存模型之上又做了一層抽象,使得應(yīng)用開發(fā)人員只需要了解 JMM 就可以編寫出正確的并發(fā)代碼,而無需過多了解硬件層面的內(nèi)存模型。
二、為什么需要 Java 內(nèi)存模型
在日常的程序開發(fā)中,為一些共享變量賦值的場景會經(jīng)常碰到,假設(shè)一個線程為整型共享變量 count 做賦值操作(count = 9527;),此時就會有一個問題,其它讀取該共享變量的線程在什么情況下獲取到的變量值為 9527 呢?如果缺少同步的話,會有很多因素導(dǎo)致其它讀取該變量的線程無法立即甚至是永遠都無法看到該變量的最新值。
比如緩存就可能會改變寫入共享變量副本提交到主內(nèi)存的次序,保存在本地緩存的值,對于其它線程是不可見的;編譯器為了優(yōu)化性能,有時候會改變程序中語句執(zhí)行的先后順序,這些因素都有可能會導(dǎo)致其它線程無法看到共享變量的最新值。
在文章開頭,提到了 JMM 主要是為了解決可見性和有序性問題,那么首先就要先搞清楚,導(dǎo)致可見性和有序性問題發(fā)生的本質(zhì)原因是什么?現(xiàn)在的服務(wù)絕大部分都是運行在多核 CPU 的服務(wù)器上,每顆 CPU 都有自己的緩存,這時 CPU 緩存與內(nèi)存的數(shù)據(jù)就會有一致性問題了,當一個線程對共享變量的修改,另外一個線程無法立刻看到。導(dǎo)致可見性問題的本質(zhì)原因是緩存。
有序性是指代碼實際的執(zhí)行順序和代碼定義的順序一致,編譯器為了優(yōu)化性能,雖然會遵守 as-if-serial
語義(不管怎么重排序,在單線程下的執(zhí)行結(jié)果不能改變),不過有時候編譯器及解釋器的優(yōu)化也可能引發(fā)一些問題。比如:雙重檢查來創(chuàng)建單實例對象。下面是使用雙重檢查來實現(xiàn)延遲創(chuàng)建單例對象的代碼:
/** * @author mghio * @since 2021-08-22 */ public class DoubleCheckedInstance { private static DoubleCheckedInstance instance; public static DoubleCheckedInstance getInstance() { if (instance == null) { synchronized (DoubleCheckedInstance.class) { if (instance == null) { instance = new DoubleCheckedInstance(); } } } return instance; } }
這里的 instance = new DoubleCheckedInstance();,看起來 Java 代碼只有一行,應(yīng)該是無法就行重排序的,實際上其編譯后的實際指令是如下三步:
- 分配對象的內(nèi)存空間
- 初始化對象
- 設(shè)置 instance 指向剛剛已經(jīng)分配的內(nèi)存地址
上面的第 2 步和第 3 步如果改變執(zhí)行順序也不會改變單線程的執(zhí)行結(jié)果,也就是說可能會發(fā)生重排序,下圖是一種多線程并發(fā)執(zhí)行的場景:
此時線程 B 獲取到的 instance
是沒有初始化過的,如果此來訪問 instance
的成員變量就可能觸發(fā)空指針異常。導(dǎo)致有序性問題的本質(zhì)原因是編譯器優(yōu)化。那你可能會想既然緩存和編譯器優(yōu)化是導(dǎo)致可見性問題和有序性問題的原因,那直接禁用掉不就可以徹底解決這些問題了嗎,但是如果這么做了的話,程序的性能可能就會受到比較大的影響了。
其實可以換一種思路,能不能把這些禁用緩存和編譯器優(yōu)化的權(quán)利交給編碼的工程師來處理,他們肯定最清楚什么時候需要禁用,這樣就只需要提供按需禁用緩存和編譯優(yōu)化的方法即可,使用比較靈活。因此Java 內(nèi)存模型就誕生了,它規(guī)范了 JVM 如何提供按需禁用緩存和編譯優(yōu)化的方法,規(guī)定了 JVM 必須遵守一組最小的保證,這個最小保證規(guī)定了線程對共享變量的寫入操作何時對其它線程可見。
三、順序一致性內(nèi)存模型
順序一致性模型是一個理想化后的理論參考模型,處理器和編程語言的內(nèi)存模型的設(shè)計都是參考的順序一致性模型理論。其有如下兩大特性:
- 一個線程中的所有操作必須按照程序的順序來執(zhí)行
- 所有的線程都只能看到一個單一的執(zhí)行操作順序,不管程序是否同步
在工程師視角下的順序一致性模型如下:
順序一致性模型有一個單一的全局內(nèi)存,這個全局內(nèi)存可以通過左右搖擺的開關(guān)可以連接到任意一個線程,每個線程都必須按照程序的順序來執(zhí)行內(nèi)存的讀和寫操作。該理想模型下,任務(wù)時刻都只能有一個線程可以連接到內(nèi)存,當多個線程并發(fā)執(zhí)行時,就可以通過開關(guān)就可以把多個線程的讀和寫操作串行化。
順序一致性模型中,所有操操作完全按照順序串行執(zhí)行,但是在 JMM 中就沒有這個保證了,未同步的程序在 JMM 中不僅程序的執(zhí)行順序是無序的,而且由于本地內(nèi)存的存在,所有線程看到的操作順序也可能會不一致,比如一個線程把寫共享變量保存在本地內(nèi)存中,在還沒有刷新到主內(nèi)存前,其它線程是不可見的,只有更新到主內(nèi)存后,其它線程才有可能看到。
JMM 對在正確同步的程序做
了順序一致性的保證,也就是程序的執(zhí)行結(jié)果和該程序在順序一致性內(nèi)存模型中的執(zhí)行結(jié)果相同。
四、Happens-Before 規(guī)則
Happens-Before
規(guī)則是 JMM 中的核心概念,Happens-Before 概念最開始在 這篇論文 提出,其在論文中使用 Happens-Before 來定義分布式系統(tǒng)之間的偏序關(guān)系。在 JSR-133 中使用 Happens-Before 來指定兩個操作之間的執(zhí)行順序。
JMM 正是通過這個規(guī)則來保證跨線程的內(nèi)存可見性,Happens-Before 的含義是前面一個對共享變量的操作結(jié)果對該變量的后續(xù)操作是可見的,約束了編譯器的優(yōu)化行為,雖然允許編譯器優(yōu)化,但是優(yōu)化后的代碼必須要滿足 Happens-Before 規(guī)則,這個規(guī)則給工程師做了這個保證:同步的多線程程序是按照 Happens-Before 指定的順序來執(zhí)行的。目的就是為了在不改變程序(單線程或者正確同步的多線程程序)執(zhí)行結(jié)果的前提下,盡最大可能的提高程序執(zhí)行的效率。
JSR-133 規(guī)范中定了如下 6 項 Happens-Before 規(guī)則:
- 程序順序規(guī)則:一個線程中的每個操作,Happens-Before 該線程中的任意后續(xù)操作
- 監(jiān)視器鎖規(guī)則:對一個鎖的解鎖操作,Happens-Before 于后面對這個鎖的加鎖操作
- volatile 規(guī)則:對一個 volatile 類型的變量的寫操作,Happens-Before 與任意后面對這個 volatile 變量的讀操作
- 傳遞性規(guī)則:如果操作 A Happens-Before 于操作 B,并且操作 B Happens-Before 于操作 C,則操作 A Happens-Before 于操作 C
- start() 規(guī)則:如果一個線程 A 執(zhí)行操作 threadB.start() 啟動線程 B,那么線程 A 的 start() 操作 Happens-Before 于線程 B 的任意操作
- join() 規(guī)則:如果線程 A 執(zhí)行操作 threadB.join() 并成功返回,那么線程 B 中的任意操作 Happens-Before 于線程 A 從 threadB.join() 操作成功返回
JMM 的一個基本原則是:只要不改變單線程和正確同步的多線程的執(zhí)行結(jié)果,編譯器和處理器隨便怎么優(yōu)化都可以,實際上對于應(yīng)用開發(fā)人員對于兩個操作是否真的被重排序并不關(guān)心,真正關(guān)心的是執(zhí)行結(jié)果不能被修改。因此 Happens-Before
本質(zhì)上和 sa-if-serial
的語義是一致的,只是 sa-if-serial
只是保證在單線程下的執(zhí)行結(jié)果不被改變。
總結(jié):
本文主要介紹了內(nèi)存模型的相關(guān)基礎(chǔ)知識和相關(guān)概念,JMM 屏蔽了不同處理器內(nèi)存模型之間的差異,在不同的處理器平臺上給應(yīng)用開發(fā)人員抽象出了統(tǒng)一的 Java 內(nèi)存模型(JMM)。常見的處理器內(nèi)存模型比 JMM 的要弱,因此 JVM 會在生成字節(jié)碼指令時在適當?shù)奈恢貌迦雰?nèi)存屏障(內(nèi)存屏障的類型會因處理器平臺而有所不同)來限制部分重排序。更多關(guān)于Java 內(nèi)存模型的資料請關(guān)注腳本之家其它相關(guān)文章!,希望大家以后多多支持腳本之家!
相關(guān)文章
利用反射實現(xiàn)Excel和CSV 轉(zhuǎn)換為Java對象功能
將Excel或CSV文件轉(zhuǎn)換為Java對象(POJO)以及將Java對象轉(zhuǎn)換為Excel或CSV文件可能是一個復(fù)雜的過程,但如果使用正確的工具和技術(shù),這個過程就會變得十分簡單,在本文中,我們將了解如何利用一個Java反射的庫來實現(xiàn)這個功能,需要的朋友可以參考下2023-11-11詳解SpringCloud Finchley Gateway 統(tǒng)一異常處理
這篇文章主要介紹了詳解SpringCloud Finchley Gateway 統(tǒng)一異常處理,非常具有實用價值,需要的朋友可以參考下2018-10-10