通過Java視角簡單談?wù)劸植啃栽?/h1>
更新時間:2021年07月13日 14:29:47 作者:幻_
程序的局部性原理是指程序在執(zhí)行時呈現(xiàn)出局部性規(guī)律,即在一段時間內(nèi),整個程序的執(zhí)行僅限于程序中的某一部分,這篇文章主要給大家介紹了關(guān)于通過Java視角簡單談?wù)劸植啃栽淼南嚓P(guān)資料,需要的朋友可以參考下
局部性原理
程序在訪問數(shù)據(jù)時,都趨于聚集在一片連續(xù)的區(qū)域中,這被稱為局部性原理。
按時間和空間劃分為兩類:
- 時間局部性:如果一個數(shù)據(jù)正在被訪問,那么近期它很可能再次被訪問。
- 空間局部性:如果某一個位置的數(shù)據(jù)被訪問,那么這個問題附近的數(shù)據(jù)很可能被訪問。
針對局部性原理,CPU和操作系統(tǒng)都有具體的實現(xiàn)。
本文主要總結(jié)梳理CPU和操作系統(tǒng)的局部性原理在Java后端中的影響與意義。
CPU空間局部性
如下圖是Java的內(nèi)存模型

我們知道CPU為提高從內(nèi)存中讀數(shù)據(jù)的性能,有L1、L2、L3三個級別的高速緩存。
CPU利用局部性原理,在從內(nèi)存讀取數(shù)據(jù)項到緩存時,將該內(nèi)存附近的數(shù)據(jù)塊也一并讀取到緩存中,這一過程稱為預(yù)讀。
即讀取連續(xù)空間的內(nèi)存要比內(nèi)存隨機訪問的性能要高,這一點用Java程序可以證明。
public static void main(String[] args) {
int[][] arr = new int[10000][10000];
int sum = 0;
long startTime = System.currentTimeMillis();
for (int i = 0; i < arr.length; i++) {
for (int j = 0; j < arr[0].length; j++) {
sum += arr[i][j];
}
}
System.out.println("數(shù)組順序訪問耗時:" + (System.currentTimeMillis() - startTime) + "ms");
sum = 0;
startTime = System.currentTimeMillis();
for (int i = 0; i < arr.length; i++) {
for (int j = 0; j < arr[0].length; j++) {
sum += arr[j][i];
}
}
System.out.println("數(shù)組非順序訪問耗時:" + (System.currentTimeMillis() - startTime) + "ms");
}
這是一段對二維數(shù)組循環(huán)讀取的代碼。
程序的上半部分是按數(shù)組的第二維開始順序讀取,即二維數(shù)組逐行按內(nèi)存連續(xù)空間順序訪問。
下半部分則是按數(shù)組的第一維按列讀取,不是順序訪問。
分別經(jīng)過10000*10000次的數(shù)組訪問后,其運行結(jié)果如下:

由此可見,對內(nèi)存的順序訪問性能優(yōu)于隨機訪問。
磁盤空間局部性
在Java日常開發(fā)中,很多的中間件都需要跟磁盤文件打交道,這些磁盤數(shù)據(jù)的高性能訪問也都依托于局部性原理,比如:
- MySql的日志文件
- MQ消息數(shù)據(jù)
我們知道MySql的數(shù)據(jù)最終都保存在磁盤中,為減少磁盤IO提高性能,InnoDB引擎底層依托BufferPoll+redo log機制來提高mySql讀寫性能(具體可參考MySql原理總結(jié))。而針對redo log、undo log、binlog的讀寫避免不了磁盤IO,那么這里就利用操作系統(tǒng)的PageCache機制,對磁盤數(shù)據(jù)順序讀寫,使得磁盤IO的性能近乎于內(nèi)存性能。
我們常說kafka和rocketMQ是高性能的消息中間件,其中一部分高性能就依托于對磁盤文件的順序讀寫。比如commit log的順序?qū)懭?,kafka中partition、rockerMQ中consumerQueue中消息的順序讀寫。同樣的也是利用操作系統(tǒng)的PageCache機制。
PageCache
頁緩存(PageCache)是OS對文件的緩存,用于加速對文件的讀寫。一般來說,程序?qū)ξ募M行順序讀寫的速度幾乎接近于內(nèi)存的讀寫速度,主要原因就是由于OS使用PageCache機制對讀寫訪問操作進行了性能優(yōu)化,將一部分的內(nèi)存用作PageCache。
對于數(shù)據(jù)的寫入,OS會先寫入至Cache內(nèi),隨后通過異步的方式由pdflush內(nèi)核線程將Cache內(nèi)的數(shù)據(jù)刷盤至物理磁盤上。
對于數(shù)據(jù)的讀取,如果一次讀取文件時出現(xiàn)未命中PageCache的情況,OS從物理磁盤上訪問讀取文件的同時,會順序?qū)ζ渌噜弶K的數(shù)據(jù)文件進行預(yù)讀取。
而PageCache就是局部性原理的實現(xiàn)。
時間局部性
時間局部性可能在我們?nèi)粘I(yè)務(wù)開發(fā)中體現(xiàn)得更明顯。
類似LRU緩存都是其具體實現(xiàn)。
另外CPU的指令重排序也貼點邊,比如對一個數(shù)據(jù)的訪問計算,優(yōu)先將于這數(shù)據(jù)有關(guān)的指令排在一起處理。
參考
- 知乎:如何理解操作系統(tǒng)中的局部性原理
- gitHub:RocketMQ設(shè)計文檔
總結(jié)
到此這篇通過Java視角簡單談?wù)劸植啃栽淼奈恼戮徒榻B到這了,更多相關(guān)Java局部性原理內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
-
記一次Maven項目改造成SpringBoot項目的過程實踐
本文主要介紹了Maven項目改造成SpringBoot項目的過程實踐,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下 2022-03-03
-
springmvc的validator數(shù)據(jù)校驗的實現(xiàn)示例代碼
這篇文章主要介紹了springmvc的數(shù)據(jù)校驗的實現(xiàn)示例代碼, 具有一定的參考價值,感興趣的小伙伴們可以參考一下 2017-07-07
-
Spring?Boot整合ELK實現(xiàn)日志采集與監(jiān)控
這篇文章主要介紹了Spring?Boot整合ELK實現(xiàn)日志采集與監(jiān)控,需要的朋友可以參考下 2022-06-06
最新評論
局部性原理
程序在訪問數(shù)據(jù)時,都趨于聚集在一片連續(xù)的區(qū)域中,這被稱為局部性原理。
按時間和空間劃分為兩類:
- 時間局部性:如果一個數(shù)據(jù)正在被訪問,那么近期它很可能再次被訪問。
- 空間局部性:如果某一個位置的數(shù)據(jù)被訪問,那么這個問題附近的數(shù)據(jù)很可能被訪問。
針對局部性原理,CPU和操作系統(tǒng)都有具體的實現(xiàn)。
本文主要總結(jié)梳理CPU和操作系統(tǒng)的局部性原理在Java后端中的影響與意義。
CPU空間局部性
如下圖是Java的內(nèi)存模型
我們知道CPU為提高從內(nèi)存中讀數(shù)據(jù)的性能,有L1、L2、L3三個級別的高速緩存。
CPU利用局部性原理,在從內(nèi)存讀取數(shù)據(jù)項到緩存時,將該內(nèi)存附近的數(shù)據(jù)塊也一并讀取到緩存中,這一過程稱為預(yù)讀。
即讀取連續(xù)空間的內(nèi)存要比內(nèi)存隨機訪問的性能要高,這一點用Java程序可以證明。
public static void main(String[] args) { int[][] arr = new int[10000][10000]; int sum = 0; long startTime = System.currentTimeMillis(); for (int i = 0; i < arr.length; i++) { for (int j = 0; j < arr[0].length; j++) { sum += arr[i][j]; } } System.out.println("數(shù)組順序訪問耗時:" + (System.currentTimeMillis() - startTime) + "ms"); sum = 0; startTime = System.currentTimeMillis(); for (int i = 0; i < arr.length; i++) { for (int j = 0; j < arr[0].length; j++) { sum += arr[j][i]; } } System.out.println("數(shù)組非順序訪問耗時:" + (System.currentTimeMillis() - startTime) + "ms"); }
這是一段對二維數(shù)組循環(huán)讀取的代碼。
程序的上半部分是按數(shù)組的第二維開始順序讀取,即二維數(shù)組逐行按內(nèi)存連續(xù)空間順序訪問。
下半部分則是按數(shù)組的第一維按列讀取,不是順序訪問。
分別經(jīng)過10000*10000次的數(shù)組訪問后,其運行結(jié)果如下:
由此可見,對內(nèi)存的順序訪問性能優(yōu)于隨機訪問。
磁盤空間局部性
在Java日常開發(fā)中,很多的中間件都需要跟磁盤文件打交道,這些磁盤數(shù)據(jù)的高性能訪問也都依托于局部性原理,比如:
- MySql的日志文件
- MQ消息數(shù)據(jù)
我們知道MySql的數(shù)據(jù)最終都保存在磁盤中,為減少磁盤IO提高性能,InnoDB引擎底層依托BufferPoll+redo log機制來提高mySql讀寫性能(具體可參考MySql原理總結(jié))。而針對redo log、undo log、binlog的讀寫避免不了磁盤IO,那么這里就利用操作系統(tǒng)的PageCache機制,對磁盤數(shù)據(jù)順序讀寫,使得磁盤IO的性能近乎于內(nèi)存性能。
我們常說kafka和rocketMQ是高性能的消息中間件,其中一部分高性能就依托于對磁盤文件的順序讀寫。比如commit log的順序?qū)懭?,kafka中partition、rockerMQ中consumerQueue中消息的順序讀寫。同樣的也是利用操作系統(tǒng)的PageCache機制。
PageCache
頁緩存(PageCache)是OS對文件的緩存,用于加速對文件的讀寫。一般來說,程序?qū)ξ募M行順序讀寫的速度幾乎接近于內(nèi)存的讀寫速度,主要原因就是由于OS使用PageCache機制對讀寫訪問操作進行了性能優(yōu)化,將一部分的內(nèi)存用作PageCache。
對于數(shù)據(jù)的寫入,OS會先寫入至Cache內(nèi),隨后通過異步的方式由pdflush內(nèi)核線程將Cache內(nèi)的數(shù)據(jù)刷盤至物理磁盤上。
對于數(shù)據(jù)的讀取,如果一次讀取文件時出現(xiàn)未命中PageCache的情況,OS從物理磁盤上訪問讀取文件的同時,會順序?qū)ζ渌噜弶K的數(shù)據(jù)文件進行預(yù)讀取。
而PageCache就是局部性原理的實現(xiàn)。
時間局部性
時間局部性可能在我們?nèi)粘I(yè)務(wù)開發(fā)中體現(xiàn)得更明顯。
類似LRU緩存都是其具體實現(xiàn)。
另外CPU的指令重排序也貼點邊,比如對一個數(shù)據(jù)的訪問計算,優(yōu)先將于這數(shù)據(jù)有關(guān)的指令排在一起處理。
參考
- 知乎:如何理解操作系統(tǒng)中的局部性原理
- gitHub:RocketMQ設(shè)計文檔
總結(jié)
到此這篇通過Java視角簡單談?wù)劸植啃栽淼奈恼戮徒榻B到這了,更多相關(guān)Java局部性原理內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
記一次Maven項目改造成SpringBoot項目的過程實踐
本文主要介紹了Maven項目改造成SpringBoot項目的過程實踐,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-03-03springmvc的validator數(shù)據(jù)校驗的實現(xiàn)示例代碼
這篇文章主要介紹了springmvc的數(shù)據(jù)校驗的實現(xiàn)示例代碼, 具有一定的參考價值,感興趣的小伙伴們可以參考一下2017-07-07Spring?Boot整合ELK實現(xiàn)日志采集與監(jiān)控
這篇文章主要介紹了Spring?Boot整合ELK實現(xiàn)日志采集與監(jiān)控,需要的朋友可以參考下2022-06-06