欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

spring batch使用reader讀數據的內存容量問題詳解

 更新時間:2020年07月20日 17:17:28   作者:topEngineerray  
這篇文章主要介紹了spring batch使用reader讀數據的內存容量問題詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

概述

本篇博客是記錄使用spring batch做數據遷移時時遇到的一個關鍵問題:數據遷移量大時如何保證內存。當我們在使用spring batch時,我們必須配置三個東西: reader,processor,和writer。其中,reader用于從數據庫中讀數據,當數據量較小時,reader的邏輯不會對內存帶來太多壓力,但是當我們要去讀的數據量非常大的時候,我們就不得不考慮內存等方面的問題,因為若數據量非常大,內存,執(zhí)行時間等等都會受到影響。關于spring batch的基礎知識和介紹請參考這篇博客:批處理框架spring batch介紹及使用。

問題是什么

在上面的內容當中我們已經提到了,我們面臨的問題是數據遷移量大時的內存問題。但是這樣的描述非常籠統(tǒng),因此博主決定將這一部分單獨拎出來說。

在學習了spring batch的知識之后我們應該很清楚的一點是,每一個spring batch的step都包含如下的部分:

即讀數據,處理數據,寫數據。這三個步驟里面最可能會導致內存變大問題的無疑是讀數據環(huán)節(jié)。讀數據作為spring batch的數據輸入,是整個spring batch job的開頭邏輯。

若我們的數據量不大,如只有幾十萬條,那我們無疑不會面臨內存問題,即便一次將所有數據加載到內存當中,占的內存也不會非常多,且spring batch數據遷移的速度非常之快,幾十萬條的數據往往是幾十秒的時間就可以遷移完成。但是當數據量變大之后,問題就不一樣了。當我們的數據量達到數百萬或上千萬時,若一次性將所有數據全部讀到內存當中,則會占據遠遠超出正常范圍的非常大的內存。該問題示意圖如下所示:

我們寫的任何程序都會有一個運行內存,假設這個內存的總容量現在只有4g,而我們數據庫里需要操作的數據有8g,那么無疑,一次性的將數據讀出來就會出錯。這便是需要考慮得問題。

Spring提供的reader實現

spring提供了非常豐富的Reader實現,其中比較常用的從數據庫讀數據的有JdbcCursorItemReader,JdbcPagingItemReader等。

JdbcCursorItemReader

使用JdbcCursorItemReader的示例代碼如下:

@Bean
public JdbcCursorItemReader<CustomerCredit> itemReader() {
 return new JdbcCursorItemReaderBuilder<CustomerCredit>()
   .dataSource(this.dataSource)
   .name("creditReader")
   .sql("select ID, NAME, CREDIT from CUSTOMER")
   .rowMapper(new CustomerCreditRowMapper())
   .build();
 
}

JdbcCursorItemReader的好處在于使用簡單,但是我們從它的sql就能發(fā)現,JdbcCursorItemReader會一次把所有的數據全部拿回來,當數據量過大而服務器內存不夠時,就會遇到下面無法分配內存的問題:

報錯信息為:Resource exhaustion event:The JVM was unable to allocate memory from the heap. 意思就是需要分配內存的數據太多,但是無法找到足夠的內存了。

反映在內存里,堆內存會呈現出如下的情況:

隨著每一次數據讀入,堆內存都會增大,原因就在于JdbcCursorItemReader一次性讀回了所有的數據,返回之后就會存在一個對象里面,而這個對象的尺寸過大,因此直接進入了老年代。在數據遷移完成之前,這些數據都不會被回收。如下圖所示:

毫無疑問,當我們的數據量大時不應該使用這種類型的reader來讀取數據。

JdbcPagingItemReader

JdbcPagingItemReader的作用和它的名字一樣,它可以分頁讀取數據,但是使用起來相比于JdbcCursorItemReader更加復雜,示例代碼如下:

@Bean
public JdbcPagingItemReader itemReader(DataSource dataSource, PagingQueryProvider queryProvider) {
 Map<String, Object> parameterValues = new HashMap<>();
 parameterValues.put("status", "NEW");
 
 return new JdbcPagingItemReaderBuilder<CustomerCredit>()
      .name("creditReader")
      .dataSource(dataSource)
      .queryProvider(queryProvider)
      .parameterValues(parameterValues)
      .rowMapper(customerCreditMapper())
      .pageSize(1000)
      .build();
}
 
@Bean
public SqlPagingQueryProviderFactoryBean queryProvider() {
 SqlPagingQueryProviderFactoryBean provider = new SqlPagingQueryProviderFactoryBean();
 
 provider.setSelectClause("select id, name, credit");
 provider.setFromClause("from customer");
 provider.setWhereClause("where status=:status");
 provider.setSortKey("id");
 
 return provider;
}

可以看到我們能夠設置page的大小,JdbcPagingItemReader將根據這個頁的大小,每次讀取這么多的數據,因此這些數據返回保存的對象,就只會是小對象,因此他們不會直接在老年代里分配,而是先分配在年輕代,隨著年輕代不斷變大,minor gc也不斷進行,回收掉已經處理完的數據,老年代的內存使用量不會有任何增大,類似下圖:

老年代內存不會有任何變化,年輕帶會隨著服務器數據遷移進行而增大同時被回收。

在使用JdbcPagingItemReader時,有一個必須注意的地方就是排序關鍵字是必須指定的,原因在于排序是分頁實現原理的技術基礎。sortKey和我們指定的其他字句一起構建出SQL語句出來。在sortKey上必須使用unique key constraint約束,因為只有這樣才能得以確保執(zhí)行之間不會丟失任何數據。這也可以說是JdbcCursorItemReader相對便利的一點優(yōu)勢。

總結

數據量小時選擇的方案差別不會很大,當數據量大時,為了有好的內存表現則使用分頁的reader是必要的。但同時,因為要實現分頁,也會帶來一些不可避免的限制。

到此這篇關于spring batch使用reader讀數據的內存容量問題詳解的文章就介紹到這了,更多相關spring batch使用reader讀數據內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • 簡介Java的Hibernate框架中的Session和持久化類

    簡介Java的Hibernate框架中的Session和持久化類

    這篇文章主要介紹了Java的Hibernate框架中的Session和持久化類,Hibernate是Java的SSH三大web開發(fā)框架之一,需要的朋友可以參考下
    2015-12-12
  • 詳解SpringCloud使用Consul做注冊中心

    詳解SpringCloud使用Consul做注冊中心

    這篇文章主要介紹了SpringCloud使用Consul做注冊中心,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-11-11
  • Spring Validator接口校驗與全局異常處理器

    Spring Validator接口校驗與全局異常處理器

    這篇文章主要介紹了Spring Validator接口校驗與全局異常處理器,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-11-11
  • 純Java實現數字證書生成簽名的簡單實例

    純Java實現數字證書生成簽名的簡單實例

    下面小編就為大家?guī)硪黄僇ava實現數字證書生成簽名的簡單實例。小編覺得挺不錯的,現在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2016-08-08
  • Spring高級注解@PropertySource詳細解讀

    Spring高級注解@PropertySource詳細解讀

    這篇文章主要介紹了Spring高級注解@PropertySource詳細解讀,@PropertySource注解用于指定資源文件讀取的位置,它不僅能讀取properties文件,也能讀取xml文件,并且通過YAML解析器,配合自定義PropertySourceFactory實現解析yaml文件,需要的朋友可以參考下
    2023-11-11
  • 為什么說HashMap線程不安全

    為什么說HashMap線程不安全

    本文主要介紹了為什么說HashMap線程不安全,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-04-04
  • 你所不知道的Spring的@Autowired實現細節(jié)分析

    你所不知道的Spring的@Autowired實現細節(jié)分析

    這篇文章主要介紹了你所不知道的Spring的@Autowired實現細節(jié)分析,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-08-08
  • SpringBoot中?Jackson?日期的時區(qū)和日期格式問題解決

    SpringBoot中?Jackson?日期的時區(qū)和日期格式問題解決

    因為最近項目需要國際化,需要能夠支持多種國際化語言,目前需要支持三種(法語、英語、簡體中文),這篇文章主要介紹了SpringBoot中?Jackson?日期的時區(qū)和日期格式問題,需要的朋友可以參考下
    2022-12-12
  • Java通過遞歸算法解決迷宮與漢諾塔及八皇后問題

    Java通過遞歸算法解決迷宮與漢諾塔及八皇后問題

    方法就是用來完成解決某件事情或實現某個功能的辦法;程序調用自身的編程技巧稱為遞歸,本文主要講的是通過遞歸來實現三個經典的問題,解決迷宮,漢諾塔,八皇后問題,感興趣的朋友可以參考一下
    2022-05-05
  • java開發(fā)環(huán)境的完整搭建過程

    java開發(fā)環(huán)境的完整搭建過程

    這篇文章主要給大家介紹了關于java開發(fā)環(huán)境的完整搭建過程,文中介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2021-02-02

最新評論