欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

MyBatisPlus?大數(shù)據(jù)量查詢慢的問題解決

 更新時間:2023年02月05日 08:35:09   作者:曠野歷程  
本文主要介紹了MyBatis?Plus?解決大數(shù)據(jù)量查詢慢問題,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

大數(shù)據(jù)量操作的場景大致如下:

  • 數(shù)據(jù)遷移
  • 數(shù)據(jù)導出
  • 批量處理數(shù)據(jù)

在實際工作中當指定查詢數(shù)據(jù)過大時,我們一般使用分頁查詢的方式一頁一頁的將數(shù)據(jù)放到內存處理。但有些情況不需要分頁的方式查詢數(shù)據(jù)或分很大一頁查詢數(shù)據(jù)時,如果一下子將數(shù)據(jù)全部加載出來到內存中,很可能會發(fā)生OOM(內存溢出);而且查詢會很慢,因為框架耗費大量的時間和內存去把數(shù)據(jù)庫查詢的結果封裝成我們想要的對象(實體類)。

舉例:在業(yè)務系統(tǒng)需要從 MySQL 數(shù)據(jù)庫里讀取 100w 數(shù)據(jù)行進行處理,應該怎么做?

做法通常如下:

  • 常規(guī)查詢:一次性讀取 100w 數(shù)據(jù)到 JVM 內存中,或者分頁讀取
  • 流式查詢:建立長連接,利用服務端游標,每次讀取一條加載到 JVM 內存(多次獲取,一次一行)
  • 游標查詢:和流式一樣,通過 fetchSize 參數(shù),控制一次讀取多少條數(shù)據(jù)(多次獲取,一次多行)

常規(guī)查詢

默認情況下,完整的檢索結果集會將其存儲在內存中。在大多數(shù)情況下,這是最有效的操作方式,并且由于 MySQL 網絡協(xié)議的設計,因此更易于實現(xiàn)。

舉例:

假設單表 100w 數(shù)據(jù)量,一般會采用分頁的方式查詢:

@Mapper
public interface BigDataSearchMapper extends BaseMapper<BigDataSearchEntity> {
 
    @Select("SELECT bds.* FROM big_data_search bds ${ew.customSqlSegment} ")
    Page<BigDataSearchEntity> pageList(@Param("page") Page<BigDataSearchEntity> page, @Param(Constants.WRAPPER) QueryWrapper<BigDataSearchEntity> queryWrapper);
 
}

注:該示例使用的 MybatisPlus 

該方式比較簡單,如果在不考慮 LIMIT 深分頁優(yōu)化情況下,估計你的數(shù)據(jù)庫服務器就噶皮了,或者你能等上幾十分鐘或幾小時,甚至幾天時間檢索數(shù)據(jù)

流式查詢

流式查詢指的是查詢成功后不是返回一個集合而是返回一個迭代器,應用每次從迭代器取一條查詢結果。流式查詢的好處是能夠降低內存使用。如果沒有流式查詢,我們想要從數(shù)據(jù)庫取 100w 條記錄而又沒有足夠的內存時,就不得不分頁查詢,而分頁查詢效率取決于表設計,如果設計的不好,就無法執(zhí)行高效的分頁查詢。因此流式查詢是一個數(shù)據(jù)庫訪問框架必須具備的功能。

MyBatis 中使用流式查詢避免數(shù)據(jù)量過大導致 OOM ,但在流式查詢的過程當中,數(shù)據(jù)庫連接是保持打開狀態(tài)的,因此要注意的是:

  • 執(zhí)行一個流式查詢后,數(shù)據(jù)庫訪問框架就不負責關閉數(shù)據(jù)庫連接了,需要應用在取完數(shù)據(jù)后自己關閉。
  • 必須先讀?。ɑ蜿P閉)結果集中的所有行,然后才能對連接發(fā)出任何其他查詢,否則將引發(fā)異常。

MyBatis 流式查詢接口

MyBatis 提供了一個叫 org.apache.ibatis.cursor.Cursor 的接口類用于流式查詢,這個接口繼承了 java.io.Closeable 和 java.lang.Iterable 接口,由此可知:

  • Cursor 是可關閉的;
  • Cursor 是可遍歷的。

除此之外,Cursor 還提供了三個方法:

  • isOpen():用于在取數(shù)據(jù)之前判斷 Cursor 對象是否是打開狀態(tài)。只有當打開時 Cursor 才能取數(shù)據(jù);
  • isConsumed():用于判斷查詢結果是否全部取完。
  • getCurrentIndex():返回已經獲取了多少條數(shù)據(jù)

使用流式查詢,則要保持對產生結果集的語句所引用的表的并發(fā)訪問,因為其 查詢會獨占連接,所以必須盡快處理

為什么要用流式查詢?

  • 如果有一個很大的查詢結果需要遍歷處理,又不想一次性將結果集裝入客戶端內存,就可以考慮使用流式查詢;
  • 分庫分表場景下,單個表的查詢結果集雖然不大,但如果某個查詢跨了多個庫多個表,又要做結果集的合并、排序等動作,依然有可能撐爆內存;詳細研究了sharding-sphere的代碼不難發(fā)現(xiàn),除了group by與order by字段不一樣之外,其他的場景都非常適合使用流式查詢,可以最大限度的降低對客戶端內存的消耗。

關于流式查詢查詢小編本人了解不是很多,再此就不過多說明,如果發(fā)現(xiàn)好的資源,還請留言讓小編也學習一下。

游標查詢

對大量數(shù)據(jù)進行處理時,為防止內存泄漏情況發(fā)生,也可以采用游標方式進行數(shù)據(jù)查詢處理。這種處理方式比常規(guī)查詢要快很多。

當查詢百萬級的數(shù)據(jù)的時候,還可以使用游標方式進行數(shù)據(jù)查詢處理,不僅可以節(jié)省內存的消耗,而且還不需要一次性取出所有數(shù)據(jù),可以進行逐條處理或逐條取出部分批量處理。一次查詢指定 fetchSize 的數(shù)據(jù),直到把數(shù)據(jù)全部處理完。

Mybatis 的處理加了兩個注解: @Options 和 @ResultType

@Mapper
public interface BigDataSearchMapper extends BaseMapper<BigDataSearchEntity> {
 
    // 方式一 多次獲取,一次多行
    @Select("SELECT bds.* FROM big_data_search bds ${ew.customSqlSegment} ")
    @Options(resultSetType = ResultSetType.FORWARD_ONLY, fetchSize = 1000000)
    Page<BigDataSearchEntity> pageList(@Param("page") Page<BigDataSearchEntity> page, @Param(Constants.WRAPPER) QueryWrapper<BigDataSearchEntity> queryWrapper);
 
    // 方式二 一次獲取,一次一行
    @Select("SELECT bds.* FROM big_data_search bds ${ew.customSqlSegment} ")
    @Options(resultSetType = ResultSetType.FORWARD_ONLY, fetchSize = 100000)
    @ResultType(BigDataSearchEntity.class)
    void listData(@Param(Constants.WRAPPER) QueryWrapper<BigDataSearchEntity> queryWrapper, ResultHandler<BigDataSearchEntity> handler);
 
}

@Options

  • ResultSet.FORWORD_ONLY:結果集的游標只能向下滾動
  • ResultSet. SCROLL_INSENSITIVE:結果集的游標可以上下移動,當數(shù)據(jù)庫變化時,當前結果集不變
  • ResultSet.SCROLL_SENSITIVE:返回可滾動的結果集,當數(shù)據(jù)庫變化時,當前結果集同步改變
  • fetchSize:每次獲取量

@ResultType

  • @ResultType(BigDataSearchEntity.class):轉換成返回實體類型

注意: 返回類型必須為 void ,因為查詢的結果在 ResultHandler 里處理數(shù)據(jù),所以這個 hander 也是必須的,可以使用 lambda 實現(xiàn)一個依次處理邏輯。

注意:

雖然上面的代碼中都有 @Options 但實際操作卻有不同:

  • 方式一是多次查詢,一次返回多條;
  • 方式二是一次查詢,一次返回一條;

原因:

Oracle 是從服務器一次取出 fetch size 條記錄放在客戶端,客戶端處理完成一個批次后再向服務器取下一個批次,直到所有數(shù)據(jù)處理完成。

MySQL 是在執(zhí)行 ResultSet.next() 方法時,會通過數(shù)據(jù)庫連接一條一條的返回。flush buffer 的過程是阻塞式的,如果網絡中發(fā)生了擁塞,send buffer 被填滿,會導致 buffer 一直 flush 不出去,那 MySQL 的處理線程會阻塞,從而避免數(shù)據(jù)把客戶端內存撐爆。

非流式查詢和流式查詢區(qū)別:

  • 非流式查詢:內存會隨著查詢記錄的增長而近乎直線增長。
  • 流式查詢:內存會保持穩(wěn)定,不會隨著記錄的增長而增長。其內存大小取決于批處理大小BATCH_SIZE的設置,該尺寸越大,內存會越大。所以BATCH_SIZE應該根據(jù)業(yè)務情況設置合適的大小。

另外要切記每次處理完一批結果要記得釋放存儲每批數(shù)據(jù)的臨時容器,即上文中的gxids.clear();

到此這篇關于MyBatisPlus 大數(shù)據(jù)量查詢慢的問題解決的文章就介紹到這了,更多相關MyBatisPlus查詢慢內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Java行為型設計模式之模板方法詳解

    Java行為型設計模式之模板方法詳解

    模板方法的概念:定義了一個操作中的算法的骨架,而將部分步驟的實現(xiàn)在子類中完成。模板方法模式使得子類可以不改變一個算法的結構即可重定義該算法的某些特定步驟
    2022-09-09
  • Springboot3整合Mybatis3的完整步驟記錄

    Springboot3整合Mybatis3的完整步驟記錄

    這篇文章主要給大家介紹了關于Springboot3整合Mybatis3的完整步驟,Spring Boot和MyBatis分別是兩個功能強大的框架,它們的協(xié)同使用可以極大地簡化數(shù)據(jù)訪問層的開發(fā),提高整體的開發(fā)效率,文中通過代碼介紹的非常詳細,需要的朋友可以參考下
    2024-01-01
  • Tomcat數(shù)據(jù)源配置方法_JBuilder中

    Tomcat數(shù)據(jù)源配置方法_JBuilder中

    今天幫一同事配置一個數(shù)據(jù)源,采用tomcat5.5.9,本來是個很簡單的事,以前也配過,但由于很長時間沒用過容器提供的數(shù)據(jù)源了(IOC用慣了),也只記的個大概了,所以剛開始一配就出錯了,google了一下,有很多資料,照著試試卻都不好使(到不是別人說的不對,只是大家用的版本不同)。
    2008-10-10
  • Spring中BeanFactory?FactoryBean和ObjectFactory的三種的區(qū)別

    Spring中BeanFactory?FactoryBean和ObjectFactory的三種的區(qū)別

    關于FactoryBean?和?BeanFactory的對比文章比較多,但是對ObjectFactory的描述就比較少,今天我們對比下這三種的區(qū)別,感興趣的朋友跟隨小編一起看看吧
    2023-01-01
  • SpringBoot整合RabbitMQ, 實現(xiàn)生產者與消費者的功能

    SpringBoot整合RabbitMQ, 實現(xiàn)生產者與消費者的功能

    這篇文章主要介紹了SpringBoot整合RabbitMQ, 實現(xiàn)生產者與消費者的功能,幫助大家更好得理解和學習使用SpringBoot框架,感興趣的朋友可以了解下
    2021-03-03
  • Java中的WeakHashMap簡析

    Java中的WeakHashMap簡析

    這篇文章主要介紹了Java中的WeakHashMap簡析,Map 的子類常見的有 HashMap、Hashtable、ConcurrentHashMap、LinkedHashMap 等,WeakHashMap,直譯就是,虛弱的 HashMap,從名字可得知其和 HashMap 有關,需要的朋友可以參考下
    2023-09-09
  • java中的BlockingQueue(阻塞隊列)解析

    java中的BlockingQueue(阻塞隊列)解析

    這篇文章主要介紹了java中的BlockingQueue阻塞隊列解析,阻塞隊列是一個支持兩個附加操作的隊列,這兩個附加的操作是,在隊列為空時,獲取元素的線程會等待隊列變?yōu)榉强?需要的朋友可以參考下
    2023-12-12
  • Java TreeSet類的簡單理解和使用

    Java TreeSet類的簡單理解和使用

    這篇文章主要介紹了Java TreeSet類的簡單理解和使用,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-02-02
  • Java多線程之volatile關鍵字及內存屏障實例解析

    Java多線程之volatile關鍵字及內存屏障實例解析

    volatile是JVM提供的一種最輕量級的同步機制,因為Java內存模型為volatile定義特殊的訪問規(guī)則,使其可以實現(xiàn)Java內存模型中的兩大特性:可見性和有序性。這篇文章主要介紹了Java多線程之volatile關鍵字及內存屏障,需要的朋友可以參考下
    2019-05-05
  • 深入解析Java的Struts框架中的控制器DispatchAction

    深入解析Java的Struts框架中的控制器DispatchAction

    這篇文章主要介紹了深入解析Java的Struts框架中的控制器DispatchAction,Struts是Java的SSH三大web開發(fā)框架之一,需要的朋友可以參考下
    2015-12-12

最新評論