欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Java多線程批量數(shù)據(jù)導入的方法詳解

 更新時間:2019年06月05日 14:47:19   作者:不言  
這篇文章主要介紹了Java多線程批量數(shù)據(jù)導入的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,下面小編和大家來一起學習下吧

前言:

當遇到大量數(shù)據(jù)導入時,為了提高處理的速度,可以選擇使用多線程來批量處理這些處理。常見的場景有:

  • 大文件導入數(shù)據(jù)庫(這個文件不一定是標準的CSV可導入文件或者需要在內存中經(jīng)過一定的處理)
  • 數(shù)據(jù)同步(從第三方接口拉取數(shù)據(jù)處理后寫入自己的數(shù)據(jù)庫)

以上的場景有一個共性,這類數(shù)據(jù)導入的場景簡單來說就是將數(shù)據(jù)從一個數(shù)據(jù)源移動到另外一個數(shù)據(jù)源,而其中必定可以分為兩步

  • 數(shù)據(jù)讀取:從數(shù)據(jù)源讀取數(shù)據(jù)到內存
  • 數(shù)據(jù)寫入:將內存中的數(shù)據(jù)寫入到另外一個數(shù)據(jù)源,可能存在數(shù)據(jù)處理

而且根據(jù)讀取的速度一般會比數(shù)據(jù)寫入的速度快很多,即讀取快,寫入慢。

設計思路

由于場景的特點是讀取快,寫入慢,如果是使用多線程處理,建議是數(shù)據(jù)寫入部分改造為多線程。而數(shù)據(jù)讀取可以改造成批量讀取數(shù)據(jù)。簡單來說就是兩個要點:

  • 批量讀取數(shù)據(jù)
  • 多線程寫入數(shù)據(jù)

示例

多線程批量處理最簡單的方案是使用線程池來進行處理,下面會通過一個模擬批量讀取和寫入的服務,以及對這個服務的多線程寫入調用作為示例,展示如何多線程批量數(shù)據(jù)導入。

模擬服務

import java.util.concurrent.atomic.AtomicLong;
/**
* 數(shù)據(jù)批量寫入用的模擬服務
*
* @author RJH
* create at 2019-04-01
*/
public class MockService {
/**
* 可讀取總數(shù)
*/
private long canReadTotal;
/**
* 寫入總數(shù)
*/
private AtomicLong writeTotal=new AtomicLong(0);
/**
* 寫入休眠時間(單位:毫秒)
*/
private final long sleepTime;
/**
* 構造方法
*
* @param canReadTotal
* @param sleepTime
*/
public MockService(long canReadTotal, long sleepTime) {
this.canReadTotal = canReadTotal;
this.sleepTime = sleepTime;
}
/**
* 批量讀取數(shù)據(jù)接口
*
* @param num
* @return
*/
public synchronized long readData(int num) {
long readNum;
if (canReadTotal >= num) {
canReadTotal -= num;
readNum = num;
} else {
readNum = canReadTotal;
canReadTotal = 0;
}
//System.out.println("read data size:" + readNum);
return readNum;
}
/**
* 寫入數(shù)據(jù)接口
*/
public void writeData() {
try {
// 休眠一定時間模擬寫入速度慢
Thread.sleep(sleepTime);
} catch (InterruptedException e) {
e.printStackTrace();
}
// 寫入總數(shù)自增
System.out.println("thread:" + Thread.currentThread() + " write data:" + writeTotal.incrementAndGet());
}
/**
* 獲取寫入的總數(shù)
*
* @return
*/
public long getWriteTotal() {
return writeTotal.get();
}
}

批量數(shù)據(jù)處理器

import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
/**
* 基于線程池的多線程批量寫入處理器
* @author RJH
* create at 2019-04-01
*/
public class SimpleBatchHandler {
private ExecutorService executorService;
private MockService service;
/**
* 每次批量讀取的數(shù)據(jù)量
*/
private int batch;
/**
* 線程個數(shù)
*/
private int threadNum;
public SimpleBatchHandler(MockService service, int batch,int threadNum) {
this.service = service;
this.batch = batch;
//使用固定數(shù)目的線程池
this.executorService = Executors.newFixedThreadPool(threadNum);
}
/**
* 開始處理
*/
public void startHandle() {
// 開始處理的時間
long startTime = System.currentTimeMillis();
System.out.println("start handle time:" + startTime);
long readData;
while ((readData = service.readData(batch)) != 0) {// 批量讀取數(shù)據(jù),知道讀取不到數(shù)據(jù)才停止
for (long i = 0; i < readData; i++) {
executorService.execute(() -> service.writeData());
}
}
// 關閉線程池
executorService.shutdown();
while (!executorService.isTerminated()) {//等待線程池中的線程執(zhí)行完
}
// 結束時間
long endTime = System.currentTimeMillis();
System.out.println("end handle time:" + endTime);
// 總耗時
System.out.println("total handle time:" + (endTime - startTime) + "ms");
// 寫入總數(shù)
System.out.println("total write num:" + service.getWriteTotal());
}
}

測試類

/**
* SimpleBatchHandler的測試類
* @author RJH
* create at 2019-04-01
*/
public class SimpleBatchHandlerTest {
public static void main(String[] args) {
// 總數(shù)
long total=100000;
// 休眠時間
long sleepTime=100;
// 每次拉取的數(shù)量
int batch=100;
// 線程個數(shù)
int threadNum=16;
MockService mockService=new MockService(total,sleepTime);
SimpleBatchHandler handler=new SimpleBatchHandler(mockService,batch,threadNum);
handler.startHandle();
}
}

運行結果

start handle time:1554298681755
thread:Thread[pool-1-thread-2,5,main] write data:1
thread:Thread[pool-1-thread-1,5,main] write data:2
...省略部分輸出
thread:Thread[pool-1-thread-4,5,main] write data:100000
end handle time:1554299330202
total handle time:648447ms
total write num:100000

分析

在單線程情況下的執(zhí)行時間應該為total*sleepTime,即10000000ms,而改造為多線程后執(zhí)行時間為648447ms。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關文章

  • Spring?容器初始化?register?與?refresh方法

    Spring?容器初始化?register?與?refresh方法

    這篇文章主要介紹了Spring?容器初始化?register?與?refresh方法,文章圍繞主題展開詳細的內容介紹,具有一定的參考價值,需要的小伙伴可以參考一下
    2022-07-07
  • Idea打包springboot項目沒有.original文件解決方案

    Idea打包springboot項目沒有.original文件解決方案

    這篇文章主要介紹了Idea打包springboot項目沒有.original文件解決方案,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-07-07
  • Spring Boot中自動化配置的利弊以及解決方法

    Spring Boot中自動化配置的利弊以及解決方法

    這篇文章主要給大家介紹了關于Spring Boot中自動化配置的利弊以及解決方法,文中通過示例代碼介紹的非常詳細,對大家學習或者使用Spring Boot具有一定的參考學習價值,需要的朋友們下面來一起看看吧。
    2017-08-08
  • Java基于Javafaker生成測試數(shù)據(jù)

    Java基于Javafaker生成測試數(shù)據(jù)

    這篇文章主要介紹了Java基于Javafaker生成測試數(shù)據(jù)的方法,幫助大家更好的理解和使用Java,感興趣的朋友可以了解下
    2020-12-12
  • Java實現(xiàn)ftp上傳下載、刪除文件及在ftp服務器上傳文件夾的方法

    Java實現(xiàn)ftp上傳下載、刪除文件及在ftp服務器上傳文件夾的方法

    這篇文章主要介紹了Java實現(xiàn)ftp上傳下載、刪除文件及在ftp服務器上傳文件夾的方法,需要的朋友可以參考下
    2015-11-11
  • Java結構型設計模式之組合模式Composite Pattern詳解

    Java結構型設計模式之組合模式Composite Pattern詳解

    組合模式,又叫部分整體模式,它創(chuàng)建了對象組的數(shù)據(jù)結構組合模式使得用戶對單個對象和組合對象的訪問具有一致性。本文將通過示例為大家詳細介紹一下組合模式,需要的可以參考一下
    2022-11-11
  • Java封裝好的mail包發(fā)送電子郵件的類

    Java封裝好的mail包發(fā)送電子郵件的類

    本文給大家分享了2個java封裝好的mail包發(fā)送電子郵件的類,并附上使用方法,小伙伴們可以根據(jù)自己的需求自由選擇。
    2016-01-01
  • SpringBoot如何使用自定義注解實現(xiàn)接口限流

    SpringBoot如何使用自定義注解實現(xiàn)接口限流

    這篇文章主要介紹了SpringBoot如何使用自定義注解實現(xiàn)接口限流,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-06-06
  • Java LinkedList源碼深入分析

    Java LinkedList源碼深入分析

    鏈表(Linkedlist)是一種常見的基礎數(shù)據(jù)結構,是一種線性表,但是并不會按線性的順序存儲數(shù)據(jù),而是在每一個節(jié)點里存到下一個節(jié)點的地址。鏈表可分為單向鏈表和雙向鏈表
    2022-08-08
  • SpringBoot整合MyBatisPlus詳解

    SpringBoot整合MyBatisPlus詳解

    這篇文章詳細介紹了SpringBoot整合mybatisplus的全過程,文中有詳細的代碼示例,具有一定的參考價值,需要的朋友可以參考一下
    2023-04-04

最新評論