欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Java多線程編程實戰(zhàn)之模擬大量數據同步

 更新時間:2019年02月14日 10:20:01   作者:沉靜  
這篇文章主要介紹了Java多線程編程實戰(zhàn)之模擬大量數據同步,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

背景

最近對于 Java 多線程做了一段時間的學習,筆者一直認為,學習東西就是要應用到實際的業(yè)務需求中的。否則要么無法深入理解,要么硬生生地套用技術只是達到炫技的效果。

不過筆者仍舊認為自己對于多線程掌握不夠熟練,不敢輕易應用到生產代碼中。這就按照平時工作中遇到的實際問題,腦補了一個很可能存在的業(yè)務場景:

已知某公司管理著 1000 個微信服務號,每個服務號有 1w ~ 50w 粉絲不等。假設該公司每天都需要將所有微信服務號的粉絲數據通過調用微信 API 的方式更新到本地數據庫。

需求分析

對此需求進行分析,主要存在以下問題:

  • 單個服務號獲取粉絲 id,只能每次 1w 按順序拉取
  • 微信的 API 對于服務商的并發(fā)請求數量有限制

單個服務號獲取粉絲 id,只能每次 1w 按順序拉取。這個問題決定了單個公眾號在拉取粉絲 id 上,無法分配給多個線程執(zhí)行。

微信的 API 對于服務商的并發(fā)請求數量有限制。這點最容易被忽略,如果我們同時有過多的請求,則會導致接口被封禁。這里可以通過信號量來控制同時執(zhí)行的線程數量。

為了盡快完成數據同步,根據實際情況:整個數據同步可分為讀數據和寫數據兩個部分。讀數據是通過 API 獲取,走網絡 IO,速度較慢;寫數據是寫到數據庫,速度較快。所以得出結論:需要分配較多的線程進行讀數據,較少的線程進行寫數據。

設計要點

首先,我們需要確定開啟多少個線程(在生產中往往是使用線程池),線程數量需要根據服務器性能來決定,這里我們定為 40 個讀取數據線程(將 1000 個公眾號分為 40 份,分別在 40 個線程中執(zhí)行),1個寫入數據線程。(具體開多少個線程,取決于線程池的容量,以及可以分配給此業(yè)務的數量。具體的數字需要根據實際情況測試得出,比服務器閾值低一些較好。當然,配置允許范圍內越大越好)

其次,考慮到微信對于 API 并發(fā)請求的限制,需要限制同時執(zhí)行的線程數,使用java.util.concurrent.Semaphore進行控制,這里我們限制為 20 個(具體的信號量憑證數,取決于同一時間能夠執(zhí)行的線程,跟 API 限制,服務器性能有關)。

然后,我們需要知道數據何時讀取、寫入完畢,以控制程序邏輯以及終止程序,這里我們使用java.util.concurrent.CountDownLatch進行控制。

最后,我們需要一個數據結構,用來在多個線程共享處理的數據,此處同步數據的場景非常適合使用隊列,這里我們使用線程安全的java.util.concurrent.ConcurrentLinkedQueue來進行處理。(需要注意的是,在實際開發(fā)中,隊列不能夠無限制地增長,這將會很快消耗掉內存,我們需要根據實際情況對隊列長度做控制。例如,可以通過控制讀取線程數和寫入線程數的比例來控制隊列的長度)

模擬代碼

由于本文重點關注多線程的使用,模擬代碼只體現(xiàn)多線程操作的方法。代碼里添加了大量的注釋,方便各位讀者閱讀理解。

JDK:1.8

import java.util.Arrays;
import java.util.List;
import java.util.Queue;
import java.util.concurrent.ConcurrentLinkedQueue;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.Semaphore;
import java.util.concurrent.TimeUnit;

/**
 * N個線程向隊列添加數據
 * 一個線程消費隊列數據
 */
public class QueueTest {
  private static List<String> data = Arrays.asList("a", "b", "c", "d", "e");

  private static final int OFFER_COUNT = 40; // 開啟的線程數量

  private static Semaphore semaphore = new Semaphore(20); // 同一時間執(zhí)行的線程數量(大多用于控制API調用次數或數據庫查詢連接數)

  public static void main(String[] args) throws InterruptedException {
    Queue<String> queue = new ConcurrentLinkedQueue<>(); // 處理隊列,需要處理的數據,放置到此隊列中

    CountDownLatch offerLatch = new CountDownLatch(OFFER_COUNT); // offer線程latch,每完成一個,latch減一,lacth的count為0時表示offer處理完畢
    CountDownLatch pollLatch = new CountDownLatch(1); // poll線程latch,latch的count為0時,表示poll處理完畢

    Runnable offerRunnable = () -> {
      try {
        semaphore.acquire(); // 信號量控制
      } catch (InterruptedException e) {
        e.printStackTrace();
      }

      try {
        for (String datum : data) {
          queue.offer(datum);
          TimeUnit.SECONDS.sleep(2); // 模擬取數據很慢的情況
        }
      } catch (InterruptedException e) {
        e.printStackTrace();
      } finally {
        // 在finally中執(zhí)行l(wèi)atch.countDown()以及信號量釋放,避免因異常導致沒有正常釋放
        offerLatch.countDown();
        semaphore.release();
      }
    };

    Runnable pollRunnable = () -> {
      int count = 0;
      try {
        while (offerLatch.getCount() > 0 || queue.size() > 0) { // 只要offer的latch未執(zhí)行完,或queue仍舊有數據,則繼續(xù)循環(huán)
          String poll = queue.poll();
          if (poll != null) {
            System.out.println(poll);
            count++;
          }
          // 無論是否poll到數據,均暫停一小段時間,可降低CPU消耗
          TimeUnit.MILLISECONDS.sleep(100);
        }
        System.out.println("total count:" + count);
      } catch (InterruptedException e) {
        e.printStackTrace();
      } finally {
        // 在finally中執(zhí)行l(wèi)atch.countDown(),避免因異常導致沒有正常釋放
        pollLatch.countDown();
      }
    };

    // 啟動線程(生產環(huán)境中建議使用線程池)
    new Thread(pollRunnable).start(); // 啟動一個poll線程
    for (int i = 0; i < OFFER_COUNT; i++) {
      new Thread(offerRunnable).start();
    } // 模擬取數據很慢,需要開啟40個線程處理

    // latch等待,會block主線程直到latch的count為0
    offerLatch.await();
    pollLatch.await();

    System.out.println("===the end===");
  }
}

到這里,本文結束。以上是筆者腦補的一個常見需求的解決方案。

注意:多線程編程對實際環(huán)境和需求有很大的依賴,需要根據實際的需求情況對各個參數做調整。實際在使用中,需要盡量模擬生產環(huán)境的數據情況來進行測試,對服務器執(zhí)行期間的并發(fā)數,CPU、內存、網絡 IO、磁盤 IO 做好觀察。并適當地調低并發(fā)數,以給服務器留有處理其他請求的余量。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關文章

  • Spring?Boot?整合?Fisco?Bcos的案例分析(區(qū)塊鏈)

    Spring?Boot?整合?Fisco?Bcos的案例分析(區(qū)塊鏈)

    本篇文章介紹的?Spring?Boot?整合?Fisco?Bcos的案例,是在阿里云服務器上部署驗證的。大家可根據自己的電腦環(huán)境,對比該案例進行開發(fā)即可,具體案例代碼跟隨小編一起看看吧
    2022-01-01
  • Spring Boot的FailureAnalyzer機制及如何解救應用啟動危機

    Spring Boot的FailureAnalyzer機制及如何解救應用啟動危機

    本文探討了FailureAnalyzer工具,它不僅能幫助我們快速識別和處理代碼中的錯誤,還能極大地提升我們的開發(fā)效率,通過詳細的實例分析,我們了解了FailureAnalyzer如何通過自定義邏輯應對不同類型的異常,讓程序員能夠更好地定位問題并迅速找到解決方案,感興趣的朋友一起看看吧
    2025-01-01
  • 關于BindingResult的使用總結及注意事項

    關于BindingResult的使用總結及注意事項

    這篇文章主要介紹了關于BindingResult的使用總結及注意事項,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-12-12
  • SpringBoot 整合 Avro 與 Kafka的詳細過程

    SpringBoot 整合 Avro 與 Kafka的詳細過程

    本文介紹了如何在Spring Boot中使用Avro和Kafka進行數據的序列化和反序列化,并通過MyBatisPlus將數據存入數據庫,感興趣的朋友跟隨小編一起看看吧
    2024-12-12
  • Spring?Security內置過濾器的維護方法

    Spring?Security內置過濾器的維護方法

    這篇文章主要介紹了Spring?Security的內置過濾器是如何維護的,本文給我們分析一下HttpSecurity維護過濾器的幾個方法,需要的朋友可以參考下
    2022-02-02
  • Java生成隨機時間的簡單隨機算法

    Java生成隨機時間的簡單隨機算法

    今天小編就為大家分享一篇關于Java生成隨機時間的簡單隨機算法,小編覺得內容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-01-01
  • nacos客戶端如何獲取配置

    nacos客戶端如何獲取配置

    這篇文章主要介紹了nacos客戶端如何獲取配置方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2024-07-07
  • Maven中optional和scope元素的使用弄明白了嗎

    Maven中optional和scope元素的使用弄明白了嗎

    這篇文章主要介紹了Maven中optional和scope元素的使用弄明白了嗎,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-12-12
  • Java SPI 機制知識點總結

    Java SPI 機制知識點總結

    在本篇文章里小編給大家整理的是一篇關于Java SPI 機制知識點總結內容,需要的朋友們可以參考下。
    2020-02-02
  • 淺談Spring裝配Bean之組件掃描和自動裝配

    淺談Spring裝配Bean之組件掃描和自動裝配

    本篇文章主要介紹了淺談Spring裝配Bean之組件掃描和自動裝配,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-10-10

最新評論