mybatis中大批量數(shù)據(jù)插入解析
mybatis批量數(shù)據(jù)插入
本文測試三種方式,插入大量數(shù)據(jù)(10萬以上)到mysql數(shù)據(jù)庫中,有以下幾種方式
- 普通方式
- foreach批量插入
- ExecutorType.BATCH插入
1 user實體類
@Setter @Getter public class User { private Long id; private String phone; private String name; }
2 IUserService
public interface IUserService { void insertUsers(); void insertUser(); void batchInsert(); void insertUsersBatch(); }
3 userService類
package com.bear.dbinserttest; import org.apache.ibatis.session.ExecutorType; import org.apache.ibatis.session.SqlSession; import org.mybatis.spring.SqlSessionTemplate; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.stereotype.Service; import javax.annotation.Resource; import java.util.ArrayList; import java.util.List; /** * @description: * @author: zhoushaoxiong * @date: 2023/6/8 11:08 */ @Service public class UserService implements IUserService { private static int count = 1000000; @Resource private IUserDao userDao; @Autowired private SqlSessionTemplate sqlSessionTemplate; @Override public void insertUser(){ List<User> userList = new ArrayList<>(); Long start = System.currentTimeMillis(); for (int i=0; i<count; i++){ User user = new User(); user.setName("name"+i); user.setPhone("phonephone"+i); userList.add(user); userDao.insertUser(user); } Long usedTime = (System.currentTimeMillis()-start); System.out.println("插入"+count+"條數(shù)據(jù)耗時::" + usedTime); } @Override //foreach插入 public void insertUsers() { List<User> userList = new ArrayList<>(); int batch = 20000; Long start = System.currentTimeMillis(); for (int i=0; i<count; i++){ User user = new User(); user.setName("name"+i); user.setPhone("phonephone"+i); userList.add(user); if(userList.size()>=batch){ //mysql的sql語句有4M的大小限制,不能全部放在一個foreach userDao.insertUsers(userList); userList.clear(); } } if(userList.size()>0){ userDao.insertUsers(userList); } Long usedTime = (System.currentTimeMillis()-start); System.out.println("插入"+count+"條數(shù)據(jù)耗時::" + usedTime); } @Override //ExecutorType.BATCH插入 public void insertUsersBatch(){ //手動創(chuàng)建userDao SqlSession sqlSession = sqlSessionTemplate.getSqlSessionFactory().openSession(ExecutorType.BATCH, false); IUserDao userDao2 = sqlSession.getMapper(IUserDao.class); Long start = System.currentTimeMillis(); int batch = 1000; for (int i=0; i<count; i++){ User user = new User(); user.setName("name"+i); user.setPhone("phonephone"+i); userDao2.insertUser(user); if(i!=0 && i%batch==0){ //1000條提交一次 sqlSession.commit(); } } sqlSession.commit(); Long usedTime = (System.currentTimeMillis()-start); System.out.println("插入"+count+"條數(shù)據(jù)耗時::" + usedTime); } }
4 IUserDao
package com.bear.dbinserttest; import org.apache.ibatis.annotations.Mapper; import org.apache.ibatis.annotations.Param; import org.mybatis.spring.annotation.MapperScan; import java.util.List; /** * @description: * @author: zhoushaoxiong * @date: 2023/6/8 11:15 */ public interface IUserDao { void insertUsers(List<User> userList); void insertUser(User user); void batchInsert(@Param("list") List<User> list); void insertUsersBatch(List<User> users); }
5 UserMapper
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd" > <mapper namespace="com.bear.dbinserttest.IUserDao" > <insert id="insertUser" parameterType="com.bear.dbinserttest.User"> insert into user(name, phone) values (#{name}, #{phone}) </insert> <-- 普通插入 --/> <insert id="insertUsers" parameterType="com.bear.dbinserttest.User"> insert into user(name, phone) values <foreach collection="userList" item="user" separator=","> (#{user.name}, #{user.phone}) </foreach> </insert> <-- foreach插入 --/> <insert id="batchInsert" parameterType="com.bear.dbinserttest.User"> <foreach collection="list" item="item" separator=";" > insert into user <trim prefix="(" suffix=")" suffixOverrides=","> <if test="item.id != null"> id, </if> <if test="item.name != null"> `name`, </if> <if test="item.phone != null"> `phone`, </if> </trim> <trim prefix="values (" suffix=")" suffixOverrides=","> <if test="item.id != null"> #{item.id,jdbcType=INTEGER}, </if> <if test="item.name != null"> #{item.name,jdbcType=VARCHAR}, </if> <if test="item.phone != null"> #{item.phone,jdbcType=VARCHAR}, </if> </trim> </foreach> </insert> <-- ExecutorType.BATCH插入 --/> <insert id="insertUsersBatch" parameterType="com.bear.dbinserttest.User"> insert into user(name, phone) values (#{name}, #{phone}) </insert> </mapper>
6 application.yml 配置文件
url必須設置rewriteBatchedStatements=true,否則ExecutorType.BATCH插入的方式效率很低
server: port: 8080 spring: datasource: username: root password: 123456 url: jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=utf-8&useSSL=false&serverTimezone=UTC&rewriteBatchedStatements=true mybatis: mapper-locations: classpath:mapper/*.xml
7 DbinserttestApplicationTests 測試類
package com.bear.dbinserttest; import org.junit.jupiter.api.Test; import org.mybatis.spring.annotation.MapperScan; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.boot.test.context.SpringBootTest; import java.util.ArrayList; import java.util.Iterator; import java.util.List; @SpringBootTest class DbinserttestApplicationTests { @Autowired IUserService userService; @Test //測試普通插入 void contextLoads() { userService.insertUser(); //插入100000條數(shù)據(jù)耗時::74895ms } @Test //測試foreach插入 void contextLoads2() { userService.insertUsers(); //插入100000條數(shù)據(jù)耗時::1801ms } @Test //測試ExecutorType.BATCH插入 void contextLoads3() { userService.insertUsersBatch(); //插入100000條數(shù)據(jù)耗時::1143ms } }
8 小結
1.普通插入
默認的插入方式是遍歷insert語句,單條執(zhí)行,效率肯定低下,如果成堆插入,更是性能有問題。
INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2"); INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2"); INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2"); INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2"); INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2");
可以看到每個語句的執(zhí)行創(chuàng)建一個新的預處理語句,單條提交sql,性能低下.
2.foreach 優(yōu)化插入
如果要優(yōu)化插入速度時,可以將許多小型操作組合到一個大型操作中。理想情況下,這樣可以在單個連接中一次性發(fā)送許多新行的數(shù)據(jù),并將所有索引更新和一致性檢查延遲到最后才進行。
INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2"), ("data1", "data2"), ("data1", "data2"), ("data1", "data2"), ("data1", "data2");
當表的列數(shù)較多(20+),以及一次性插入的行數(shù)較多(5000+)時,整個插入的耗時十分漫長,注意耗時在PreparedStatement特別長,包含了很多占位符,對于占位符和參數(shù)的映射尤其耗時
需要注意的點: Mysql 對語句的長度有限制,默認是 4M。
3.ExecutorType.BATCH插入
Mybatis內置的ExecutorType有3種,SIMPLE、REUSE、BATCH; 默認的是simple,該模式下它為每個語句的執(zhí)行創(chuàng)建一個新的預處理語句,單條提交sql;而batch模式重復使用已經(jīng)預處理的語句,并且批量執(zhí)行所有更新語句,顯然batch性能將更優(yōu);但batch模式也有自己的問題,比如在Insert操作時,在事務沒有提交之前,是沒有辦法獲取到自增的id,這在某型情形下是不符合業(yè)務要求的.
JDBC 在執(zhí)行 SQL 語句時,會將 SQL 語句以及實參通過網(wǎng)絡請求的方式發(fā)送到數(shù)據(jù)庫,一次執(zhí)行一條 SQL 語句,一方面會減小請求包的有效負載,另一個方面會增加耗費在網(wǎng)絡通信上的時間。通過批處理的方式,我們就可以在 JDBC 客戶端緩存多條 SQL 語句,然后在 flush 或緩存滿的時候,將多條 SQL 語句打包發(fā)送到數(shù)據(jù)庫執(zhí)行,這樣就可以有效地降低上述兩方面的損耗,從而提高系統(tǒng)性能。
需要注意的點:進行jdbc批處理時需在JDBC的url中加入rewriteBatchedStatements=true
ExecutorType.BATCH原理:把SQL語句發(fā)個數(shù)據(jù)庫,數(shù)據(jù)庫預編譯好,數(shù)據(jù)庫等待需要運行的參數(shù),接收到參數(shù)后一次運行,ExecutorType.BATCH只打印一次SQL語句,預編譯一次sql,多次設置參數(shù)步驟.
經(jīng)過以上三種方式分析,在插入大數(shù)據(jù)量時優(yōu)先選擇第三種方式, ExecutorType.BATCH插入
到此這篇關于mybatis中大批量數(shù)據(jù)插入解析的文章就介紹到這了,更多相關mybatis批量數(shù)據(jù)插入內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Springboot JPA 枚舉Enum類型存入到數(shù)據(jù)庫的操作
這篇文章主要介紹了Springboot JPA 枚舉Enum類型存入到數(shù)據(jù)庫的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-01-01SpringMVC將請求和響應的數(shù)據(jù)轉換為JSON格式的幾種方式
這篇文章主要給大家介紹餓了SpringMVC將請求和響應的數(shù)據(jù)轉換為JSON格式的幾種方式,文中通過代碼示例和圖文結合給大家介紹的非常詳細,具有一定的參考價值,需要的朋友可以參考下2023-11-11Java實現(xiàn)跳躍表(skiplist)的簡單實例
這篇文章主要介紹了Java編程中跳躍表的概念和實現(xiàn)原理,并簡要敘述了它的結構,具有一定參考價值,需要的朋友可以了解下。2017-09-09