快捷導(dǎo)航

SpringBoot 使用Mongo的GridFs實(shí)現(xiàn)分布式文件存儲(chǔ)操作

更新時(shí)間：2021年10月23日 10:43:09 作者：老鄭來(lái)了

這篇文章主要介紹了Spring Boot 使用Mongo的GridFs實(shí)現(xiàn)分布式文件存儲(chǔ)操作，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教

前言

這段時(shí)間在公司實(shí)習(xí)，安排給我一個(gè)任務(wù)，讓在系統(tǒng)里實(shí)現(xiàn)一個(gè)知識(shí)庫(kù)的模塊，產(chǎn)品說(shuō)，就像百度網(wǎng)盤(pán)那樣。。。我tm…,這不就是應(yīng)了那句話，“這個(gè)需求很簡(jiǎn)單，怎么實(shí)現(xiàn)我不管”。

可是我google小能手怎么會(huì)認(rèn)輸呢，本來(lái)還說(shuō)研究一下FastDFS啥的，但是因?yàn)槲覀冺?xiàng)目用的Mongo作為數(shù)據(jù)庫(kù)，了解到Mongo自帶分布式文件系統(tǒng)GridFs，這簡(jiǎn)直天助我也。

GridFs介紹

什么時(shí)候使用GridFs

我們平時(shí)使用Mongo也可以直接把文件的二進(jìn)制保存在Document中，就相當(dāng)于mysql的blob格式，但是mongo限制Document最大為16MB，那我們超過(guò)16MB的文件可咋辦吶，就可以利用GridFs來(lái)存儲(chǔ)。

在某些情況下，在MongoDB數(shù)據(jù)庫(kù)中存儲(chǔ)大文件可能比在系統(tǒng)級(jí)文件系統(tǒng)上更高效。
如果文件系統(tǒng)限制目錄中的文件數(shù)，則可以使用GridFS根據(jù)需要存儲(chǔ)任意數(shù)量的文件。如果要從大型文件的各個(gè)部分訪問(wèn)信息而無(wú)需將整個(gè)文件加載到內(nèi)存中，可以使用GridFS調(diào)用文件的各個(gè)部分，而無(wú)需將整個(gè)文件讀入內(nèi)存。
如果要保持文件和元數(shù)據(jù)在多個(gè)系統(tǒng)和設(shè)施中自動(dòng)同步和部署，可以使用GridFS。使用地理位置分散的副本集時(shí)，MongoDB可以自動(dòng)將文件及其元數(shù)據(jù)分發(fā)到多個(gè) mongod實(shí)例和工具中。

GridFs的原理

GridFS不是將文件存儲(chǔ)在單個(gè)文檔中，而是將文件分成多個(gè)部分或塊，并將每個(gè)塊存儲(chǔ)為單獨(dú)的文檔。

GridFS使用兩個(gè)集合來(lái)存儲(chǔ)文件。一個(gè)集合存儲(chǔ)文件塊，另一個(gè)存儲(chǔ)文件元數(shù)據(jù)。

在這里插入圖片描述

默認(rèn)情況下，每一個(gè)塊的大小為255kB; 但最后一個(gè)塊除外。最后一個(gè)塊只有必要的大小。類似地，不大于塊大小的文件只有最終塊，只使用所需的空間和一些額外的元數(shù)據(jù)。

當(dāng)查詢GridFS文件時(shí)，驅(qū)動(dòng)程序?qū)⒏鶕?jù)需要重新組裝塊?？梢詫?duì)通過(guò)GridFS存儲(chǔ)的文件執(zhí)行范圍查詢。還可以從文件的任意部分訪問(wèn)信息，例如“跳過(guò)”到視頻或音頻文件的中間。

環(huán)境

Spring Boot 2.0.4
Maven 3.5
Java 1.8
MongoDB 4.0
Robo 1.3.1

引入依賴和項(xiàng)目配置

首先添加Mongo客戶端的依賴

<dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-data-mongodb</artifactId>
</dependency>

然后編寫(xiě)配置文件

spring:
  application:
    name: demo
  data:
    mongodb:
      uri: mongodb://root:你的密碼@localhost:27019
      authentication-database: admin
      database: 你的數(shù)據(jù)庫(kù)

使用GridFsTemplate操作GridFs

GridFsTemplate是Spring提供的專門(mén)操作GridFs的客戶端，提供了一系列開(kāi)箱即用的方法

在這里插入圖片描述

只要把它注入到我們的Conteoller中，就可以愉快的CRUD了，需要注意的是獲取文件時(shí)要注入MongoDbFactory ，我們使用默認(rèn)配置的話，直接注入就好。

 
import com.mongodb.Block;
import com.mongodb.MongoClient;
import com.mongodb.client.MongoDatabase;
import com.mongodb.client.gridfs.GridFSBucket;
import com.mongodb.client.gridfs.GridFSBuckets;
import com.mongodb.client.gridfs.model.GridFSFile;
import com.mongodb.client.gridfs.model.GridFSUploadOptions;
import com.mongodb.gridfs.GridFS;
import com.mongodb.gridfs.GridFSDBFile;
import org.bson.BsonValue;
import org.bson.Document;
import org.bson.types.ObjectId;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.*;
import org.springframework.web.multipart.MultipartFile; 
import javax.servlet.http.HttpServletResponse;
import java.io.*;
import java.util.*;
   
@RestController
@RequestMapping("/files")
public class FileController {
	private Logger logger = LoggerFactory.getLogger(GridFsServiceImpl.class);
    //匹配文件ID的正則
    private static Pattern NUMBER_PATTERN = Pattern.compile("(?<==).*(?=})"); 
    @Autowired
    GridFsTemplate gridFsTemplate;
    @Autowired
    MongoDbFactory mongoDbFactory;
 
    /**
     * 上傳文件
     *
     * @param file 文件
     * @return 文件名和文件存儲(chǔ)的fileId鍵值對(duì)的Map
     */
    @RequestMapping(value = "/upload", method = RequestMethod.POST)
    public Map<String, ObjectId> upload(@RequestParam(value = "file") MultipartFile file) {
  if(pathId == null || fileType == null || pathId.equals("") || fileType.equals("")){
            logger.debug("上傳文件出錯(cuò)");
            throw new RuntimeException("上傳文件出錯(cuò)：pathId and fileType can not be null");
        }
        Map<String, String> map = new HashMap<>(1);
        String fileName = file.getOriginalFilename();
        //設(shè)置元數(shù)據(jù)
        DBObject metaData = new BasicDBObject();
        metaData.put("userId","1");
        metaData.put("fileExtension",FilenameUtils.getExtension(file.getOriginalFilename()));
        //存儲(chǔ)文件的擴(kuò)展名
       
        try {
            InputStream inputStream = file.getInputStream();
            ObjectId fileId = gridFsTemplate.store(inputStream, fileName,metaData);
            //這個(gè)getFileId是我自己封裝的獲取文件ID的方法
            map.put(file.getOriginalFilename(),getFileId(fileId.toString()));
        } catch (IOException e) {
            logger.debug("上傳文件失敗: "+file);
            throw new RuntimeException("上傳文件失敗："+e.getMessage());
        }
        return map;
    }
 
    /**
     * 通過(guò)文件fileId下載文件
     *
     * @param fileId 文件fileId
     * @param response 文件輸出流
     */
    @RequestMapping(value = "/downLoadByFileId")
    public void downLoadByFileId(@RequestParam(value = "fileId") ObjectId fileId, HttpServletResponse response) {
 GridFSFile gridFsFile = gridFsTemplate.findOne(new Query().addCriteria(Criteria.where("_id").is(fileId)));
        if (gridFsFile != null) {
            // mongo-java-driver3.x以上的版本就變成了這種方式獲取
            GridFSBucket bucket = GridFSBuckets.create(mongoDbFactory.getDb());
            GridFSDownloadStream gridFsDownloadStream = bucket.openDownloadStream(gridFsFile.getObjectId());
            GridFsResource gridFsResource = new GridFsResource(gridFsFile,gridFsDownloadStream);
            String fileName = gridFsFile.getFilename().replace(",", "");
            //處理中文文件名亂碼
            if (request.getHeader("User-Agent").toUpperCase().contains("MSIE") ||
                    request.getHeader("User-Agent").toUpperCase().contains("TRIDENT")
                    || request.getHeader("User-Agent").toUpperCase().contains("EDGE")) {
                fileName = java.net.URLEncoder.encode(fileName, "UTF-8");
            } else {
                //非IE瀏覽器的處理：
                fileName = new String(fileName.getBytes(StandardCharsets.UTF_8), StandardCharsets.ISO_8859_1);
            }
            response.setHeader("Content-Disposition", "inline;filename=\"" + fileName + "\"");
            response.setContentType(application/octet-stream);
            IOUtils.copy(gridFsResource.getInputStream(), response.getOutputStream());
        }else {
            logger.info("文件不存在");
        } 
    }
    
	/**
     * 根據(jù)文件名查詢文件列表
     * @param fileName 文件名
     * @return
     */
    @RequestMapping("/search")
    public List<Map<String,Object>> search(String filePath, String fileName) {
		//這里返回的是一個(gè)List<Map<String,Object>>
		//因?yàn)镚ridFSFindIterable 迭代出來(lái)的GridFSFile不能直接返回
        GridFSFindIterable gridFSFiles = gridFsTemplate.find(new Query().addCriteria
                (Criteria.where("filename").regex("^.*"+fileName+".*$")));
        return getGridFSFiles(gridFSFiles);
    }
 
    /**
     * 通過(guò)fileId刪除文件
     * @param fileId 文件ID
     * @return 成功為true, 失敗為false
     */
    @RequestMapping("/deleteFilesByObjectId")
    public boolean deleteFilesByObjectId(@RequestParam(value = "fileId") String fileId) {
         try {
            gridFsTemplate.delete(new Query().addCriteria(Criteria.where("_id").is(fileId)));
        }catch (Exception e){
            logger.debug("刪除文件失敗: fileId= "+fileId);
            throw new RuntimeException("刪除文件失?。?+e.getMessage());
        }
    }
	/**
     * 根據(jù)GridFSFiles迭代器返回文件列表，因?yàn)椴荒苤苯臃祷?，所以?xiě)了這個(gè)工具方法
     * @param gridFSFiles 從數(shù)據(jù)庫(kù)取出的文件集合
     * @return List<Map<String,Object>>
     */
    private List<Map<String,Object>> getGridFSFiles(GridFSFindIterable gridFSFiles){
        List<Map<String,Object>> result = new ArrayList<>();
        for (GridFSFile file : gridFSFiles) {
            HashMap<String,Object> map = new HashMap<>(6);
            map.put("fileId",getFileId(file.getId().toString()));
            map.put("fileName",file.getFilename());
            map.put("fileExtension",file.getMetadata().get("fileExtension"));
            map.put("fileSize",file.getLength()/1024);
            map.put("uploadTime",file.getUploadDate());
            map.put("user",file.getMetadata().get("userId"));
            result.add(map);
        }
        return result;
    }
    /**
     * 因?yàn)閺膍ongo中獲取的文件Id是BsonObjectId {value=5d7068bbcfaf962be4c7273f}的樣子
     * 需要字符串截取
     * @param bsonObjectId 數(shù)據(jù)庫(kù)文件的BsonObjectId
     */
    private String getFileId(String bsonObjectId) {
        Matcher m = NUMBER_PATTERN.matcher(bsonObjectId);
        if(!m.find()){
            return bsonObjectId;
        }
        return m.group();
    }
}

以上為個(gè)人經(jīng)驗(yàn)，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章: