腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

MongoDB中單對象大小超16M的存儲方案

更新時間：2025年01月26日 10:09:37 作者：yuanpan

在 MongoDB 中,單個文檔的大小限制為 16MB,如果某個對象（文檔）的大小超過 16MB該怎么辦,所以本文給大家介紹了MongoDB中單對象大小超16M的存儲方案,需要的朋友可以參考下

1. 使用 GridFS

適用場景：需要存儲大文件（如圖像、視頻、文檔等）。

原理

MongoDB 的 GridFS 是一種專門用于存儲超過 16MB 文件的工具。
它會將大文件分割成多個 chunk（默認大小 255KB），并存儲在兩個集合中：
- fs.files：存儲文件的元數(shù)據(jù)（如文件名、大小、類型等）。
- fs.chunks：存儲文件的內(nèi)容分塊。

實現(xiàn)步驟

存儲大文件 使用 MongoDB 驅(qū)動的 GridFS 工具存儲文件。

Python 示例：

from pymongo import MongoClient
from gridfs import GridFS
 
client = MongoClient("mongodb://localhost:27017")
db = client.myDatabase
fs = GridFS(db)
 
# 存儲文件
with open("large_file.bin", "rb") as f:
    fs.put(f, filename="large_file.bin")

讀取大文件

# 讀取文件
file_data = fs.get_last_version(filename="large_file.bin")
with open("output.bin", "wb") as f:
    f.write(file_data.read())

2. 將文檔拆分為多個小文檔

適用場景：文檔包含大量嵌套數(shù)據(jù)，導(dǎo)致總大小超過 16MB。

解決思路

將大文檔拆分成多個子文檔。
使用字段（如 _id 或 parentId）將這些子文檔關(guān)聯(lián)起來。

實現(xiàn)步驟

示例：拆分用戶日志記錄 原始大文檔（超 16MB）：

{ "_id": "user1", "logs": [ { "timestamp": "2025-01-01", "action": "login" }, ... ] }

拆分為多個小文檔：

// 主文檔

{ "_id": "user1", "type": "userMetadata" }

// 子文檔

{ "parentId": "user1", "logs": [ { "timestamp": "2025-01-01", "action": "login" }, ... ] }

查詢時合并：

db.metadata.find({ _id: "user1" });

db.logs.find({ parentId: "user1" });

3. 使用 BSON 對象數(shù)組存儲引用

適用場景：需要在文檔中存儲大量關(guān)聯(lián)對象。

解決思路

將大數(shù)組分割到其他集合中，主文檔存儲引用。

示例

大文檔超限前：

{ "_id": "project1", "name": "Big Project", "tasks": [ /* 超大量任務(wù)數(shù)據(jù) */ ] }

優(yōu)化后：

// 主文檔 
{ "_id": "project1", "name": "Big Project" } 
// 任務(wù)文檔 
{ "projectId": "project1", "taskId": 1, "taskName": "Task 1", ... }

查詢時通過 projectId 關(guān)聯(lián)：

db.projects.find({ _id: "project1" }); db.tasks.find({ projectId: "project1" });

4. 壓縮數(shù)據(jù)

適用場景：文檔中包含重復(fù)數(shù)據(jù)或可壓縮結(jié)構(gòu)（如 JSON 數(shù)據(jù)）。

解決思路

在存儲之前壓縮數(shù)據(jù)（例如使用 GZIP、Zlib 等）。
查詢時解壓數(shù)據(jù)。

示例

Python 實現(xiàn)：

import zlib
from pymongo import MongoClient
 
client = MongoClient("mongodb://localhost:27017")
db = client.myDatabase
collection = db.myCollection
 
# 壓縮存儲
data = {"key": "value" * 10000}
compressed_data = zlib.compress(str(data).encode("utf-8"))
collection.insert_one({"_id": "compressed_doc", "data": compressed_data})
 
# 解壓讀取
doc = collection.find_one({"_id": "compressed_doc"})
decompressed_data = zlib.decompress(doc["data"]).decode("utf-8")

5. 修改數(shù)據(jù)結(jié)構(gòu)

適用場景：文檔設(shè)計冗余或結(jié)構(gòu)不合理。

解決思路

簡化嵌套層級。
使用更緊湊的數(shù)據(jù)類型（如數(shù)組代替對象）。

優(yōu)化前：

{ "_id": "order1", "customer": { "id": 1, "name": "John Doe" }, "items": [ { "productId": "p1", "productName": "Product 1", "quantity": 2 } ] }

優(yōu)化后：

{ "_id": "order1", "customerId": 1, "items": [ { "p": "p1", "q": 2 } ] }

6. 使用文件系統(tǒng)或其他存儲服務(wù)

適用場景：非結(jié)構(gòu)化大數(shù)據(jù)（如媒體文件、大型JSON）。

解決思路

將大數(shù)據(jù)存儲到文件系統(tǒng)、Amazon S3、Azure Blob 等。
在 MongoDB 中存儲文件路徑或 URL。

總結(jié)

優(yōu)先選擇方案：
1. 使用 GridFS 存儲大文件。
2. 拆分文檔 或 分表設(shè)計 解決超大文檔問題。
3. 結(jié)合壓縮或外部存儲進一步優(yōu)化。

以上就是MongoDB中單對象大小超16M的存儲方案的詳細內(nèi)容，更多關(guān)于MongoDB單對象大小超16M的資料請關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

MongoDB中單對象大小超16M的存儲方案

目錄

1. 使用 GridFS

原理

實現(xiàn)步驟

2. 將文檔拆分為多個小文檔

解決思路

實現(xiàn)步驟

3. 使用 BSON 對象數(shù)組存儲引用

解決思路

示例

4. 壓縮數(shù)據(jù)

解決思路

示例

5. 修改數(shù)據(jù)結(jié)構(gòu)

解決思路

6. 使用文件系統(tǒng)或其他存儲服務(wù)

解決思路

總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具