NodeJS模塊Buffer原理及使用方法解析

更新時(shí)間：2020年11月11日 11:00:45 作者：酷兒q

這篇文章主要介紹了NodeJS模塊Buffer原理及使用方法解析,文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

Buffer 作為 nodejs 中重要的概念和功能，為開(kāi)發(fā)者提供了操作二進(jìn)制的能力。本文記錄了幾個(gè)問(wèn)題，來(lái)加深對(duì) Buffer 的理解和使用：

認(rèn)識(shí)緩沖器
如何申請(qǐng)堆外內(nèi)存
如何計(jì)算字節(jié)長(zhǎng)度
如何計(jì)算字節(jié)長(zhǎng)度
如何轉(zhuǎn)換字符編碼
理解共享內(nèi)存與拷貝內(nèi)存

認(rèn)識(shí) Buffer（緩沖器）

Buffer 是 nodejs 核心 API，它提供我們處理二進(jìn)制數(shù)據(jù)流的功能。Buffer 的使用和 ES2017 的 Uint8Array 非常相似，但由于 node 的特性，專門提供了更深入的 api。

Uint8Array 的字面意思就是：8 位無(wú)符號(hào)整型數(shù)組。一個(gè)字節(jié)是 8bit，而字節(jié)的表示也是由兩個(gè) 16 進(jìn)制（4bit）的數(shù)字組成的。

const buf = Buffer.alloc(1);
console.log(buf); // output: <Buffer 00>

如何申請(qǐng)堆外內(nèi)存

Buffer 可以跳出 nodejs 對(duì)堆內(nèi)內(nèi)存大小的限制。nodejs12 提供了 4 種 api 來(lái)申請(qǐng)堆外內(nèi)存：

Buffer.from()
Buffer.alloc(size[, fill[, encoding]])
Buffer.allocUnsafe(size)
Buffer.allocUnsafeSlow(size)

Buffer.alloc vs Buffer.allocUnsafe

在申請(qǐng)內(nèi)存時(shí)，可能這片內(nèi)存之前存儲(chǔ)過(guò)其他數(shù)據(jù)。如果不清除原數(shù)據(jù)，那么會(huì)有數(shù)據(jù)泄漏的安全風(fēng)險(xiǎn)；如果清除原數(shù)據(jù)，速度上會(huì)慢一些。具體用哪種方式，根據(jù)實(shí)際情況定。

Buffer.alloc：申請(qǐng)指定大小的內(nèi)存，并且清除原數(shù)據(jù)，默認(rèn)填充 0
Buffer.allocUnsafe：申請(qǐng)指定大小內(nèi)存，但不清除原數(shù)據(jù)，速度更快

根據(jù)提供的 api，可以手動(dòng)實(shí)現(xiàn)一個(gè)alloc：

function pollifyAlloc(size, fill = 0, encoding = "utf8") {
  const buf = Buffer.allocUnsafe(size);
  buf.fill(fill, 0, size, encoding);
  return buf;
}

Buffer.allocUnsafe vs Buffer.allocUnsafeSlow

從命名上可以直接看出效果，Buffer.allocUnsafeSlow更慢。因?yàn)楫?dāng)使用 Buffer.allocUnsafe 創(chuàng)建新的 Buffer 實(shí)例時(shí)，如果要分配的內(nèi)存小于 4KB，則會(huì)從一個(gè)預(yù)分配的 Buffer 切割出來(lái)。這可以避免垃圾回收機(jī)制因創(chuàng)建太多獨(dú)立的 Buffer 而過(guò)度使用。

這種方式通過(guò)消除跟蹤和清理的需要來(lái)改進(jìn)性能和內(nèi)存使用。

如何計(jì)算字節(jié)長(zhǎng)度

利用 Buffer，可以獲得數(shù)據(jù)的真實(shí)所占字節(jié)。例如一個(gè)漢字，它的字符長(zhǎng)度是 1。但由于是 utf8 編碼的漢字，所以占用 3 個(gè)字節(jié)。

直接利用Buffer.byteLength()可以獲得字符串指定編碼的字節(jié)長(zhǎng)度：

const str = "本文原文地址: xxoo521.com";

console.log(Buffer.byteLength(str, "utf8")); // output: 31
console.log(str.length); // output: 19

也可以直接訪問(wèn) Buffer 實(shí)例的 length 屬性（不推薦）：

console.log(Buffer.from(str, "utf8").length); // output: 31

如何轉(zhuǎn)換字符編碼

Nodejs 當(dāng)前支持的編碼格式有：ascii、utf8、utf16le、ucs2、base64、latin1、binary、hex。其他編碼需要借助三方庫(kù)來(lái)完成。

下面，是用Buffer.from()和buf.toString()來(lái)封裝的 nodejs 平臺(tái)的編碼轉(zhuǎn)換函數(shù)：

function trans(str, from = "utf8", to = "utf8") {
  const buf = Buffer.from(str, from);
  return buf.toString(to);
}

// output: 5Y6f5paH5Zyw5Z2AOiB4eG9vNTIxLmNvbQ==
console.log(trans("原文地址: xxoo521.com", "utf8", "base64"));

共享內(nèi)存與拷貝內(nèi)存

在生成 Buffer 實(shí)例，操作二進(jìn)制數(shù)據(jù)的時(shí)候，千萬(wàn)要注意接口是基于共享內(nèi)存，還是基于拷貝底層內(nèi)存。

例如對(duì)于生成 Buffer 實(shí)例的from()，不同類型的參數(shù)，nodejs 底層的行為是不同的。

為了更形象地解釋，請(qǐng)看下面兩段代碼。

代碼 1：

const buf1 = Buffer.from("buffer");
const buf2 = Buffer.from(buf1); // 拷貝參數(shù)中buffer的數(shù)據(jù)到新的實(shí)例
buf1[0]++;

console.log(buf1.toString()); // output: cuffer
console.log(buf2.toString()); // output: buffer

代碼 2：

const arr = new Uint8Array(1);
arr[0] = 97;

const buf1 = Buffer.from(arr.buffer);
console.log(buf1.toString()); // output: a

arr[0] = 98;
console.log(buf1.toString()); // output: b

在第二段代碼中，傳入Buffer.from的參數(shù)類型是arrayBuffer。因此Buffer.from僅僅是創(chuàng)建視圖，而不是拷貝底層內(nèi)存。buf1 和 arr 的內(nèi)存是共享的。

在操作 Buffer 的過(guò)程中，需要特別注意共享和拷貝的區(qū)別，發(fā)生錯(cuò)誤比較難排查。

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章: