Nodejs 中的 Buffer 類的創(chuàng)建與基本使用
前言
JavaScript 對于字符串(string)的操作十分友好,無論是寬字節(jié)字符串還是單字節(jié)字符串,都被認為是一個字符串。
console.log("你好,世界!".length); // 6 console.log("hello,world!".length); // 12 console.log("\u00cc".length); // 1
作為對比,Rust 中的字符串則相對難以理解:
let str = String::from("你好,世界!"); println!("{}", str.len()); // 18
這是因為 Rust 中的 String 類型本身就是基于數(shù)組 vec
進行的封裝,數(shù)組每個元素都是一個 u8
類型的元素,而 JavaScript 的 String 類型的抽象程度要更為高。這符合這兩種語言的應用面(一個作為系統(tǒng)編程語言,一個為腳本語言)。
而這種高抽象層次,在 Nodejs 拓展了 JavaScript 的應用面之后,就顯得有些力不從心了。在 Nodejs 中,應用需要處理網(wǎng)絡協(xié)議、操作數(shù)據(jù)庫、處理圖片、接收上傳文件等,在網(wǎng)絡流和文件的操作中,還要處理大量二進制數(shù)據(jù)。 JavaScript 原有的字符串遠遠不能滿足這些需求,于是 Buffer
應運而生。
Buffer 結(jié)構(gòu)
Buffer 是一個像 Array 的對象,但它主要用于操作字節(jié)。
底層實現(xiàn)
Buffer 是一個 JavaScript 與 C++ 結(jié)合的模塊,它將性能相關部分用 C++ 實現(xiàn),將非性能相關的部分用 JavaScript 實現(xiàn):
?? Buffer所占用的內(nèi)存不是通過V8分配的,屬于堆外內(nèi)存,這涉及V8內(nèi)存分配和垃圾回收機制。
?? Node 在進程啟動時就加載了 Buffer 類,并將其放在全局對象(global)上。你無需通過 require 導入。
Buffer 對象
Buffer 對象類似于 Rust 中的 String 類型,它的元素為無符號8位二進制數(shù),即0到255的數(shù)值:
console.log(new Buffer.from("hello,world!", "utf-8")); // <Buffer 68 65 6c 6c 6f 2c 77 6f 72 6c 64 21>
?? 在 UTF-8 中,漢字一般占用 3 個元素,字母和半角標點符號占用 1 個元素。
類似于字符串,你也可以使用 length
查看 Buffer 的長度:
console.log(new Buffer.from("你好,世界!", "utf-8").length); // 14
你可以使用 alloc()
或 allocUnsafe()
創(chuàng)建一個指定長度的 Buffer 對象:
const buf = new Buffer.alloc(100); const buf = new Buffer.allocUnsafe(100); // 創(chuàng)建一個長為100的Buffer
如果賦超過0~255的值,則會發(fā)生數(shù)值溢出:
const buf = new Buffer.alloc(100); buf[20] = -100; buf[30] = 266; buf[40] = 3.1415; console.log(buf[20], buf[30], buf[40]); // 156 10 3
具體原理涉及計算機存儲數(shù)值的方法,簡單來說:
- 給元素的賦值如果小于0,就將該值逐次加256,直到得到一個0到255之間的整數(shù)。
- 如果得到的數(shù)值大于255,就逐次減256,直到得到0~255區(qū)間內(nèi)的數(shù)值。
- 如果是小數(shù),舍棄小數(shù)部分,只保留整數(shù)部分。
?? 上面提到的 Buffer 對象都是 JavaScript 層面的,能夠被 V8 的垃圾回收標記回收。但是其內(nèi)部的parent 指針指向的 SlowBuffer 對象卻來自于 Nodejs 自身 C++ 中的定義,是 C++ 層面上的 Buffer 對象,所用內(nèi)存不在 V8 的堆中,屬于堆外內(nèi)存。
Buffer 轉(zhuǎn)換
Buffer對象可以與字符串之間相互轉(zhuǎn)換。目前支持包括 ASCII
、utf-8
、base64
、Binary
等多種字符串編碼類型。
字符串轉(zhuǎn)Buffer
通過構(gòu)造函數(shù):
new Buffer.from(str, [encoding]);
一個Buffer對象內(nèi)部可以存儲不同編碼類型的字符串轉(zhuǎn)碼的值,調(diào)用write()方法可以實現(xiàn)該目的:
write(string, [offset], [length], [encoding]);
Buffer轉(zhuǎn)字符串
Buffer對象的toString()可以將Buffer對象轉(zhuǎn)換為字符串:
toString([encoding], [startIndex], [endIndex])
可以設置encoding(默認為UTF-8)、start、end這3個參數(shù)實現(xiàn)整體或局部的轉(zhuǎn)換。如果Buffer對象由多種編碼寫入,就需要在局部指定不同的編碼,才能轉(zhuǎn)換回正常的編碼。
?? Nodejs 內(nèi)置的 Buffer 支持的字符串編碼有限,如果想要實現(xiàn)與 GBK、GB2312 的轉(zhuǎn)換,請在社區(qū)尋找對應包。
總結(jié)
講完了 Nodejs 中的 Buffer 類的創(chuàng)建與基本使用,接下來我們將介紹 Buffer 的應用。Buffer在文件I/O和網(wǎng)絡I/O中運用廣泛,尤其在網(wǎng)絡傳輸中,更多關于Nodejs Buffer類創(chuàng)建使用的資料請關注腳本之家其它相關文章!
相關文章
Nodejs 和Session 原理及實戰(zhàn)技巧小結(jié)
這篇文章主要介紹了Nodejs 和Session 原理及實戰(zhàn)技巧小結(jié),需要的朋友可以參考下2017-08-08使用Node.js的readline模塊逐行讀取并解析大文件
在Node.js環(huán)境中處理大文件是一個常見的需求,尤其是在處理日志文件、數(shù)據(jù)庫導出、或任何形式的大規(guī)模文本數(shù)據(jù)時,本文將深入探討如何使用Node.js的readline模塊來實現(xiàn)這一功能,并討論相關的性能優(yōu)化和注意事項,需要的朋友可以參考下2024-09-09node.js中 cluster 模塊和 worker_threads 模塊示例
這篇文章主要介紹了node.js中 cluster 模塊和 worker_threads 模塊,本文通過示例代碼給大家介紹的非常詳細,需要的朋友可以參考下2024-05-05Node.js使用Express創(chuàng)建Web項目詳細教程
如果需要入門使用node.js進行web開發(fā),正在學習 nodejs web開發(fā)指南 的和想快速了解node.js web開發(fā)模式的朋友,相信本文是有一定幫助意義的。2017-03-03