快捷導(dǎo)航

如何使用Node寫靜態(tài)文件服務(wù)器

更新時間：2022年09月19日 08:41:38 作者：進(jìn)擊的大蔥

這篇文章主要介紹了如何使用Node寫靜態(tài)文件服務(wù)器，文章圍繞主題展開詳細(xì)的內(nèi)容介紹，具有一定的參考價值，感興趣的小伙伴可以參考一下

背景

作為前端工程師，我想大家一定對靜態(tài)文件服務(wù)器不會陌生。所謂的靜態(tài)文件服務(wù)器做的工作就是將我們的前端靜態(tài)文件(.js/.css/.html)傳輸給瀏覽器，然后瀏覽器再將我們的頁面渲染出來。我們常用的webpack-dev-server就是本地開發(fā)用的靜態(tài)文件服務(wù)器，而一般線上環(huán)境我們會使用nginx，因為它更加穩(wěn)定和高效。既然靜態(tài)文件服務(wù)器無處不在，那么它們又是如何實現(xiàn)的呢？本篇文章將帶你手把手實現(xiàn)一個高效的靜態(tài)文件服務(wù)器。

功能介紹

我們的靜態(tài)服務(wù)器包括下面兩個功能:

當(dāng)用戶請求的內(nèi)容是文件夾時，展示當(dāng)前文件夾的結(jié)構(gòu)信息
當(dāng)用戶請求的內(nèi)容是文件時，返回文件的內(nèi)容

我們來看一下實際效果，服務(wù)端的靜態(tài)文件目錄是這樣的:

static
└── index.html

訪問localhost:8080可以獲取根目錄的信息:

請求根文件夾

在根目錄下只有一個index.html文件。我們點擊index.html文件可以獲取這個文件的具體內(nèi)容:

index.html

代碼實現(xiàn)

根據(jù)上面的需求描述，我們先用流程圖來設(shè)計一下我們的邏輯如何實現(xiàn):

邏輯設(shè)計流程圖

其實靜態(tài)文件服務(wù)器的實現(xiàn)思路還是很簡單的：先判斷資源存不存在，不存在就直接報錯，資源存在的話根據(jù)資源的類型返回對應(yīng)的結(jié)果給客戶端就可以了。

基礎(chǔ)代碼實現(xiàn)

看完上面的流程圖，我相信大家的思路基本清晰了，接著我們看一下具體的代碼實現(xiàn):

const http = require('http')
const url = require('url')
const fs = require('fs')
const path = require('path')
const process = require('process')

// 獲取服務(wù)端的工作目錄，也就是代碼運(yùn)行的目錄
const ROOT_DIR = process.cwd()

const server = http.createServer(async (req, resp) => {
  const parsedUrl = url.parse(req.url)
  // 刪除開頭的'/'來獲取資源的相對路徑，e.g: `/static`變?yōu)閌static`
  const parsedPathname = parsedUrl.pathname.slice(1)
  // 獲取資源在服務(wù)端的絕對路徑
  const pathname = path.resolve(ROOT_DIR, parsedPathname)

  try {
    // 讀取資源的信息, fs.Stats對象
    const stat = await fs.promises.stat(pathname)

    if (stat.isFile()) {
      // 如果請求的資源是文件就交給sendFile函數(shù)處理
      sendFile(resp, pathname)
    } else {
      // 如果請求的資源是文件夾就交給sendDirectory函數(shù)處理
      sendDirectory(resp, pathname)
    }
  } catch (error) {
    // 訪問的資源不存在
    if (error.code === 'ENOENT') {
      resp.statusCode = 404
      resp.end('file/directory does not exist')
    } else {
      resp.statusCode = 500
      resp.end('something wrong with the server')
    }
  }
})

server.listen(8080, () => {
  console.log('server is up and running')
})

在上面的代碼中我使用http模塊創(chuàng)建了一個server實例，這個實例里面定義了處理所有HTTP請求的handler函數(shù)。handler函數(shù)實現(xiàn)比較簡單，讀者根據(jù)上面的代碼注釋就可以看明白了，這里想要說明一下我為什么使用fs.promises.stat來獲取資源的元信息(fs.Stats類，包括資源的類型和更改時間等)而不使用可以實現(xiàn)同一個功能的fs.stat和fs.statSync:

fs.promises.stat vs fs.stat: fs.promises.stat是promise-style的，可以使用async和await來實現(xiàn)異步的邏輯，代碼很干凈。而fs.stat是callback-style的，這種API寫異步邏輯最后可能會變成意大利面條，后期維護(hù)困難。
fs.promises.stat vs fs.statSync: fs.promises.stat讀取文件的信息是一個異步操作，不會阻塞主線程的執(zhí)行。而fs.statSync是同步的，這也就意味著當(dāng)這個API執(zhí)行的時候，JS主線程會卡死，其它的資源請求是處理不了的。這里我也建議當(dāng)大家需要在服務(wù)端進(jìn)行文件系統(tǒng)的讀寫的時候，一定要優(yōu)先使用異步API而避免使用同步式的API。

接著我們來看一下sendFile和sendDirectory這兩個函數(shù)的具體實現(xiàn):

const sendFile = async (resp, pathname) => {
  // 使用promise-style的readFile API異步讀取文件的數(shù)據(jù)，然后返回給客戶端
  const data = await fs.promises.readFile(pathname)
  resp.end(data)
}
const sendDirectory = async (resp, pathname) => {
  // 使用promise-style的readdir API異步讀取文件夾的目錄信息，然后返回給客戶端
  const fileList = await fs.promises.readdir(pathname, { withFileTypes: true })
  // 這里保存一下子資源相對于根目錄的相對路徑，用于后面客戶端繼續(xù)訪問子資源
  const relativePath = path.relative(ROOT_DIR, pathname)

  // 構(gòu)造返回的html結(jié)構(gòu)體
  let content = '<ul>'
  fileList.forEach(file => {
    content += `
    <li>
      <a href=${
        relativePath
      }/${file.name}>${file.name}${file.isDirectory() ? '/' : ''}
      </a>
    </li>` 
  })

  content += '</ul>'
  // 返回當(dāng)前的目錄結(jié)構(gòu)給客戶端
  resp.end(`<h1>Content of ${relativePath || 'root directory'}:</h1>${content}`)
}

sendDirectory通過fs.promises.readdir來獲取其底下的目錄信息，然后以列表的形式返回一個html結(jié)構(gòu)給客戶端。這里值得一提的是：由于客戶端需要按照返回的子資源信息進(jìn)一步訪問子資源，所以我們需要記錄子資源相對于根目錄的相對路徑。sendFile函數(shù)的實現(xiàn)相對于sendDirectory會簡單一點，它只需要讀取文件的內(nèi)容然后返回給客戶端就可以了。

上面的代碼寫完后，我們其實已經(jīng)實現(xiàn)了上面說的需求了，可是這個服務(wù)端是生產(chǎn)不可用的，因為它有很多潛在的問題沒有解決，接著就讓我們看一下如何解決這些問題來優(yōu)化我們的服務(wù)端代碼。

大文件優(yōu)化

我們先來看看在現(xiàn)在的實現(xiàn)下，客戶端請求一個大文件會發(fā)生什么。首先我們在static文件夾下準(zhǔn)備一個大文件test.txt，這個文件里面有1000萬行Hello World!，文件的大小為124M:

124M文件

然后我們啟動服務(wù)器，查看服務(wù)器啟動完成后Node的內(nèi)存占用情況:

Node內(nèi)存使用狀況

可以看到Node服務(wù)只占用了8.5M的內(nèi)存，我們在瀏覽器訪問一下test.txt:

瀏覽器訪問test.tx

瀏覽器在瘋狂輸出Hello World!，這個時候再看一眼Node的內(nèi)存占用情況:

內(nèi)存激增

內(nèi)存使用一下子由8.5M激增到了132.9M，而增加的資源差不多就是文件的大小124M，這到底是為什么呢？我們再來看一下sendFile文件的實現(xiàn):

const sendFile = async (resp, pathname) => {
  // readFile會讀取文件的數(shù)據(jù)然后存在data變量里面
  const data = await fs.promises.readFile(pathname)
  resp.end(data)
}

上面的代碼中，其實我們會一次性讀取文件的內(nèi)容然后保存在data變量里面，也就是說我們會將124M的文本信息保存在內(nèi)存里面！你試想一下，如果有多個用戶同時訪問大資源，我們的程序肯定會因為內(nèi)存爆炸而OOM(Out of Memory)的。那么這個問題如何解決呢？其實node提供的stream模塊可以很好地解決我們的問題。

Stream

我們先來看一下stream的官方介紹:

A stream is an abstract interface for working with streaming data in Node.js. There are many stream objects provided by Node.js. For instance, a request to an HTTP server and process.stdoutare both stream instances.Streams can be readable, writable, or both. All streams are instances of EventEmitter

簡單來說，stream就是給我們流式處理數(shù)據(jù)用的，那么什么是流式處理呢？用最簡單的話來說就是：不是一下子處理完數(shù)據(jù)而是一點一點地處理它們。使用stream，我們要處理的數(shù)據(jù)就會一點一點地加載到內(nèi)存的某一個固定大小的區(qū)域(buffer)以給其它消費者消費。由于保存數(shù)據(jù)的buffer大小一般是固定的，當(dāng)舊的數(shù)據(jù)處理完才會加載新的數(shù)據(jù)，因此它可以避免內(nèi)存的崩潰。話不多說，我們馬上使用stream來重構(gòu)一下上面的sendFile函數(shù):

const sendFile = async (resp, pathname) => {
  // 為需要讀取的文件創(chuàng)建一個可讀流readableStream
  const fileStream = fs.createReadStream(pathname)
  fileStream.pipe(resp)
}

上面的代碼中，我們?yōu)樾枰x取的文件創(chuàng)建了一個可讀流(ReadableStream)，然后將這個流和resp對象連接(pipe)在一起，這樣文件的數(shù)據(jù)就會源源不斷發(fā)送給客戶端了?？吹竭@里你可能會問，為什么resp對象可以和fileStream連接在一起呢？原因就是這個resp對象底層是一個可寫流(WritableStream)，而可讀流的pipe函數(shù)接收的就是可寫流。優(yōu)化完后我們再來請求一下test.txt大文件，同樣瀏覽器一頓瘋狂輸出，不過這個時候Node服務(wù)的內(nèi)存用量是這樣的:

Stream優(yōu)化后的內(nèi)存使用

Node的內(nèi)存基本穩(wěn)定在9.0M，比服務(wù)剛啟動時只多了0.5M！從這個可以看出我們通過stream來優(yōu)化確實達(dá)到了很好的效果。由于文章篇幅的限制，這里沒有詳細(xì)介紹stream的API如何使用，需要了解的同學(xué)可以自行查看官方文檔。

減少文件傳輸帶寬

使用stream的確可以減少服務(wù)端的內(nèi)存占用問題，可是它沒有減少服務(wù)端和客戶端傳輸?shù)臄?shù)據(jù)大小。換句話來說，假如我們的文件大小是2M我們就實打?qū)崅鬏斶@2M的數(shù)據(jù)給客戶端。如果客戶端是手機(jī)或者其它移動設(shè)備的話，這么大的帶寬消耗肯定是不可取的。這個時候我們需要對被傳輸?shù)臄?shù)據(jù)進(jìn)行壓縮然后再在客戶端進(jìn)行解壓，這樣傳輸?shù)臄?shù)據(jù)量才能大幅度減少。服務(wù)端數(shù)據(jù)壓縮的算法有很多，這里我使用了一個比較常用的gzip算法，我們來看一下如何更改sendFile以支持?jǐn)?shù)據(jù)壓縮:

// 引入zlib包
const zlib = require('zlib')

const sendFile = async (resp, pathname) => {
  // 通過header告訴客戶端：服務(wù)端使用的是gzip壓縮算法
  resp.setHeader('Content-Encoding', 'gzip')
  // 創(chuàng)建一個可讀流
  const fileStream = fs.createReadStream(pathname)
  // 文件流首先通過zip處理再發(fā)送給resp對象
  fileStream.pipe(zlib.createGzip()).pipe(resp)
}

在上面的代碼中，我使用Node原生的zlib模塊創(chuàng)建了一個轉(zhuǎn)換流(Transform Stream)，這種流是既可讀又可寫的(Readable and Writable Stream)，所以它像是一個轉(zhuǎn)換器將輸入的數(shù)據(jù)進(jìn)行加工然后輸出到下游的可寫流。我們請求index.html文件來看一下優(yōu)化后的效果:

zlib壓縮效果

上圖中，第一行的請求是沒有經(jīng)過gzip壓縮的請求大小，大概是2.6kB，而經(jīng)過gzip壓縮后傳輸數(shù)據(jù)一下子變成373B，優(yōu)化效果十分顯著！

使用瀏覽器緩存

數(shù)據(jù)壓縮雖然解決了服務(wù)端客戶端傳輸數(shù)據(jù)的帶寬問題，可是沒有解決重復(fù)數(shù)據(jù)傳輸?shù)膯栴}。我們知道一般來說服務(wù)器的靜態(tài)文件是很少會改變的，在服務(wù)端資源沒有發(fā)生改變的前提下，同一個客戶端多次訪問同一個資源，服務(wù)端會傳輸一樣的數(shù)據(jù)，而這種情況下更有效的方式是：服務(wù)器告訴客戶端資源沒有變化，你直接使用緩存就可以了。瀏覽器緩存的方式有很多種，有協(xié)商緩存和強(qiáng)緩存。關(guān)于這兩種緩存的區(qū)別我想網(wǎng)絡(luò)上已經(jīng)有很多文章說得很清晰了，我在這里也不再多說，本篇文章主要想說一下強(qiáng)緩存的Etag機(jī)制如何實現(xiàn)。

什么是Etag

其實Etag(Entity-Tag)可以理解為文件內(nèi)容的指紋，如果文件內(nèi)容發(fā)生了改變那么這個指紋是大概率是會變的。這里注意的是我用了大概率而不是絕對，這是因為HTTP1.1協(xié)議里面并沒有規(guī)定etag具體生成算法是什么，這完全是由開發(fā)者自己決定的。通常對于文件來說，etag是由文件的長度 + 更改時間生成的，這種做法其實是會存在瀏覽器讀取不到最新文件內(nèi)容的情況的，不過這不是本文的重點，有興趣的同學(xué)可以參考網(wǎng)上的其它資料。

接著讓我們圖解一下基于etag的協(xié)商緩存過程:

Etag交互過程

具體的過程如下:

瀏覽器第一次請求服務(wù)端的資源時，服務(wù)端會在Response里面設(shè)置當(dāng)前資源的etag信息，例如Etag: 5d-1834e3b6ea2
瀏覽器第二次請求服務(wù)端資源時，會在請求頭部的If-None-Match字段帶上最新的etag信息5d-1834e3b6ea2。服務(wù)端收到請求解析出If-None-Match字段并將其和最新的服務(wù)端etag進(jìn)行對比，如果是一樣的就會返回304給瀏覽器表示資源無更新，如果資源發(fā)生了更改則將最新的etag設(shè)置到頭部并且將最新的資源返回給瀏覽器。

接著我們來看一下sendFile函數(shù)如何支持etag:

// 這個函數(shù)會根據(jù)文件的fs.Stats信息計算出etag
const calculateEtag = (stat) => {
  // 文件的大小
  const fileLength = stat.size
  // 文件的最后更改時間
  const fileLastModifiedTime = stat.mtime.getTime()
  // 數(shù)字都用16進(jìn)制表示
  return `${fileLength.toString(16)}-${fileLastModifiedTime.toString(16)}`
}

const sendFile = async (req, resp, stat, pathname) => {
  // 文件的最新etag
  const latestEtag = calculateEtag(stat)
  // 客戶端的etag
  const clientEtag = req.headers['if-none-match']
  
  // 客戶端可以使用緩存
  if (latestEtag == clientEtag) {
    resp.statusCode = 304
    resp.end()
    return
  }
  resp.statusCode = 200
  resp.setHeader('etag', latestEtag)
  resp.setHeader('Content-Encoding', 'gzip')
  const fileStream = fs.createReadStream(pathname)
  fileStream.pipe(zlib.createGzip()).pipe(resp)
 }

在上面的代碼中我新增了一個計算etag的函數(shù)calculateEtag，這個函數(shù)會根據(jù)文件的大小和最后更改時間算出文件最新的etag信息。接著我還修改了sendFile的函數(shù)簽名，接收了req(HTTP請求體)和stat(文件的信息，fs.Stats類)兩個新參數(shù)。sendFile會先判斷客戶端的etag和服務(wù)端的etag是不是一樣的，如果相同就返回304給客戶端否則返回文件的最新內(nèi)容并且在header設(shè)置最新的etag信息。同樣我們再次訪問index.html文件來驗證優(yōu)化效果:

etag優(yōu)化效果

上圖可以看到第一次請求資源時瀏覽器沒有緩存，服務(wù)端返回了文件的最新內(nèi)容和200狀態(tài)碼，這個請求的實際帶寬是396B，第二次請求時，由于瀏覽器有緩存并且服務(wù)端資源沒有更新，所以服務(wù)端返回304狀態(tài)碼而沒有返回實際的文件內(nèi)容，這個時候的文件實際帶寬是113B！可以看出優(yōu)化效果是很明顯的，我們稍微更改一下index.html的內(nèi)容來驗證一下客戶端會不會拉到最新的數(shù)據(jù):

客戶端獲取最新內(nèi)容

從上圖可以看出當(dāng)index.html更新后，舊的etag失效，瀏覽器可以獲取最新的數(shù)據(jù)。我們最后再來看一下這三個請求的詳細(xì)信息，下面是第一次請求時，服務(wù)端給瀏覽器返回etag信息:

服務(wù)端設(shè)置etag

接著是第二次請求時，客戶端請求服務(wù)端資源時帶上etag信息:

第二次請求

第三次請求，etag失效，拿到新的數(shù)據(jù):

etag失效

值得一提的是，這里我們只通過etag實現(xiàn)了瀏覽器的緩存，這是不完備的，實際的靜態(tài)服務(wù)器可能會加上基于Expires/Cache-Control的強(qiáng)緩存和基于Last-Modified/Last-Modified-Since的協(xié)商緩存來優(yōu)化。

總結(jié)

本篇文章我先實現(xiàn)了一個最簡單能用的靜態(tài)文件服務(wù)器，然后通過解決三個實際使用時會遇到的問題優(yōu)化了我們的代碼，最后完成了一個簡單高效的靜態(tài)文件服務(wù)器。

如上文所說，由于篇幅的限制，我們的實現(xiàn)上還是漏了很多東西的，例如MIME類型的設(shè)置，支持更多的壓縮算法如deflate以及支持更多的緩存方式如Last-Modified/Last-Modified-Since等。這些內(nèi)容其實在掌握了上面的方法后很容易就可以實現(xiàn)了，所以就留給大家在需要真正用到的時候自己實現(xiàn)了。

到此這篇關(guān)于如何使用Node寫靜態(tài)文件服務(wù)器的文章就介紹到這了,更多相關(guān)Node靜態(tài)文件服務(wù)器內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: