欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

讓chatgpt將html中的圖片轉(zhuǎn)為base64方法示例

 更新時(shí)間:2023年02月23日 16:49:15   作者:暴走老七  
這篇文章主要為大家介紹了讓chatgpt將html中的圖片轉(zhuǎn)為base64方法示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪

前言

故事要從我們公司的新官網(wǎng)說(shuō)起,新官網(wǎng)是叫外包做的,前后端沒(méi)有分離,對(duì),你沒(méi)聽(tīng)錯(cuò),都到了 2023 年的今天,新項(xiàng)目依然是前后端混在一起,堆成一座屎山,然后通過(guò)模板渲染展示網(wǎng)頁(yè)。

當(dāng)然,對(duì)于非研發(fā)的,技術(shù)棧咋樣都不重要,又不是不能用~

各位看官,聽(tīng)到上面的情況,是不是隱隱約約感覺(jué)到會(huì)有啥驚喜(驚嚇)

哈,你來(lái)翻譯翻譯,什么叫驚喜?好,那我來(lái)翻譯翻譯,驚喜(bushi)就是自從新官網(wǎng)上線(xiàn)后,PV(頁(yè)面訪問(wèn)量)下降了 50%。是的,你沒(méi)看錯(cuò),原因就是打開(kāi)官網(wǎng)巨卡,一般需要 7~8s。

就單單請(qǐng)求個(gè) html,就需要耗費(fèi) 7s+的時(shí)間。

運(yùn)營(yíng)那邊被老板親切問(wèn)候后,就跑過(guò)來(lái)找我們研發(fā)幫忙看問(wèn)題,把情況說(shuō)的特嚴(yán)重,唉,最終還不是得我們幫忙處理爛攤子

那沒(méi)辦法,我們就開(kāi)始分析一通,啪的一下,很快呀,就找到了加載賊慢的原因:

  • 剛才所說(shuō)的服務(wù)端響應(yīng)慢,那這個(gè)交給后端去搞就好(這個(gè)是重中之重)
  • 官網(wǎng)的圖片請(qǐng)求是在是太多了,而我們知道 http 請(qǐng)求是有次數(shù)限制的(http1.1),太多的話(huà)其他只能處于阻塞狀態(tài)

那第二點(diǎn)自然是需要前端去搞了,圖片太多,導(dǎo)致 http 請(qǐng)求太多,那好辦,把小圖片轉(zhuǎn) base64 不就好。 嗯,思路很簡(jiǎn)單,如果是前后端分離的項(xiàng)目,我們一般無(wú)腦配置 webpack url-loader 的體積限制就好,或者配置 webpack5 的 asset,即在導(dǎo)出一個(gè) data URI 和發(fā)送一個(gè)單獨(dú)的文件之間自動(dòng)選擇:

rules: [
    {
      test: /\.(png|jpe?g|svg|gif)$/,
      //webpack4 start
      use: [
        {
          loader: 'url-loader',
          options: { limit: 10 * 1024 },
        },
      ],
      //webpack4 end
      // webapack5 start
      type:'asset/inline',
      parser: {
        dataUrlCondition: {
          maxSize: 10 * 1024, // 小于10k則轉(zhuǎn)為base64
        },
      },
      // webapack5 end
    },
  ],

很簡(jiǎn)單對(duì)吧,但當(dāng)你想快速 cv 以上配置的時(shí)候,發(fā)現(xiàn),前端代碼都是混在后端代碼里面,一堆 html 文件,html 里面又混雜著一堆的 Thymeleaf 語(yǔ)法(Thymeleaf 是一個(gè)跟 Velocity、FreeMarker 類(lèi)似的模板引擎,它可以完全替代 JSP,JSP??都啥年代了)

越看越不對(duì)勁,正所謂理想很豐滿(mǎn),現(xiàn)實(shí)很骨感,唉,只能長(zhǎng)嘆一聲。

但沒(méi)辦法,領(lǐng)導(dǎo)可不管用啥方式,只要有個(gè)方法把 html 里面圖片小于某個(gè)指定值,如 10k,那就轉(zhuǎn) base64,讓這些小圖片不走 http 請(qǐng)求。

思路

那么,正常的路走不通(當(dāng)然也有可能有其他更快捷的方式,只是比較趕,暫時(shí)想不到更好、更簡(jiǎn)單的方式實(shí)現(xiàn)),那就另辟蹊徑。

全體流程如下:

1. mvn clean // marven 清空輸出目錄

2. mvn compile // marven編譯

3. 將所有 html 的的小圖片都轉(zhuǎn) base64

4. mvn package // marven 打包

以上主要重點(diǎn)關(guān)注第3點(diǎn),既然要將所有 html 的的小圖片都轉(zhuǎn) base64,那么自然而然可以通過(guò)寫(xiě)個(gè) node 腳本來(lái)實(shí)現(xiàn),大概可以分為以下幾個(gè)步驟:

  • 遞歸讀取指定目錄下的所有 html 文件路徑 htmlPaths,這里我們假設(shè)所有 html 都放在 backend/templates 里面
  • 遍歷每個(gè)路徑,讀取對(duì)應(yīng)的 html,然后通過(guò)正則匹配到每個(gè) html 里面的所有 img 對(duì)應(yīng)的 src,存放到 imgSrcs 里面
  • 遍歷每個(gè) img 的 src,讀取 imageBuffer,并轉(zhuǎn)為 base64
  • 再將得到的 base64 替換原先的 src
  • 最后將新的 html 替換舊的 html

上面的步驟應(yīng)該比較清晰的,不過(guò),等一下,最近 chatgpt 不是很火嗎,讓它來(lái)寫(xiě)不就好~

實(shí)現(xiàn)過(guò)程

遞歸讀取指定目錄下的所有 html 文件路徑 htmlPaths

首先判斷入口目錄的下的內(nèi)容,是文件的話(huà)就判斷是否以.html 結(jié)尾,是的話(huà)則放入 htmlFilePaths,是目錄的話(huà)則遞歸遍歷,那我們來(lái)問(wèn)神奇的 chatgpt:

嗯,很不錯(cuò),第一次幾乎完美,順利拿到所有的 html 路徑

獲取每個(gè) html 里面的圖片 src

自然而然想到用正則匹配來(lái)做,所以我馬上問(wèn):

一看結(jié)果就不是我想要的,當(dāng)然也是我描述的不清晰,導(dǎo)致 chatgpt 以為要獲取 html 文檔的圖片 src

獲取 html 字符串的所有圖片 src

應(yīng)該問(wèn)要獲取 html 字符串的,所以我接著問(wèn):

// 定義匹配圖片標(biāo)簽的正則表達(dá)式
var imgRegex = /<img\s+[^>]*src=["']([^"']*)["'][^>]*>/gi;
// 要解析的HTML字符串
var htmlString = '<img src="image1.jpg"> <img src="image2.jpg">';
// 遍歷所有匹配到的圖片標(biāo)簽并獲取其src屬性
var matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
  var src = matches[1];
  console.log(src);
}

運(yùn)行后,得到的結(jié)果:

不錯(cuò)不錯(cuò),再接再厲。

忽略注釋的代碼

但 html 代碼可能 img 被注釋了,如 <!-- <img src='xxx.jpg'> -->,那么我們實(shí)際上沒(méi)必要去轉(zhuǎn)換,故我們讓個(gè)讓其忽略注釋的:

那我們來(lái)試試,將其中注釋代碼中插入 img,看看是否會(huì)解析:

// 定義匹配圖片標(biāo)簽的正則表達(dá)式
var imgRegex = /<img\s+[^>]*src=["']([^"']*)["'][^>]*>/gi;
// 定義匹配注釋的正則表達(dá)式
var commentRegex = /<!--[\s\S]*?-->/g;
// 要解析的HTML字符串
var htmlString = '<!-- <img src="image3.jpg"> --> <img src="image1.jpg"> <img src="image2.jpg">';
// 刪除所有注釋
htmlString = htmlString.replace(commentRegex, '');
// 遍歷所有匹配到的圖片標(biāo)簽并獲取其src屬性
var matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
  var src = matches[1];
  console.log(src);
}

可以看到被注釋掉的 image3 不會(huì)被匹配到

本身是 base64,則忽略

繼續(xù)繼續(xù),但圖片 src 可能一開(kāi)始就是 base64 了,就沒(méi)必要轉(zhuǎn)了,而 base64 是 data:image 開(kāi)頭的,所以我們?cè)僮屗酉聴l件:

// 定義匹配圖片標(biāo)簽的正則表達(dá)式
var imgRegex = /<img\s+[^>]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi;
// 要解析的HTML字符串
var htmlString = '<img src="image1.jpg"> <img src="..."> <img src="image2.jpg"><!-- <img src="image3.jpg"> -->';
// 遍歷所有匹配到的不以 data:image 開(kāi)頭的圖片標(biāo)簽并獲取其src屬性
var matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
  var src = matches[1];
  console.log(src);
}

我們運(yùn)行看下結(jié)果

成功跳過(guò)了 base64 的,但是,好像沒(méi)有了忽略注釋代碼的條件,啊這。。

所以我就讓他忽略注釋和 base64 的,但好像一直丟三落四,按下葫蘆浮起瓢,大家可以看看

上面的注釋的被匹配到了

注釋又又又被匹配到了,算了,我直接問(wèn)如果忽略 base64,然后再組合忽略注釋的就好,組合后的代碼如下:

const imgRegex = /<img\s+[^>]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi;
// 定義匹配注釋的正則表達(dá)式
const commentRegex = /<!--[\s\S]*?-->/g
// 刪除所有注釋
var htmlString = '<img src="image1.jpg"> <img src="..."> <img src="image2.jpg"><!-- <img src="image3.jpg"> -->';
htmlString = htmlString.replace(commentRegex, '')
// 遍歷所有匹配到的圖片標(biāo)簽并獲取其src屬性
const imgSrcs = []
let matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
const src = matches[1];
imgSrcs.push(src)
}
console.log(imgSrcs)

忽略 Thymeleaf 語(yǔ)法

還有個(gè)問(wèn)題,img 的 src 可能是通過(guò)服務(wù)端渲染導(dǎo)入的,那么我們要忽略掉,大致語(yǔ)法為 <img th:src="${t.imgUrl1}" />,也就是以 th:開(kāi)頭的

// 定義匹配圖片標(biāo)簽的正則表達(dá)式
var imgRegex = /<img\s+[^>]*src=["']((?!data:image|@{)(?!\s*th:src)[^"']*)["'][^>]*>/gi;
// 要解析的HTML字符串
var htmlString = '<img src="image1.jpg"> <img src="@{some/url}"> <img src="..."> <img src="image2.jpg" th:src="@{some/other/url}">';
// 遍歷所有匹配到的不以 data:image、@{ 和包含 th:src 的圖片標(biāo)簽并獲取其src屬性
var matches;
while ((matches = imgRegex.exec(htmlString)) !== null) {
  var src = matches[1];
  console.log(src);
}

上面的@{可以忽略,實(shí)際上也是屬于 Thymeleaf 語(yǔ)法,屏蔽 th:src 即可

結(jié)合起來(lái),封裝成一個(gè)函數(shù)

function getImgSrcInHtml(htmlString) {
  /** 定義匹配圖片標(biāo)簽的正則表達(dá)式
   * 1.src中不以data:image開(kāi)頭,即不以base64開(kāi)頭,沒(méi)必要再轉(zhuǎn)化了
   * 2.不是th:src
   * 3.忽略注釋的代碼
   * */
  const imgRegex = /<img\s+[^>th:]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi;
  // 定義匹配注釋的正則表達(dá)式
  const commentRegex = /<!--[\s\S]*?-->/g
  // 刪除所有注釋
  htmlString = htmlString.replace(commentRegex, '')
  // 遍歷所有匹配到的圖片標(biāo)簽并獲取其src屬性
  const imgSrcs = []
  let matches;
  while ((matches = imgRegex.exec(htmlString)) !== null) {
    const src = matches[1];
    imgSrcs.push(src)
  }
  return imgSrcs.filter(Boolean)
}

運(yùn)行下,看下結(jié)果:

src 轉(zhuǎn) base64

自此,我們拿到所有 html 里面的 src 了,那么判斷下是否小于指定 size,是的話(huà)轉(zhuǎn) base64

獲取文件大小可通過(guò) fs 的 statSync 來(lái)拿到對(duì)應(yīng)文件的 size,如下

/** 獲取文件大小 */
function getFileSize(filePath) {
  const stat = fs.statSync(filePath)
  return stat.size
}

如果滿(mǎn)足條件則將圖片轉(zhuǎn) base64,而圖片本身是 Buffer,所以要轉(zhuǎn)一下:

/** 圖片轉(zhuǎn)成base64 */
function imageToBase64(filePath) {
  // 讀取圖片文件
  const imageBuffer = fs.readFileSync(filePath)
  const extname = getExtname(filePath)
  // 將圖片文件轉(zhuǎn)換為 base64 編碼字符串
  const base64String = Buffer.from(imageBuffer).toString('base64')
  return `data:image/${extname.slice(1)};base64,${base64String}`
}

通過(guò)加上前綴data:image/${extname.slice(1)};base64,,其中 extname 是文件后綴名,通過(guò)path.extname拿到:

/** 獲取后綴名 */
function getExtname(filePath) {
  return path.extname(filePath)
}

每得到一個(gè) base64,則替換原先的 src:

htmlString = htmlString.replace(src, imgBase64)

最后將新的 html 替換舊的 html

html 下滿(mǎn)足條件的 src 全部替換好后,就可以將新的 html 替換老的了,實(shí)際上也就是重寫(xiě)回去:

writeFile(htmlPath, htmlString)

性能優(yōu)化

但我們發(fā)現(xiàn)整個(gè)過(guò)程中有兩處可以?xún)?yōu)化代碼:

  • 如果 src 大于指定尺寸,那么下次遇到直接跳過(guò),不再獲取尺寸大小
  • 一個(gè)圖片可能被多處引用到,那么轉(zhuǎn) base64 后,下次遇到就沒(méi)必要再轉(zhuǎn)了,直接復(fù)用即可

針對(duì)第一點(diǎn),我們可以通過(guò)聲明一個(gè) Set,存放大于指定尺寸的 src:

for (const src of imgSrcs) {
      /** 之前已經(jīng)大于了,這次遇到就直接跳過(guò)即可 */
      if (imgOverSizeSet.has(src)) continue
      let absoluteSrc = src
      // 如果不是相對(duì)路徑,那么轉(zhuǎn)換為絕對(duì)路徑
      if (!src.startsWith('.')) absoluteSrc = path.join(STATIC_PATH, src)
      // 不存在或者超出限制,則不替換
      if (getFileSize(absoluteSrc) &gt;= FILE_LIMIE_SIZE) {
        imgNotExistOrOverSizeSet.add(src)
        continue
      }
}

針對(duì)第二點(diǎn),我們可以通過(guò)聲明一個(gè) Map,key 為 src,value 為 base64:

/** 存imgSrc -&gt; 圖片base64 */
const imgSrc2Base64Map = new Map()

每次判斷到對(duì)應(yīng)的 src 有值,則直接拿之前的 base64,不再轉(zhuǎn)化:

let imgBase64 = imgSrc2Base64Map.get(src)
if (!imgBase64) {
  imgBase64 = imageToBase64(absoluteSrc)
  imgSrc2Base64Map.set(src, imgBase64)
}

總的代碼

const fs = require('fs')
const path = require('path')
function resolve(relativePath) {
  return path.resolve(__dirname, relativePath)
}
/** 靜態(tài)資源路徑 */
const STATIC_PATH = resolve('xxx')
/** html模板路徑 */
const TEMPLATE_PATH = resolve('yyy')
/** 文件大小限制 10K */
const FILE_LIMIE_SIZE = 1024 * 10
/** 圖片轉(zhuǎn)成base64 */
function imageToBase64(filePath) {
  // 讀取圖片文件
  const imageBuffer = fs.readFileSync(filePath)
  const extname = getExtname(filePath)
  // 將圖片文件轉(zhuǎn)換為 base64 編碼字符串
  const base64String = Buffer.from(imageBuffer).toString('base64')
  return `data:image/${extname.slice(1)};base64,${base64String}`
}
/** 獲取文件大小 */
function getFileSize(filePath) {
  const stat = fs.statSync(filePath)
  return stat.size
}
/** 獲取后綴名 */
function getExtname(filePath) {
  return path.extname(filePath)
}
/** 獲取所有html路徑 */
function getHtmlPaths(dir, filePaths = []) {
  const files = fs.readdirSync(dir);
  for (const file of files) {
    const filePath = path.join(dir, file);
    const fileStat = fs.statSync(filePath);
    if (fileStat.isDirectory()) {
      getHtmlPaths(filePath, filePaths);
    } else if (fileStat.isFile() && getExtname(filePath) === '.html') {
      filePaths.push(filePath);
    }
  }
  return filePaths;
}
function readFile(filePath) {
  return fs.readFileSync(filePath, 'utf-8')
}
function writeFile(filePath, source) {
  return fs.writeFileSync(filePath, source)
}
/** 獲取html中滿(mǎn)足規(guī)則的img src */
function getImgSrcInHtml(htmlString) {
  /** 定義匹配圖片標(biāo)簽的正則表達(dá)式
   * 1.src中不以data:image開(kāi)頭,即不以base64開(kāi)頭,沒(méi)必要再轉(zhuǎn)化了
   * 2.不是th:src
   * 3.忽略注釋的代碼
   * */
  const imgRegex = /<img\s+[^>th:]*src=["']((?!data:image)[^"']*)["'][^>]*>/gi;
  // 定義匹配注釋的正則表達(dá)式
  const commentRegex = /<!--[\s\S]*?-->/g
  // 刪除所有注釋
  htmlString = htmlString.replace(commentRegex, '')
  // 遍歷所有匹配到的圖片標(biāo)簽并獲取其src屬性
  const imgSrcs = []
  let matches;
  while ((matches = imgRegex.exec(htmlString)) !== null) {
    const src = matches[1];
    imgSrcs.push(src)
  }
  return imgSrcs.filter(Boolean)
}
/** 主程序 */
function main() {
  const htmlPaths = getHtmlPaths(TEMPLATE_PATH)
  /** 存imgSrc -> 圖片base64 */
  const imgSrc2Base64Map = new Map()
  /** 存不存在,或者超過(guò)指定大小的img */
  const imgNotExistOrOverSizeSet = new Set()
  htmlPaths.forEach(htmlPath => {
    let htmlString = readFile(htmlPath)
    const imgSrcs = getImgSrcInHtml(htmlString)
    if (!imgSrcs.length) return
    for (const src of imgSrcs) {
      if (imgNotExistOrOverSizeSet.has(src)) continue
      let absoluteSrc = src
      // console.log(imgSrcs)
      // 如果不是相對(duì)路徑,那么轉(zhuǎn)換為絕對(duì)路徑
      if (!src.startsWith('.')) absoluteSrc = path.join(STATIC_PATH, src)
      const isExist = fs.existsSync(absoluteSrc)
      if (!isExist) console.log('not isExist', src)
      // 不存在或者超出限制,則不替換
      if (!isExist || getFileSize(absoluteSrc) >= FILE_LIMIE_SIZE) {
        imgNotExistOrOverSizeSet.add(src)
        continue
      }
      let imgBase64 = imgSrc2Base64Map.get(src)
      if (!imgBase64) {
        imgBase64 = imageToBase64(absoluteSrc)
        imgSrc2Base64Map.set(src, imgBase64)
      }
      htmlString = htmlString.replace(src, imgBase64)
    }
    // 替換好后,寫(xiě)回
    writeFile(htmlPath, htmlString)
  })
}
main()

總結(jié)

因?yàn)樘嗟男D片導(dǎo)致 http 請(qǐng)求阻塞,所以要把滿(mǎn)足條件的小圖片轉(zhuǎn)為 base64, 而前端的 html 混在在后端代碼里面,且里面混雜著 Thymeleaf 模板語(yǔ)法,想通過(guò) webpack 打包的方式看起來(lái)好像不行(至少目前不知道咋辦),所以退而求其之自己寫(xiě)個(gè)腳本來(lái)處理。

大致思路就是:

  • 讀取所有 html,匹配到里面的所有 img 的 src
  • 匹配的過(guò)程中我們要忽略注釋的代碼、已經(jīng)是 base64 的圖片、Thymeleaf 模板語(yǔ)法的,涉及到挺多的正則語(yǔ)法,這部分我通過(guò)調(diào)戲 chatgpt 來(lái)實(shí)現(xiàn),雖然過(guò)程中不是十分完美
  • src 可能被重復(fù)用到,所以這里又可以?xún)?yōu)化為:
    • 如果 src 大于指定尺寸,那么下次遇到直接跳過(guò),不再獲取尺寸大小
    • 一個(gè)圖片可能被多處引用到,那么轉(zhuǎn) base64 后,下次遇到就沒(méi)必要再轉(zhuǎn)了,直接復(fù)用即可

以上就是讓chatgpt將html中的圖片轉(zhuǎn)為base64方法示例的詳細(xì)內(nèi)容,更多關(guān)于chatgpt html圖片轉(zhuǎn)base64的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

最新評(píng)論