快捷導(dǎo)航

基于node編寫(xiě)excel讀取和導(dǎo)出的小工具

更新時(shí)間：2024年11月08日 09:36:43 作者：雙下巴大圓臉

這篇文章主要為大家詳細(xì)介紹了如何基于node編寫(xiě)一個(gè)小工具,可以實(shí)現(xiàn)excel讀取和導(dǎo)出,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下

背景

領(lǐng)導(dǎo)給同事安排了一個(gè)體力活，根據(jù)表1（7k+條）篩選表2(4W+條)，然后合并兩個(gè)表相同的數(shù)據(jù)。聽(tīng)起來(lái)是挺簡(jiǎn)單的需求，加個(gè)外表篩選就完事了么，基礎(chǔ)的excel操作他還是會(huì)的，但是仔細(xì)研究了下，發(fā)現(xiàn)行不通，F(xiàn)ILTER和MATCH都會(huì)有一定的局限。并且最后的和并新表也是個(gè)困難。于是來(lái)求助，看能不能寫(xiě)個(gè)小腳本，跑一下解決問(wèn)題。我了解了下需求，覺(jué)得可行，于是便有了這個(gè)腳本

需求描述

表1格式

姓名	年齡	住址
張三	20	上海外灘18號(hào)
李四	21	上海浦東新區(qū)
王五	22	御青路1號(hào)
。。。	。。。	。。。

表2格式

昵稱	注冊(cè)時(shí)間	住址
二蛋	2021	18號(hào)
雙下巴大圓臉	2015	上海
狗子	2022	御青路
。。。	。。。	。。。

他的需求，就是根據(jù)表2的住址模糊篩選出表格1住址列所有匹配的數(shù)據(jù)。然后合并信息。

介紹結(jié)束、開(kāi)始碼代碼

1、 node讀取excel并解析數(shù)據(jù)

我這里是用了node的xlsx

// 安裝xlsx
npm install --save xlsx

xlsx本身提供了一個(gè)讀取文件方法，就不需要用fs的讀取了，核心代碼如下

 const workbook = xlsx.readFile(filePath);

 // 我這里只需要第一個(gè)，對(duì)于多個(gè)sheet的情況，這里加個(gè)循環(huán)就好了
 const sheetName = workbook.SheetNames[0];
 const sheet = workbook.Sheets[sheetName];

 // 將表內(nèi)容轉(zhuǎn)換為 JSON 數(shù)據(jù)
 const data = xlsx.utils.sheet_to_json(sheet);

這里推薦使用vscode的調(diào)試模式，可以很方便的查看變量的實(shí)際值，不用console一遍一遍查看

2、過(guò)濾數(shù)據(jù),并合并需要的數(shù)據(jù)

拿到表1和表2的數(shù)據(jù)后，就是過(guò)濾數(shù)據(jù)的邏輯了

// 過(guò)濾文件
const processingData = ({filterFileData,resourceFileData}) => {
    // 創(chuàng)建一個(gè)包含所有 filterFileData.地址 的正則表達(dá)式
    const areaPattern = new RegExp(filterFileData.map(item => item['地址']).join('|'));
    
    // 記錄匹配結(jié)果
    const matches = resourceFileData.reduce((acc, item2) => {
        const match = item2['地址'].match(areaPattern);
        if (match) {
            // 找到匹配的 arr1 項(xiàng)
            const matchedItem1 = filterFileData.find(item1 => item1['地址'] === match[0]);
            
            acc.push({
                filterFileData: matchedItem1,
                resourceFileData: item2
            });
        }
        return acc;
    }, []);
    
    
    return matches
}

對(duì)于這種大數(shù)據(jù)過(guò)濾，盡可能的減少循環(huán)套循環(huán)，我這里是直接把表2住址拼接了一個(gè)正則，用match去校驗(yàn)表1的地址列，是否包含表2字符串，有更好的方案，可以在評(píng)論區(qū)打出來(lái)交流下

3、導(dǎo)出excel

在第二步，我把匹配成功的表1和表2數(shù)據(jù)都存在了一個(gè)數(shù)組，然后再第三步使用,這里就是拼數(shù)據(jù)和寫(xiě)數(shù)據(jù)了

// 生成篩選后的excel
const writeExcel = ({writeData,resourceFileName}) => {
    const data = writeData.map((item, index) => {
        const {filterFileData,resourceFileData} = item
        return {
            '序號(hào)': index + 1,
            '所屬區(qū)縣': filterFileData['所屬區(qū)縣'],
            '戶號(hào)': resourceFileData['戶號(hào)'],
            '戶名': resourceFileData['戶名'],
            '戶號(hào)地址': resourceFileData['地址'],
            '機(jī)構(gòu)全稱': filterFileData['機(jī)構(gòu)全稱'],
            '機(jī)構(gòu)類型': filterFileData['機(jī)構(gòu)類型'],
            '機(jī)構(gòu)地址': filterFileData['地址'],
        }
    })
    // 將數(shù)據(jù)轉(zhuǎn)換為 worksheet
    const worksheet = xlsx.utils.json_to_sheet(data);

    // 創(chuàng)建一個(gè)新的 workbook，并附加 worksheet
    const workbook = xlsx.utils.book_new();
    xlsx.utils.book_append_sheet(workbook, worksheet, 'Sheet1');

    let outputFileName = `${resourceFileName.split('.')[0]}-篩選結(jié)果.xlsx`
    let outputFilePath = path.join(outputFileDirPath,`./${outputFileName}`)

    // 保存 Excel 文件
    xlsx.writeFile(workbook, outputFilePath);
    
    console.log(`導(dǎo)出文件成功,地址在:${outputFilePath}`)
}

完整代碼

// 1、讀取filterFile和resourceFile目錄下的文件
// 2、過(guò)濾源數(shù)據(jù)
// 3、將過(guò)濾好的數(shù)據(jù)，寫(xiě)入一個(gè)excel

const fs = require("fs");
const xlsx = require("xlsx");
const path = require("path");

const resourceFileDirPath = path.join(__dirname, "./resourceFile");
const filterFileName = "filter.xlsx";
const filterFileDirPath = path.join(__dirname, `./filterFile/${filterFileName}`);
const outputFileDirPath = path.join(__dirname, `./outputFile`);

// 讀取excel文件
const readFile = (filePath) => {
  return new Promise((resolve, reject) => {
    const workbook = xlsx.readFile(filePath);
    
    // 暫時(shí)只解析第一個(gè)sheet
    const sheetName = workbook.SheetNames[0];
    const sheet = workbook.Sheets[sheetName];
    
    // 將表內(nèi)容轉(zhuǎn)換為 JSON 數(shù)據(jù)
    const data = xlsx.utils.sheet_to_json(sheet);
    
    resolve(data);
  });
};

// 過(guò)濾文件
const processingData = ({filterFileData,resourceFileData}) => {
    // 創(chuàng)建一個(gè)包含所有 filterFileData.地址 的正則表達(dá)式
    const areaPattern = new RegExp(filterFileData.map(item => item['地址']).join('|'));

    // 記錄匹配結(jié)果
    const matches = resourceFileData.reduce((acc, item2) => {
        const match = item2['地址'].match(areaPattern);
        if (match) {
            // 找到匹配的 arr1 項(xiàng)
            const matchedItem1 = filterFileData.find(item1 => item1['地址'] === match[0]);
            acc.push({
                filterFileData: matchedItem1,
                resourceFileData: item2
            });
        }
        return acc;
    }, []);

    return matches
}
// 生成篩選后的excel
const writeExcel = ({writeData,resourceFileName}) => {
    const data = writeData.map((item, index) => {
        const {filterFileData,resourceFileData} = item
        return {
            '序號(hào)': index + 1,
            '所屬區(qū)縣': filterFileData['所屬區(qū)縣'],
            '戶號(hào)': resourceFileData['戶號(hào)'],
            '戶名': resourceFileData['戶名'],
            '戶號(hào)地址': resourceFileData['地址'],
            '機(jī)構(gòu)全稱': filterFileData['機(jī)構(gòu)全稱'],
            '機(jī)構(gòu)類型': filterFileData['機(jī)構(gòu)類型'],
            '機(jī)構(gòu)地址': filterFileData['地址'],
        }
    })
    // 將數(shù)據(jù)轉(zhuǎn)換為 worksheet
    const worksheet = xlsx.utils.json_to_sheet(data);

    // 創(chuàng)建一個(gè)新的 workbook，并附加 worksheet
    const workbook = xlsx.utils.book_new();
    xlsx.utils.book_append_sheet(workbook, worksheet, 'Sheet1');

    let outputFileName = `${resourceFileName.split('.')[0]}-篩選結(jié)果.xlsx`
    let outputFilePath = path.join(outputFileDirPath,`./${outputFileName}`)

    // 保存 Excel 文件
    xlsx.writeFile(workbook, outputFilePath);
    
    console.log(`導(dǎo)出文件成功,地址在:${outputFilePath}`)
}

const main = async () => {
  
  console.time("總用時(shí)");
  const files = fs.readdirSync(resourceFileDirPath);
  let filterFile = await readFile(filterFileDirPath);
//   過(guò)濾掉沒(méi)有地址 和指定關(guān)鍵字的文件
  filterFile = filterFile.filter(item => {
    let area = item['地址']
    let blackList = ['0','無(wú)', '無(wú)地址']
    return area && !blackList.includes(area)
  })


  console.log(files);
  for (const fileName of files) {
    
    console.time(`${fileName}用時(shí)：`);
    console.log(`正在讀取文件${fileName}`)
    // 讀取待篩選數(shù)據(jù)
    let resourceFile = await readFile(
      path.resolve(resourceFileDirPath, fileName)
    );
    console.log(`讀取文件成功，正在解析文件`)
    // 解析文件
    const writeData = processingData({
        filterFileData: filterFile,
        resourceFileData: resourceFile,
    })
    console.log(`解析文件成功，正在導(dǎo)出文件`)
    // 寫(xiě)入數(shù)據(jù)
    writeExcel({
        writeData,
        resourceFileName: fileName
    })
    console.timeEnd(`${fileName}用時(shí)：`);

  }

  console.timeEnd("總用時(shí)");
};

// 執(zhí)行
try {
  main();
  
} catch (error) {
    console.log('error',error)
}