Go來合并兩個(gè)csv的實(shí)現(xiàn)示例
背景
通常我們處理文件都是用python+pandas,確實(shí)很香。但是今天突然有人找我用go寫一個(gè)合并兩個(gè)csv文件的,需要將兩個(gè)csv按id進(jìn)行合并,大致如下圖
思路很簡單,先讀入兩個(gè)csv文件,然后遍歷比較id,如果相同就把另一個(gè)文件的內(nèi)容加到第一個(gè)中。然后創(chuàng)建merge.csv,將上一步得到的數(shù)據(jù)寫入csv即可。
代碼部分
package main import ( "encoding/csv" "log" "os" "fmt" ) func join(fileName1 string, fileName2 string) (row [][]string) { fs1, _ := os.Open(fileName1) r1 := csv.NewReader(fs1) content1, err := r1.ReadAll() if err != nil { log.Fatalf("can not readall, err is %+v", err) } fs2, _ := os.Open(fileName2) r2 := csv.NewReader(fs2) content2, err := r2.ReadAll() if err != nil { log.Fatalf("can not readall, err is %+v", err) } row = make([][]string, len(content1[1:])) for i, row1 := range content1[1:] { for _, row2 := range content2[1:] { if row1[0] == row2[0] { row[i] = append(row[i], row1[0], row1[1], row1[2], row2[1], row2[2]) } } } return } func edit(filename string, row [][]string) { f, err := os.Create(filename) if err != nil { panic(err) } defer f.Close() //防止亂碼 f.WriteString("\xEF\xBB\xBF") w := csv.NewWriter(f) w.Write([]string{"ID", "name", "gender", "course", "score"}) w.WriteAll(row) w.Flush() } func main() { row := join("1.csv", "2.csv") fmt.Println(row) edit("join.csv", row) fmt.Println("合并已完成!") }
優(yōu)化
對(duì)于小數(shù)據(jù)量這樣是沒有問題,但是一旦數(shù)據(jù)量增大,不僅讀取的內(nèi)存占用增加,而且遍歷比較會(huì)很消耗時(shí)間。所以優(yōu)化的話我們可以以行讀取,并且想辦法使用go的goroutine來增加速度。唉,太久沒怎么寫go了,一開始切片都有點(diǎn)忘了。
到此這篇關(guān)于Go來合并兩個(gè)csv的實(shí)現(xiàn)示例的文章就介紹到這了,更多相關(guān)Go合并csv內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Go語言實(shí)現(xiàn)Fibonacci數(shù)列的方法
這篇文章主要介紹了Go語言實(shí)現(xiàn)Fibonacci數(shù)列的方法,實(shí)例分析了使用遞歸和不使用遞歸兩種技巧,并對(duì)算法的效率進(jìn)行了對(duì)比,需要的朋友可以參考下2015-02-02詳解Go語言中的數(shù)據(jù)類型及類型轉(zhuǎn)換
這篇文章主要為大家介紹了Go語言中常見的幾種數(shù)據(jù)類型,以及他們之間的轉(zhuǎn)換方法,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下2022-04-04