Go實(shí)現(xiàn)自動(dòng)解壓縮包以及讀取docx/doc文件內(nèi)容詳解
一、解壓縮包
壓縮包格式
常見(jiàn)的壓縮包格式有zip、gzip、bzip2等。在Go語(yǔ)言中,使用archive/zip、compress/gzip、compress/bzip2包可以輕松地處理這些格式的文件。
解壓zip文件
使用archive/zip包中的函數(shù),我們可以輕松地操作zip文件。首先,我們需要打開(kāi)zip文件:
zipFile, err := zip.OpenReader(zipPath)
if err != nil {
return err
}
defer zipFile.Close()
上面的代碼使用zip.OpenReader函數(shù)打開(kāi)一個(gè)zip文件,并返回一個(gè)*zip.ReadCloser類型的對(duì)象,表示zip文件內(nèi)容的讀取器和關(guān)閉器。注意:在讀取完zip文件后,記得使用defer語(yǔ)句關(guān)閉該文件。
接著,我們可以使用Read()函數(shù)來(lái)解壓zip文件中的每一個(gè)文件,并將其寫(xiě)入到本地磁盤(pán):
for _, zipFileInfo := range zipFile.Reader.File {
dstPath := filepath.Join(outputDir, zipFileInfo.Name)
dstDir := filepath.Dir(dstPath)
err = os.MkdirAll(dstDir, 0755)
if err != nil {
return err
}
dstFile, err := os.OpenFile(dstPath, os.O_WRONLY|os.O_CREATE|os.O_TRUNC, zipFileInfo.Mode())
if err != nil {
return err
}
srcFile, err := zipFileInfo.Open()
if err != nil {
dstFile.Close()
return err
}
_, err = io.Copy(dstFile, srcFile)
dstFile.Close()
srcFile.Close()
if err != nil {
return err
}
}上面的代碼中,我們首先拼接出本地文件路徑,并創(chuàng)建其所在的目錄結(jié)構(gòu)。接著,使用os.OpenFile()函數(shù)以寫(xiě)入模式打開(kāi)本地文件,并使用zipFileInfo.Mode()函數(shù)獲取zip文件中該文件的權(quán)限信息。使用zipFileInfo.Open()函數(shù)將zip文件中的文件打開(kāi),并使用io.Copy()函數(shù)將其寫(xiě)入到本地文件中。如果出現(xiàn)任何錯(cuò)誤,記得關(guān)閉本地文件和zip文件中的文件,以便資源得以正確釋放。
解壓gzip文件
使用compress/gzip包,我們也可以輕松地解壓gzip文件。具體方法如下:
gzipFile, err := os.Open(gzipPath)
if err != nil {
return err
}
defer gzipFile.Close()
gzipReader, err := gzip.NewReader(gzipFile)
if err != nil {
return err
}
defer gzipReader.Close()
dstPath := filepath.Join(outputDir, filepath.Base(gzipPath))
dstFile, err := os.OpenFile(dstPath, os.O_CREATE|os.O_WRONLY|os.O_TRUNC, 0644)
if err != nil {
return err
}
defer dstFile.Close()
_, err = io.Copy(dstFile, gzipReader)
if err != nil {
return err
}上面的代碼首先打開(kāi)gzip文件,并使用gzip.NewReader()函數(shù)創(chuàng)建一個(gè)gzip.Reader類型的對(duì)象,表示gzip文件內(nèi)容的讀取器。記得在讀取完該文件之后關(guān)閉相關(guān)文件(即:gzip文件和讀取器文件)。然后,通過(guò)使用os.OpenFile()函數(shù)以寫(xiě)入模式打開(kāi)目標(biāo)文件,并將gzip讀取器中的內(nèi)容復(fù)制到目標(biāo)文件中即可。記得在操作完目標(biāo)文件后關(guān)閉相關(guān)文件,以便資源成功釋放。
解壓bzip2文件
使用compress/bzip2包,可以輕松地解壓bzip2文件。方法如下:
bzip2File, err := os.Open(bzip2Path)
if err != nil {
return err
}
defer bzip2File.Close()
bzip2Reader := bzip2.NewReader(bzip2File)
dstPath := filepath.Join(outputDir, filepath.Base(bzip2Path))
dstFile, err := os.OpenFile(dstPath, os.O_CREATE|os.O_WRONLY|os.O_TRUNC, 0644)
if err != nil {
return err
}
defer dstFile.Close()
_, err = io.Copy(dstFile, bzip2Reader)
if err != nil {
return err
}上面的代碼中,我們使用bzip2.NewReader()函數(shù)創(chuàng)建一個(gè)bzip2.Reader類型的對(duì)象,表示bzip2文件內(nèi)容的讀取器。然后,以寫(xiě)入模式打開(kāi)目標(biāo)文件,將讀取器中的內(nèi)容復(fù)制到目標(biāo)文件中,并在完成后關(guān)閉相關(guān)文件,釋放資源。
二、讀取docx/doc文件
docx/doc文件是一種二進(jìn)制文件格式,我們可以使用第三方庫(kù)來(lái)讀取其中的內(nèi)容。Word文檔通常使用.doc或.docx格式保存,其中.doc是二進(jìn)制格式,而.docx則是XML格式的文件。接下來(lái),我們將分別介紹如何讀取這兩種文件格式的內(nèi)容。
讀取.doc格式文件
我們可以使用github.com/LopPay/office-parser/ole、github.com/LopPay/office-parser/common和github.com/LopPay/office-parser/msdoc分別來(lái)處理ole文件、解析doc文件和讀取doc文件中的數(shù)據(jù)。該庫(kù)已經(jīng)封裝了所有的文本、圖片、表格等元素的解析和轉(zhuǎn)換。
下面是一個(gè)簡(jiǎn)單的讀取doc文件的程序:
docFile, err := os.Open(docPath)
if err != nil {
return err
}
defer docFile.Close()
docData, err := msdoc.ParseDocFile(docFile)
if err != nil {
return err
}
for _, para := range docData.Paragraphs {
for _, run := range para.Runs {
fmt.Print(run.Text)
}
fmt.Println()
}上面的代碼中,我們首先使用os.Open()函數(shù)打開(kāi)doc文件,并使用msdoc.ParseDocFile()函數(shù)解析該文件。該函數(shù)返回一個(gè)msdoc.Document類型的對(duì)象,該對(duì)象包括文本、圖片、表格等信息。下面的代碼將遍歷每一個(gè)段落和其中的Run實(shí)例,并將其內(nèi)容輸出到控制臺(tái)。
讀取.docx格式文件
我們可以使用第三方庫(kù)github.com/unidoc/unioffice來(lái)讀取.docx格式的文件。該庫(kù)支持讀取和寫(xiě)入單個(gè)文件、讀取和寫(xiě)入多個(gè)文件、轉(zhuǎn)換和操作表格、圖像、段落、樣式等操作。
下面是一個(gè)簡(jiǎn)單的讀取.docx文件的程序:
docFile, err := os.Open(docxPath)
if err != nil {
return err
}
defer docFile.Close()
doc, err := document.Open(docFile)
if err != nil {
return err
}
for _, para := range doc.Paragraphs() {
for _, run := range para.Runs() {
fmt.Print(run.Text())
}
fmt.Println()
}上面的代碼中,我們首先使用os.Open()函數(shù)打開(kāi)docx文件,并使用document.Open()函數(shù)解析該文件。該函數(shù)返回一個(gè)document.Document類型的對(duì)象,該對(duì)象包括文本、圖片、表格等信息。下面的代碼將遍歷每一個(gè)段落和其中的Run實(shí)例,并將其內(nèi)容輸出到控制臺(tái)。
三、總結(jié)
本文介紹了如何使用Go語(yǔ)言自動(dòng)解壓縮包和讀取docx/doc文件。具體來(lái)說(shuō),我們使用了相應(yīng)的第三方庫(kù)和Go語(yǔ)言內(nèi)置庫(kù)中的代碼。
上述代碼運(yùn)行起來(lái)比較簡(jiǎn)單,適合初學(xué)者學(xué)習(xí)和實(shí)踐。希望對(duì)大家有幫助,大家可以自行根據(jù)需求進(jìn)行修改和擴(kuò)展。
到此這篇關(guān)于Go實(shí)現(xiàn)自動(dòng)解壓縮包以及讀取docx/doc文件內(nèi)容詳解的文章就介紹到這了,更多相關(guān)Go解壓縮包和讀取doc文件內(nèi)容內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Golang使用lua腳本實(shí)現(xiàn)redis原子操作
這篇文章主要介紹了Golang使用lua腳本實(shí)現(xiàn)redis原子操作,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的工作或?qū)W習(xí)具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-03-03
Go?slice切片make生成append追加copy復(fù)制示例
這篇文章主要為大家介紹了Go使用make生成切片、使用append追加切片元素、使用copy復(fù)制切片使用示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06
go slice 數(shù)組和切片使用區(qū)別示例解析
這篇文章主要為大家介紹了go slice 數(shù)組和切片使用區(qū)別示例解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-01-01
盤(pán)點(diǎn)幾種Go語(yǔ)言開(kāi)發(fā)的IDE
Go語(yǔ)言作為一種新興的編程語(yǔ)言,近年來(lái)受到了越來(lái)越多的關(guān)注,它以其簡(jiǎn)潔、高效和并發(fā)性能而聞名,被廣泛應(yīng)用于各種軟件開(kāi)發(fā)項(xiàng)目中,本文將介紹幾種常用的Go語(yǔ)言IDE,并對(duì)它們進(jìn)行比較,幫助開(kāi)發(fā)者根據(jù)自己的需求選擇合適的工具,需要的朋友可以參考下2023-11-11
golang協(xié)程關(guān)閉踩坑實(shí)戰(zhàn)記錄
協(xié)程(coroutine)是Go語(yǔ)言中的輕量級(jí)線程實(shí)現(xiàn),下面這篇文章主要給大家介紹了關(guān)于golang協(xié)程關(guān)閉踩坑的相關(guān)資料,文中通過(guò)實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-03-03

