欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

利用R語(yǔ)言解壓與壓縮.tar.gz.zip等格式文件

 更新時(shí)間:2021年11月05日 16:49:02   作者:Kanny廣小隸  
這篇文章主要為大家介紹了利用R語(yǔ)言怎樣解壓與壓縮.tar.gz.zip等各種壓縮格式文件實(shí)現(xiàn)過(guò)程方法,有需要的朋友可以借鑒參考下希望能夠有所幫助

最近嘗試用 R 對(duì)一些文件進(jìn)行批量的解壓與壓縮,這里記錄一些常用的解壓與壓縮的方法。

由于解壓與壓縮是對(duì)稱的兩種方法,這里我們著重以對(duì)文件的解壓為例,分不同的格式進(jìn)行講解。

.zip

壓縮:zip()

解壓:unzip()

若要壓縮文件,就直接在 zip() 函數(shù)的第一個(gè)參數(shù)里面輸入壓縮后的文件名,第二個(gè)參數(shù)輸入壓縮前的文件名。

而解壓文件就更簡(jiǎn)單了,直接利用 unzip() 里面加上需要解壓的文件名稱即可。

.tar.gz

壓縮:tar()

解壓:untar()

.zip 后綴的壓縮文件。

.gz 與 .bz2

這兩個(gè)壓縮文件與前面的相比,是最與眾不同的,因?yàn)檫@兩種后綴的文件,可以稱之為壓縮文件,也可以直接作為一個(gè)數(shù)據(jù)文件,當(dāng)成 data frame 直接進(jìn)行讀取。因?yàn)槠浔旧砭褪菙?shù)據(jù)文件。

下面我們以 解壓 / 讀取 進(jìn)行詳細(xì)說(shuō)明:

1) 直接解壓

R 中默認(rèn)沒(méi)有解壓相關(guān)文件的函數(shù),需要使用一個(gè)包:R.utils,然后如下述代碼所示,利用 gunzip() 函數(shù),即可解壓。

library(R.utils)
gunzip("file.gz", remove = `TRUE`)
bunzip2("file.bz2", remove = `TRUE`)

注意是這個(gè)函數(shù)里面多了一個(gè) remove = 參數(shù),選擇 TRUE 就會(huì)只保留解壓后的文件,原壓縮包會(huì)被刪除,默認(rèn)就是 TRUE。

解壓之后,我們可以直接用 read.table() 對(duì)其進(jìn)行讀取。

2) 直接讀取

當(dāng)然,如果我們的目的只是讀取其中的數(shù)據(jù),而不是一定需要解壓,則可以使用兩個(gè)默認(rèn)函數(shù)組合的形式,直接對(duì)數(shù)據(jù)進(jìn)行讀取:

dat <- read.table(gzfile("file.gz"))  

而針對(duì) 2.10 版本之后的 R,還有另一種更方便的讀取方式,就是直接使用 read.table() 對(duì)其進(jìn)行讀取。

dat <- read.table("file.gz")

參考

Decompress gz file using R

untar: Extract Or List Tar Archives

以上就是利用R語(yǔ)言解壓與壓縮.tar.gz.zip等格式文件的詳細(xì)內(nèi)容,更多關(guān)于R語(yǔ)言解壓與壓縮文件的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

最新評(píng)論