C語(yǔ)言采用文本方式和二進(jìn)制方式打開(kāi)文件的區(qū)別分析
稍微了解C程序設(shè)計(jì)的人都知道,文本文件和二進(jìn)制文件在計(jì)算機(jī)上面都是以0,1存儲(chǔ)的,那么兩者怎么還存在差別呢?對(duì)于編程人員來(lái)說(shuō),文本文件和二進(jìn)制文件就是一個(gè)聲明,指明了你應(yīng)該以什么方式(文本方式/二進(jìn)制)打開(kāi)這個(gè)文件,用什么函數(shù)讀寫(xiě)這個(gè)文件(讀寫(xiě)函數(shù)),怎么判斷讀到這個(gè)文件結(jié)尾等。
具體分析如下:
一、以哪種方式打開(kāi)一個(gè)文件:
ANSI C規(guī)定了標(biāo)準(zhǔn)輸入輸出函數(shù)庫(kù),用 fopen()函數(shù)打開(kāi)文件。fopen()函數(shù)的調(diào)用方式一般為:
FILE *fp;
fp=fopen(文件名,使用文件方式);
使用文件方式見(jiàn)下表:
使用文件方式 | 含義 |
"r"(只讀) | 為輸入打開(kāi)一個(gè)文本文件 |
"w"(只寫(xiě)) | 為輸出打開(kāi)一個(gè)文本文件 |
"a"(追加) | 為追加打開(kāi)一個(gè)文本文件 |
"rb"(只讀) | 為輸入打開(kāi)一個(gè)二進(jìn)制文件 |
"wb"(只寫(xiě)) | 為輸出打開(kāi)一個(gè)二進(jìn)制文件 |
"ab"(追加) | 為追加打開(kāi)一個(gè)二進(jìn)制文件 |
"r+"(讀寫(xiě)) | 為讀/寫(xiě)打開(kāi)一個(gè)文本文件 |
"w+"(讀寫(xiě)) | 為讀/寫(xiě)創(chuàng)建一個(gè)文本文件 |
"a+"(讀寫(xiě)) | 為讀/寫(xiě)打開(kāi)一個(gè)文本文件 |
"rb+"(讀寫(xiě)) | 為讀/寫(xiě)打開(kāi)一個(gè)二進(jìn)制文件 |
"wb+"(讀寫(xiě)) | 為讀/寫(xiě)創(chuàng)建一個(gè)二進(jìn)制文件 |
"ab+"(讀寫(xiě)) | 為讀/寫(xiě)打開(kāi)一個(gè)二進(jìn)制文件 |
同一個(gè)文件從磁盤(pán)讀取文件到內(nèi)存(程序數(shù)據(jù)區(qū)或者緩存區(qū))時(shí),兩種方式下,內(nèi)存中的內(nèi)容一般不相同,這就是兩種打開(kāi)方式的實(shí)質(zhì)性差別。
這里要說(shuō)一個(gè)背景,那就是在windows下,它會(huì)做一個(gè)處理,就是寫(xiě)文件時(shí),換行符會(huì)被轉(zhuǎn)換成回車,換行符存在磁盤(pán)文件上,而讀磁盤(pán)上的文件時(shí),它又會(huì)進(jìn)行逆處理,就是把文件中連續(xù)的回車,換行符轉(zhuǎn)換成換行符。
因此,在讀取一個(gè)磁盤(pán)文件時(shí),文本方式讀取到文件內(nèi)容很有可能會(huì)比二進(jìn)制文件短,因?yàn)槲谋痉绞阶x取要把回車,換行兩個(gè)字符變成一個(gè)字符,相當(dāng)于截短了文件。但是為什么僅僅是可能呢?因?yàn)榭赡芪谋局胁淮嬖谶B著的45,42這兩個(gè)字節(jié)(45是CR回車的ASCII碼,42是換行符CL的ASCII碼),也就不存在“截短”操作了,因此讀到的內(nèi)容是一樣的。
具體的來(lái)說(shuō),文件文件(以文本方式寫(xiě)的),最好以文本方式讀。二進(jìn)制文件(以二進(jìn)制方式寫(xiě)的),最好以二進(jìn)制方式讀。不然可能會(huì)不正確。
二、以什么函數(shù)讀寫(xiě)文件
數(shù)據(jù)怎么在磁盤(pán)上寫(xiě)不是由文件打開(kāi)方式?jīng)Q定的,而是由寫(xiě)函數(shù)決定的。數(shù)據(jù)怎么從磁盤(pán)上讀也不是由文件打開(kāi)方式?jīng)Q定的,而是由讀函數(shù)決定的。
上面說(shuō)的數(shù)據(jù)怎么寫(xiě)是指,一種類型的變量是怎么存的?比如int 12,可以直接存12的二進(jìn)制碼(4個(gè)字節(jié)),也可以存字符1,字符2.
數(shù)據(jù)怎么讀的是指,我要讀一個(gè)int變量,是直接讀sizeof(int)個(gè)字節(jié),還是一個(gè)字符一個(gè)字符的讀,直到讀到的字符不是數(shù)字字符。
C里面有兩組文件讀寫(xiě)函數(shù)恰好支持上面兩種方式的讀寫(xiě):
1.fread(buffer,size,count,fp),fwrite(buffer,size,count,fp)。用來(lái)讀寫(xiě)一個(gè)數(shù)據(jù)塊。它對(duì)應(yīng)的是第一種存儲(chǔ)方式。直接按類型的字節(jié)長(zhǎng)度指定讀寫(xiě)的字節(jié)數(shù)。
2.fprintf函數(shù)和fscanf函數(shù).它對(duì)應(yīng)的是第二種讀寫(xiě)方式。即以字符的方式讀寫(xiě)。(fprintf函數(shù)、fscanf函數(shù)與printf函數(shù)、scanf函數(shù)的作用相仿,都是格式化讀寫(xiě)函數(shù)。fprintf和fscanf函數(shù)的讀寫(xiě)對(duì)象是磁盤(pán)文件,而printf和scanf函數(shù)的讀寫(xiě)對(duì)象是終端。)
它們的一般調(diào)用格式為:
fprintf(文件指針,格式字符串,輸出列表); fscanf (文件指針,格式字符串,輸入列表);
三、怎么判斷文件尾
在C語(yǔ)言,或更精確地說(shuō)成 C標(biāo)準(zhǔn)函式庫(kù)中,有一個(gè)特別的字符EOF(stdio.h中這個(gè)定義 #define EOF (-1) ),它表示:文件結(jié)束符(end of file)。在while循環(huán)中以EOF作為文件結(jié)束標(biāo)志,這種以EOF作為文件結(jié)束標(biāo)志的文件,必須是文本文件。在文本文件中,數(shù)據(jù)都是以字符的ASCII代碼值的形式存放。我們知道,ASCII代碼值的范圍是0~255,不可能出現(xiàn)-1,因此可以用EOF作為文件結(jié)束標(biāo)志。
但是,C語(yǔ)言中,當(dāng)把數(shù)據(jù)以二進(jìn)制形式存放到文件中時(shí),就會(huì)有-1值的出現(xiàn),此時(shí)不能采用EOF作為二進(jìn)制文件的結(jié)束標(biāo)志。為解決這個(gè)問(wèn)題,ANSI C提供一個(gè)feof函數(shù),用來(lái)判斷文件是否結(jié)束。如果遇到文件結(jié)束,函數(shù)feof(fp)的值為1,否則為0.
feof函數(shù)既可用以判斷二進(jìn)制文件是否結(jié)束,也可以用以判斷文本文件是否結(jié)束。但是要注意feof用以判斷文本文件尾時(shí),如果代碼編寫(xiě)不當(dāng),可能會(huì)把文本文中中的文件結(jié)束符EOF也讀取出來(lái)了;具體可以參考http://baike.baidu.com/view/656648.htm中feof函數(shù)的用法。
四、知道一個(gè)文件是文本文件,還是二進(jìn)制文件,更多的“提醒”我們,應(yīng)該選擇哪種讀寫(xiě)函數(shù)。
正如前文所說(shuō)的,數(shù)據(jù)怎么存不是由文件打開(kāi)方式?jīng)Q定的,而是由讀寫(xiě)函數(shù)決定的。
比如說(shuō),我們以二進(jìn)制文件的方式打開(kāi)一個(gè)文件(實(shí)際上只是指明了要進(jìn)行換行符的轉(zhuǎn)換),它更多的是代表一種理念(虛的):我“希望”這個(gè)文件里面的數(shù)據(jù)是這樣的,int類型占4字節(jié),char占1個(gè)字節(jié)。這種模式下,我用fread(buffer,size0f(int),1,fp)讀取一個(gè)int到int變量中。
這里需要記住:
我們?cè)趯?duì)一個(gè)文件進(jìn)行操作以前,首先,我們要清楚這個(gè)文件到底是文本文件還是二進(jìn)制文件。文件文件用文本方式打開(kāi),二進(jìn)制文件用二進(jìn)制方式打開(kāi)
如果我們要操作一個(gè)二進(jìn)制文件,那么我們就以二進(jìn)制方式打開(kāi)(理論上也可以以文件方式打開(kāi),但是如果寫(xiě)的二進(jìn)制數(shù)據(jù)里面有45時(shí),會(huì)轉(zhuǎn)化成45,42存儲(chǔ),如前文所述。這是很有可能發(fā)生的)。同時(shí)讀寫(xiě)的時(shí)候用fread,fwrite這兩個(gè)函數(shù)。
如果我要操作一個(gè)文本文件,那么我們就以文本的方式打開(kāi)(理論上也可以以二進(jìn)制方式打開(kāi),但是不保險(xiǎn))。同時(shí)讀寫(xiě)的時(shí)候用讀寫(xiě)字符的那些函數(shù)fprintf,fscanf ,fgetc,fputc,putw,getw,fgetc,fputs.
相關(guān)文章
C++類繼承之子類調(diào)用父類的構(gòu)造函數(shù)的實(shí)例詳解
這篇文章主要介紹了C++類繼承之子類調(diào)用父類的構(gòu)造函數(shù)的實(shí)例詳解的相關(guān)資料,希望通過(guò)本文大家能夠掌握C++類繼承的相關(guān)知識(shí),需要的朋友可以參考下2017-09-09C++實(shí)現(xiàn)簡(jiǎn)易UDP網(wǎng)絡(luò)聊天室
這篇文章主要為大家詳細(xì)介紹了C++實(shí)現(xiàn)簡(jiǎn)易UDP網(wǎng)絡(luò)聊天室,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-07-07C語(yǔ)言實(shí)現(xiàn)車票管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了C語(yǔ)言實(shí)現(xiàn)車票管理系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-05-05C語(yǔ)言基礎(chǔ)應(yīng)用處理學(xué)生打分?計(jì)算時(shí)間?最少硬幣問(wèn)題詳細(xì)過(guò)程
很多的問(wèn)題其實(shí)可以用編程來(lái)解決作答,本篇文章帶你用C語(yǔ)言解決最少硬幣問(wèn)題、計(jì)算已經(jīng)過(guò)去了多久、學(xué)生成績(jī)自動(dòng)打分來(lái)做基礎(chǔ)的訓(xùn)練2022-02-02簡(jiǎn)單分析針對(duì)ARM平臺(tái)的C語(yǔ)言程序的編譯問(wèn)題
這篇文章主要介紹了針對(duì)ARM平臺(tái)的C語(yǔ)言程序的編譯問(wèn)題,從優(yōu)化編譯選項(xiàng)的幾個(gè)方面進(jìn)行分析,需要的朋友可以參考下2015-12-12C語(yǔ)言中計(jì)算字符串長(zhǎng)度與分割字符串的方法
這篇文章主要介紹了C語(yǔ)言中計(jì)算字符串長(zhǎng)度與分割字符串的方法,是C語(yǔ)言入門學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下2015-08-08C語(yǔ)言數(shù)據(jù)結(jié)構(gòu)之隊(duì)列的定義與實(shí)現(xiàn)
隊(duì)列是一種特殊的線性表,特殊之處在于它只允許在表的前端(head)進(jìn)行刪除操作,而在表的后端(tail)進(jìn)行插入操作。本文將詳細(xì)講講C語(yǔ)言中隊(duì)列的定義與實(shí)現(xiàn),感興趣的可以了解一下2022-07-07C語(yǔ)言中的結(jié)構(gòu)體的入門學(xué)習(xí)教程
這篇文章主要介紹了C語(yǔ)言中的結(jié)構(gòu)體的入門學(xué)習(xí)教程,以struct語(yǔ)句定義的結(jié)構(gòu)體是C語(yǔ)言編程中的重要基礎(chǔ),需要的朋友可以參考下2015-12-12