C語言采用文本方式和二進(jìn)制方式打開文件的區(qū)別分析
稍微了解C程序設(shè)計(jì)的人都知道,文本文件和二進(jìn)制文件在計(jì)算機(jī)上面都是以0,1存儲(chǔ)的,那么兩者怎么還存在差別呢?對(duì)于編程人員來說,文本文件和二進(jìn)制文件就是一個(gè)聲明,指明了你應(yīng)該以什么方式(文本方式/二進(jìn)制)打開這個(gè)文件,用什么函數(shù)讀寫這個(gè)文件(讀寫函數(shù)),怎么判斷讀到這個(gè)文件結(jié)尾等。
具體分析如下:
一、以哪種方式打開一個(gè)文件:
ANSI C規(guī)定了標(biāo)準(zhǔn)輸入輸出函數(shù)庫,用 fopen()函數(shù)打開文件。fopen()函數(shù)的調(diào)用方式一般為:
FILE *fp;
fp=fopen(文件名,使用文件方式);
使用文件方式見下表:
| 使用文件方式 | 含義 |
| "r"(只讀) | 為輸入打開一個(gè)文本文件 |
| "w"(只寫) | 為輸出打開一個(gè)文本文件 |
| "a"(追加) | 為追加打開一個(gè)文本文件 |
| "rb"(只讀) | 為輸入打開一個(gè)二進(jìn)制文件 |
| "wb"(只寫) | 為輸出打開一個(gè)二進(jìn)制文件 |
| "ab"(追加) | 為追加打開一個(gè)二進(jìn)制文件 |
| "r+"(讀寫) | 為讀/寫打開一個(gè)文本文件 |
| "w+"(讀寫) | 為讀/寫創(chuàng)建一個(gè)文本文件 |
| "a+"(讀寫) | 為讀/寫打開一個(gè)文本文件 |
| "rb+"(讀寫) | 為讀/寫打開一個(gè)二進(jìn)制文件 |
| "wb+"(讀寫) | 為讀/寫創(chuàng)建一個(gè)二進(jìn)制文件 |
| "ab+"(讀寫) | 為讀/寫打開一個(gè)二進(jìn)制文件 |
同一個(gè)文件從磁盤讀取文件到內(nèi)存(程序數(shù)據(jù)區(qū)或者緩存區(qū))時(shí),兩種方式下,內(nèi)存中的內(nèi)容一般不相同,這就是兩種打開方式的實(shí)質(zhì)性差別。
這里要說一個(gè)背景,那就是在windows下,它會(huì)做一個(gè)處理,就是寫文件時(shí),換行符會(huì)被轉(zhuǎn)換成回車,換行符存在磁盤文件上,而讀磁盤上的文件時(shí),它又會(huì)進(jìn)行逆處理,就是把文件中連續(xù)的回車,換行符轉(zhuǎn)換成換行符。
因此,在讀取一個(gè)磁盤文件時(shí),文本方式讀取到文件內(nèi)容很有可能會(huì)比二進(jìn)制文件短,因?yàn)槲谋痉绞阶x取要把回車,換行兩個(gè)字符變成一個(gè)字符,相當(dāng)于截短了文件。但是為什么僅僅是可能呢?因?yàn)榭赡芪谋局胁淮嬖谶B著的45,42這兩個(gè)字節(jié)(45是CR回車的ASCII碼,42是換行符CL的ASCII碼),也就不存在“截短”操作了,因此讀到的內(nèi)容是一樣的。
具體的來說,文件文件(以文本方式寫的),最好以文本方式讀。二進(jìn)制文件(以二進(jìn)制方式寫的),最好以二進(jìn)制方式讀。不然可能會(huì)不正確。
二、以什么函數(shù)讀寫文件
數(shù)據(jù)怎么在磁盤上寫不是由文件打開方式?jīng)Q定的,而是由寫函數(shù)決定的。數(shù)據(jù)怎么從磁盤上讀也不是由文件打開方式?jīng)Q定的,而是由讀函數(shù)決定的。
上面說的數(shù)據(jù)怎么寫是指,一種類型的變量是怎么存的?比如int 12,可以直接存12的二進(jìn)制碼(4個(gè)字節(jié)),也可以存字符1,字符2.
數(shù)據(jù)怎么讀的是指,我要讀一個(gè)int變量,是直接讀sizeof(int)個(gè)字節(jié),還是一個(gè)字符一個(gè)字符的讀,直到讀到的字符不是數(shù)字字符。
C里面有兩組文件讀寫函數(shù)恰好支持上面兩種方式的讀寫:
1.fread(buffer,size,count,fp),fwrite(buffer,size,count,fp)。用來讀寫一個(gè)數(shù)據(jù)塊。它對(duì)應(yīng)的是第一種存儲(chǔ)方式。直接按類型的字節(jié)長度指定讀寫的字節(jié)數(shù)。
2.fprintf函數(shù)和fscanf函數(shù).它對(duì)應(yīng)的是第二種讀寫方式。即以字符的方式讀寫。(fprintf函數(shù)、fscanf函數(shù)與printf函數(shù)、scanf函數(shù)的作用相仿,都是格式化讀寫函數(shù)。fprintf和fscanf函數(shù)的讀寫對(duì)象是磁盤文件,而printf和scanf函數(shù)的讀寫對(duì)象是終端。)
它們的一般調(diào)用格式為:
fprintf(文件指針,格式字符串,輸出列表); fscanf (文件指針,格式字符串,輸入列表);
三、怎么判斷文件尾
在C語言,或更精確地說成 C標(biāo)準(zhǔn)函式庫中,有一個(gè)特別的字符EOF(stdio.h中這個(gè)定義 #define EOF (-1) ),它表示:文件結(jié)束符(end of file)。在while循環(huán)中以EOF作為文件結(jié)束標(biāo)志,這種以EOF作為文件結(jié)束標(biāo)志的文件,必須是文本文件。在文本文件中,數(shù)據(jù)都是以字符的ASCII代碼值的形式存放。我們知道,ASCII代碼值的范圍是0~255,不可能出現(xiàn)-1,因此可以用EOF作為文件結(jié)束標(biāo)志。
但是,C語言中,當(dāng)把數(shù)據(jù)以二進(jìn)制形式存放到文件中時(shí),就會(huì)有-1值的出現(xiàn),此時(shí)不能采用EOF作為二進(jìn)制文件的結(jié)束標(biāo)志。為解決這個(gè)問題,ANSI C提供一個(gè)feof函數(shù),用來判斷文件是否結(jié)束。如果遇到文件結(jié)束,函數(shù)feof(fp)的值為1,否則為0.
feof函數(shù)既可用以判斷二進(jìn)制文件是否結(jié)束,也可以用以判斷文本文件是否結(jié)束。但是要注意feof用以判斷文本文件尾時(shí),如果代碼編寫不當(dāng),可能會(huì)把文本文中中的文件結(jié)束符EOF也讀取出來了;具體可以參考http://baike.baidu.com/view/656648.htm中feof函數(shù)的用法。
四、知道一個(gè)文件是文本文件,還是二進(jìn)制文件,更多的“提醒”我們,應(yīng)該選擇哪種讀寫函數(shù)。
正如前文所說的,數(shù)據(jù)怎么存不是由文件打開方式?jīng)Q定的,而是由讀寫函數(shù)決定的。
比如說,我們以二進(jìn)制文件的方式打開一個(gè)文件(實(shí)際上只是指明了要進(jìn)行換行符的轉(zhuǎn)換),它更多的是代表一種理念(虛的):我“希望”這個(gè)文件里面的數(shù)據(jù)是這樣的,int類型占4字節(jié),char占1個(gè)字節(jié)。這種模式下,我用fread(buffer,size0f(int),1,fp)讀取一個(gè)int到int變量中。
這里需要記住:
我們?cè)趯?duì)一個(gè)文件進(jìn)行操作以前,首先,我們要清楚這個(gè)文件到底是文本文件還是二進(jìn)制文件。文件文件用文本方式打開,二進(jìn)制文件用二進(jìn)制方式打開
如果我們要操作一個(gè)二進(jìn)制文件,那么我們就以二進(jìn)制方式打開(理論上也可以以文件方式打開,但是如果寫的二進(jìn)制數(shù)據(jù)里面有45時(shí),會(huì)轉(zhuǎn)化成45,42存儲(chǔ),如前文所述。這是很有可能發(fā)生的)。同時(shí)讀寫的時(shí)候用fread,fwrite這兩個(gè)函數(shù)。
如果我要操作一個(gè)文本文件,那么我們就以文本的方式打開(理論上也可以以二進(jìn)制方式打開,但是不保險(xiǎn))。同時(shí)讀寫的時(shí)候用讀寫字符的那些函數(shù)fprintf,fscanf ,fgetc,fputc,putw,getw,fgetc,fputs.
相關(guān)文章
C++類繼承之子類調(diào)用父類的構(gòu)造函數(shù)的實(shí)例詳解
這篇文章主要介紹了C++類繼承之子類調(diào)用父類的構(gòu)造函數(shù)的實(shí)例詳解的相關(guān)資料,希望通過本文大家能夠掌握C++類繼承的相關(guān)知識(shí),需要的朋友可以參考下2017-09-09
C++實(shí)現(xiàn)簡(jiǎn)易UDP網(wǎng)絡(luò)聊天室
這篇文章主要為大家詳細(xì)介紹了C++實(shí)現(xiàn)簡(jiǎn)易UDP網(wǎng)絡(luò)聊天室,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-07-07
C語言基礎(chǔ)應(yīng)用處理學(xué)生打分?計(jì)算時(shí)間?最少硬幣問題詳細(xì)過程
很多的問題其實(shí)可以用編程來解決作答,本篇文章帶你用C語言解決最少硬幣問題、計(jì)算已經(jīng)過去了多久、學(xué)生成績(jī)自動(dòng)打分來做基礎(chǔ)的訓(xùn)練2022-02-02
簡(jiǎn)單分析針對(duì)ARM平臺(tái)的C語言程序的編譯問題
這篇文章主要介紹了針對(duì)ARM平臺(tái)的C語言程序的編譯問題,從優(yōu)化編譯選項(xiàng)的幾個(gè)方面進(jìn)行分析,需要的朋友可以參考下2015-12-12
C語言數(shù)據(jù)結(jié)構(gòu)之隊(duì)列的定義與實(shí)現(xiàn)
隊(duì)列是一種特殊的線性表,特殊之處在于它只允許在表的前端(head)進(jìn)行刪除操作,而在表的后端(tail)進(jìn)行插入操作。本文將詳細(xì)講講C語言中隊(duì)列的定義與實(shí)現(xiàn),感興趣的可以了解一下2022-07-07
C語言中的結(jié)構(gòu)體的入門學(xué)習(xí)教程
這篇文章主要介紹了C語言中的結(jié)構(gòu)體的入門學(xué)習(xí)教程,以struct語句定義的結(jié)構(gòu)體是C語言編程中的重要基礎(chǔ),需要的朋友可以參考下2015-12-12

