C語言進階之文件操作詳解
0. Intro
在使用操作數(shù)據(jù)庫之前,記錄信息,錄入數(shù)據(jù)需要文件操作,這樣就可以對諸如通訊錄的程序記錄信息,增加和刪除信息,我們通過文件可以將數(shù)據(jù)直接存放在電腦的硬盤上,做到數(shù)據(jù)持久化,而不是在內(nèi)存中
1. 文件名
一個文件要有一個唯一的文件標(biāo)識,以便用戶識別和引用。
文件名包含3部分:文件路徑+文件名主干+文件后綴
例如:
c:\demo\test.cpp為了方便起見,文件標(biāo)識常被稱為文件名。
2. 文件的打開和關(guān)閉
2.1 文件指針
每個被使用的文件都在內(nèi)存中開辟了一個相應(yīng)的文件信息區(qū),用來存放文件的相關(guān)信息(如文件的名字,文件狀態(tài)及文件當(dāng)前的位置等)。這些信息是保存在一個結(jié)構(gòu)體變量中的。該結(jié)構(gòu)體類型是有系統(tǒng)聲明的,取名FILE.
VS2013編譯環(huán)境提供的stdio.h 頭文件中有以下的文件類型申明:
struct _iobuf {
char* _ptr;
int _cnt;
char* _base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char* _tmpfname;
};
typedef struct _iobuf FILE;
不同的C編譯器的FILE類型包含的內(nèi)容不完全相同,但是大同小異。
每當(dāng)打開一個文件的時候,系統(tǒng)會根據(jù)文件的情況自動創(chuàng)建一個FILE結(jié)構(gòu)的變量,并填充其中的信息,使用者不必關(guān)心細節(jié)。
一般都是通過一個FILE*的指針來維護這個FILE結(jié)構(gòu)的變量,這樣使用起來更加方便。
創(chuàng)建一個FILE*的指針變量:
FILE* pf;//文件指針變量
定義pf是一個指向FILE類型數(shù)據(jù)的指針變量??梢允筽f指向某個文件的文件信息區(qū)(是一個結(jié)構(gòu)體變量)。通過該文件信息區(qū)中的信息就能夠訪問該文件。也就是說,通過文件指針變量能夠找到與它關(guān)聯(lián)的文件。

2.2 打開和關(guān)閉文件
文件在讀寫之前應(yīng)該先打開文件,在使用結(jié)束之后應(yīng)該關(guān)閉文件。
//打開文件 FILE * fopen ( const char * filename, const char * mode ); //關(guān)閉文件 int fclose ( FILE * stream );
文件可以用一下方式操作打開

//打開文件
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
//printf("打開文件失敗\n");
printf("%s\n", strerror(errno));
return 0;
}
//讀文件
//關(guān)閉文件
fclose(pf);
pf = NULL;
3. 文件順序讀寫

3.1 利用以上函數(shù)實現(xiàn)拷貝文件操作
int main()
{
//實現(xiàn)一個代碼將data.txt 拷貝一份 生成data2.txt
FILE* pr = fopen("data.txt", "r");
if (pr == NULL)
{
printf("open for reading: %s\n", strerror(errno));
return 0;
}
FILE* pw = fopen("data2.txt", "w");
if (pw == NULL)
{
printf("open for writting: %s\n", strerror(errno));
fclose(pr);
pr = NULL;
return 0;
}
//拷貝文件
int ch = 0;
while ((ch = fgetc(pr)) != EOF)
{
fputc(ch, pw);
}
fclose(pr);
pr = NULL;
fclose(pw);
pw = NULL;
return 0;
}
3.2 二進制的讀寫
//二進制的寫
int main()
{
struct Stu s[2] = { {"張三", 20, 95.5} , {"lisi", 16, 66.5}};
FILE* pf = fopen("data.txt", "wb");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
//按照二進制的方式寫文件
fwrite(s, sizeof(struct Stu), 2, pf);
fclose(pf);
pf = NULL;
return 0;
}
//二進制的讀
//
int main()
{
struct Stu s[2] = {0};
FILE* pf = fopen("data.txt", "rb");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
//按照二進制的方式讀文件
fread(s, sizeof(struct Stu), 2, pf);
printf("%s %d %lf\n", s[0].name, s[0].age, s[0].d);
printf("%s %d %lf\n", s[1].name, s[1].age, s[1].d);
fclose(pf);
pf = NULL;
return 0;
}
3.3 格式化輸入輸出函數(shù)

上面函數(shù)的區(qū)別就是

下面是使用示例標(biāo)準(zhǔn)化讀入一個自定義的結(jié)構(gòu)體
struct Stu
{
char name[20];
int age;
double d;
};
int main()
{
struct Stu s = { 0 };
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
//讀格式化的數(shù)據(jù)
fscanf(pf, "%s %d %lf", s.name, &(s.age), &(s.d));
printf("%s %d %lf\n", s.name, s.age, s.d);
fclose(pf);
pf = NULL;
return 0;
}
4. 文件的隨機讀寫操作
4.1 fseek
根據(jù)文件指針的位置和偏移量來定位文件指針。也就是從一個特定的位置偏移多少偏移量
int fseek ( FILE * stream, long int offset, int origin );
使用實例:
#include <stdio.h>
int main()
{
FILE* pFile;
pFile = fopen("example.txt", "wb");
fputs("This is an apple.", pFile);
fseek(pFile, 9, SEEK_SET);
fputs(" sam", pFile);
fclose(pFile);
return 0;
}

fseek(pf, 3, SEEK_CUR); fseek(pf, 5, SEEK_SET); fseek(pf, -1, SEEK_END);
4.2 ftell
返回文件指針相對于起始位置的偏移量
long int ftell ( FILE * stream );
4.3 rewind
讓文件指針的位置回到文件的起始位置
void rewind ( FILE * stream );
使用實例:
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
//讀文件
int ch = fgetc(pf);
printf("%c\n", ch);//a
ch = fgetc(pf);
printf("%c\n", ch);//b
int ret = ftell(pf);
printf("%d\n", ret);//2
rewind(pf);
fseek(pf, 0, SEEK_SET);
ret = ftell(pf);
printf("%d\n", ret);//0
fclose(pf);
pf = NULL;
return 0;
}
5. 文本文件和二進制文件
根據(jù)數(shù)據(jù)的組織形式,數(shù)據(jù)文件被稱為文本文件或者二進制文件。數(shù)據(jù)在內(nèi)存中以二進制的形式存儲,如果不加轉(zhuǎn)換的輸出到外存,就是二進制文件。如果要求在外存上以ASCII碼的形式存儲,則需要在存儲前轉(zhuǎn)換。以ASCII字符的形式存儲的文件就是文
本文件。
5.1 一個數(shù)據(jù)在內(nèi)存中的存儲方式
字符一律以ASCII形式存儲,數(shù)值型數(shù)據(jù)既可以用ASCII形式存儲,也可以使用二進制形式存儲。
如有整數(shù)20000,如果以ASCII碼的形式輸出到磁盤,則磁盤中占用5個字節(jié)(每個字符一個字節(jié)),而二進制形式輸出,則在磁盤上只占4個字節(jié)(VS2013)。


6. 文件讀取錯誤的判定
6.1 被錯誤使用的feof
在文件讀取過程中,不能用feof函數(shù)的返回值直接用來判斷文件的是否結(jié)束
而是應(yīng)用于當(dāng)文件讀取結(jié)束的時候,判斷是讀取失敗結(jié)束,還是遇到文件尾結(jié)束。
文本文件讀取是否結(jié)束,判斷返回值是否為EOF ( fgetc ),或者NULL ( fgets)
fgetc 判斷是否為EOF
fgets 判斷返回值是否為NULL
二進制文件的讀取結(jié)束判斷,判斷返回值是否小于實際要讀的個數(shù)。
fread判斷返回值是否小于實際要讀的個數(shù)。
int main(void)
{
int c; // 注意:int,非char,要求處理EOF
FILE* fp = fopen("test.txt", "r");
if (!fp) {
perror("File opening failed");
return EXIT_FAILURE;
}
//fgetc 當(dāng)讀取失敗的時候或者遇到文件結(jié)束的時候,都會返回EOF
while ((c = fgetc(fp)) != EOF) // 標(biāo)準(zhǔn)C I/O讀取文件循環(huán)
{
putchar(c);
}
//判斷是什么原因結(jié)束的
if (ferror(fp))
puts("I/O error when reading");
else if (feof(fp))
puts("End of file reached successfully");
fclose(fp);
}
二進制文件
enum { SIZE = 5 };
int main()
{
double a[SIZE] = { 1.,2.,3.,4.,5. };
FILE* fp = fopen("test.bin", "wb"); // 必須用二進制模式
fwrite(a, sizeof * a, SIZE, fp); // 寫 double 的數(shù)組
fclose(fp);
double b[SIZE];
fp = fopen("test.bin", "rb");
size_t ret_code = fread(b, sizeof * b, SIZE, fp); // 讀 double 的數(shù)組
if (ret_code == SIZE) {
puts("Array read successfully, contents: ");
for (int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
putchar('\n');
}
else { // error handling
if (feof(fp))
printf("Error reading test.bin: unexpected end of file\n");
else if (ferror(fp)) {
perror("Error reading test.bin");
}
}
fclose(fp);
}
7. 文件緩沖區(qū)
ANSIC 標(biāo)準(zhǔn)采用**“緩沖文件系統(tǒng)”處理的數(shù)據(jù)文件,所謂緩沖文件系統(tǒng)是指系統(tǒng)自動地在內(nèi)存中為程序中每一個正在使用的文件開辟一塊“文件緩沖區(qū)”**。從內(nèi)存向磁盤輸出數(shù)據(jù)會先送到內(nèi)存中的緩沖區(qū),裝滿緩沖區(qū)后才一起送到磁盤上。如果從磁盤向計算機讀入數(shù)據(jù),則從磁盤文件中讀取數(shù)據(jù)輸入到內(nèi)存緩沖區(qū)(充滿緩沖區(qū)),然后再從緩沖區(qū)逐個地將數(shù)據(jù) 送到程序數(shù)據(jù)區(qū)(程序變量等)。緩沖區(qū)的大小根據(jù)C編譯系統(tǒng)決定的。

刷新緩沖區(qū)的意思就是為了立馬看到緩沖區(qū)里的東西,不用再積累到滿再輸出
測試代碼,下面的這個代碼其實就是在說在Sleep的時候程序是寫數(shù)據(jù)時先寫到緩沖區(qū)中,當(dāng)主動刷新的時候就會把數(shù)據(jù)從緩沖區(qū)寫入硬盤,主動刷新可以使用函數(shù)fflush,當(dāng)然再關(guān)閉文件的時候其實也是會自動刷新的,所以關(guān)閉文件很重要,Java文件操作也是要關(guān)閉文件
#include <stdio.h>
#include <windows.h>
//VS2013 WIN10環(huán)境測試
int main()
{
FILE* pf = fopen("test.txt", "w");
fputs("abcdef", pf);//先將代碼放在輸出緩沖區(qū)
printf("睡眠10秒-已經(jīng)寫數(shù)據(jù)了,打開test.txt文件,發(fā)現(xiàn)文件沒有內(nèi)容\n");
Sleep(10000);
printf("刷新緩沖區(qū)\n");
fflush(pf);//刷新緩沖區(qū)時,才將輸出緩沖區(qū)的數(shù)據(jù)寫到文件(磁盤)
//注:fflush 在高版本的VS上不能使用了
printf("再睡眠10秒-此時,再次打開test.txt文件,文件有內(nèi)容了\n");
Sleep(10000);
fclose(pf);
//注:fclose在關(guān)閉文件的時候,也會刷新緩沖區(qū)
pf = NULL;
return 0;
}
7.1 行緩沖
倘若是這樣的代碼在Linux中的話會一直無輸出直到緩沖區(qū)滿

倘若加了’\n’的話就是行緩沖,會直接打印出來


小結(jié):
因為有緩沖區(qū)的存在,C語言在操作文件的時候,需要做刷新緩沖區(qū)或者在文件操作結(jié)束的時候關(guān)閉文件。
如果不做,可能導(dǎo)致讀寫文件的問題。
總結(jié)
本篇文章就到這里了,希望能夠給你帶來幫助,也希望您能夠多多關(guān)注腳本之家的更多內(nèi)容!
相關(guān)文章
使用設(shè)計模式中的單例模式來實現(xiàn)C++的boost庫
這篇文章主要介紹了使用設(shè)計模式中的單例模式來實現(xiàn)C++的boost庫的方法,其中作者對線程安全格外強調(diào),需要的朋友可以參考下2016-03-03

