欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

詳解C語言讀取文件求某一列的平均值

 更新時間:2022年02月15日 10:47:24   作者:hxj7  
本文粗淺比較了C語言中常用的幾種讀取文件的函數(shù)的效率,并給出了幾段求取某列平均值的代碼,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多度進步

第一部分:比較讀取文件的效率

在之前的文章《生信(五)awk求取某一列的平均值》中,筆者曾經(jīng)給出過C語言求取某列平均值的代碼,但是最近回顧時發(fā)現(xiàn),這段代碼至少有幾點不足:

1. 利用 fgetc 函數(shù)來讀取文件,現(xiàn)在看來效率不高。

2. 如果文件最后沒有一個空白行的話,會陷入無限循環(huán)。也就是對 EOF 的處理不完善。

大家都知道,C語言讀取文件的常用函數(shù)有 fgetc、fgets、fread 以及 fscanf 等。筆者曾經(jīng)一度以為就讀取文件的效率而言,fgetc 不亞于其他函數(shù)。但是究竟是不是這樣,還是自己驗證一下讓自己信服。

首先隨機生成一個文件,1000萬行,4列(該文件下面還會用到)。我們看一下上述函數(shù)讀取文件的效率:

在這里插入圖片描述

從上圖中可以看出,fread 的效率最高,fgetc 的效率最低。當然這種比較很粗淺,但是能大概看出趨勢。

各個函數(shù)讀取文件的代碼如下:其中 main 函數(shù)是一樣的,只是 readFile 函數(shù)的實現(xiàn)不同。

    #include <stdio.h>
    #include <stdlib.h>
    #include <time.h>
    #define BUFSIZE 4096
    
    void readFile(FILE* fp);
    
    int main(int argc, char* argv[]) {
      FILE *fp;
      time_t start, end;
      start = time(NULL);
      if (argc < 2) {
        printf("Usage: %s <filename>\n", argv[0]);
        return 1;
      }
      if ((fp = fopen(argv[1], "r")) == NULL) {
        printf("Error: cannot open file\n");
        return 1;
      }
      readFile(fp);
      fclose(fp);
      end = time(NULL);
      printf("time spent: %d seconds\n", end - start);
      return 0;
    }
    // readFile_fgetc:
    void readFile(FILE* fp) {
      char c;
      while ((c = fgetc(fp)) != EOF)
        ;
    }
    // readFile_fgets:
    void readFile(FILE* fp) {
      char buf[BUFSIZE];
      while (fgets(buf, MAXLINE, fp) != NULL)
        ;
    }
    // readFile_fread:
    void readFile(FILE* fp) {
      char buf[BUFSIZE];
      while (fread(buf, 1, BUFSIZE, fp) > 0)
        ;
    }
    // readFile_fscanf:
    void readFile(FILE* fp) {
      char buf[BUFSIZE];
      while (fscanf(fp, " %[^\n]s", buf) == 1)
        ;
    }

第二部分:比較求取列平均值的效率

那么各個函數(shù)計算列平均值的效率如何呢?我們依然使用上面那1000萬行的文件,用上述各個函數(shù)實現(xiàn)計算第2列平均數(shù)的功能,它們的效率如下:

在這里插入圖片描述


代碼如下:main 函數(shù)大體上是一樣的,只是 colAver 函數(shù)的實現(xiàn)不一樣。
(這些代碼完善地處理了EOF,無論文件最后是否有空白行都可以正確運行。但是仍然有前提,就是文件中每一行的分隔符(列數(shù))是一樣的,否則代碼可能會出錯。)
這些代碼中,fscanf 的最簡短,該函數(shù)可以大大提高格式化讀取數(shù)據(jù)的編程效率。

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#define BUFSIZE 4096
void getColAver(FILE* fp, const int k);
 int main(int argc, char* argv[]) {
   FILE *fp;
   time_t start, end;
   start = time(NULL);
   if (argc < 2) {
     printf("Usage: %s <filename>\n", argv[0]);
     return 1;
   }
   if ((fp = fopen(argv[1], "r")) == NULL) {
     printf("Error: cannot open file\n");
     return 1;
   }
   getColAver(fp, 2);
   fclose(fp);
   end = time(NULL);
   printf("time spent: %d seconds\n", end - start);
   return 0;
 }
 // colAver_fgetc:
 void getColAver(FILE* fp, const int k) {
   int i = 0;  // num of '\t'
   int j = 0;  // num of chars
   int c;  // char
   char col[50];
   float sum = 0;
   int n = 0;  // num of lines.
   int inCol = 0;
   while ((c = fgetc(fp)) != EOF) {
     if (i == k - 1) {
       inCol = 1;
       if (c == '\t') i++;
       else if (c == '\n') i = 0;
       else col[j++] = c;
     } else {
       if (c == '\t') i++;
       else if (c == '\n') i = 0;
       if (inCol) {
         col[j] = '\0';
         sum += atof(col);
         n++;
       }
       j = 0;
       inCol = 0;
     }
   }
   if (inCol) {
     col[j] = '\0';
     sum += atof(col);
     n++;
   }
   if (n == 0) printf("Error: no line!\n");
   else printf("The average of col %d is %f\n", k, sum / n);
 }
 // colAver_fgets:
 void getColAver(FILE* fp, const int k) {
   int i = 0;  // num of '\t'
   int j = 0;  // num of chars
   char col[50];
   char buf[BUFSIZE];
   float sum = 0;
   int n = 0;  // num of lines.
   int inCol = 0;
   char* p;
   while (fgets(buf, BUFSIZE, fp) != NULL) {
     for (p = buf; *p != '\0'; p++) {
       if (i == k - 1) {
         inCol = 1;
         if (*p == '\t') i++;
         else if (*p == '\n') i = 0;
         else col[j++] = *p;
       } else {
         if (*p == '\t') i++;
         else if (*p == '\n') i = 0;
         if (inCol) {
           col[j] = '\0';
           sum += atof(col);
           n++;
         }
         j = 0;
         inCol = 0;
       }
     }
   }
   if (inCol) {
     col[j] = '\0';
     sum += atof(col);
     n++;
   }
   if (n == 0) printf("Error: no line!\n");
   else printf("The average of col %d is %f\n", k, sum / n);
 }
 // colAver_fread:
 void getColAver(FILE* fp, const int k) {
   int i = 0;  // num of '\t'
   int j = 0;  // num of chars
   char col[50];
   char buf[BUFSIZE];
   float sum = 0;
   int n = 0;  // num of lines.
   int m, l;
   int sizeChr = sizeof(char);
   int inCol = 0;
   while ((l = fread(buf, sizeChr, BUFSIZE, fp)) > 0) {
     for (m = 0; m < l; m++) {
       if (i == k - 1) {
         inCol = 1;
         if (buf[m] == '\t') i++;
         else if (buf[m] == '\n') i = 0;
         else col[j++] = buf[m];
       } else {
         if (buf[m] == '\t') i++;
         else if (buf[m] == '\n') i = 0;
         if (inCol) {
           col[j] = '\0';
           sum += atof(col);
           n++;
         }
         j = 0;
         inCol = 0;
       }
     }
   }
   if (inCol) {
     col[j] = '\0';
     sum += atof(col);
     n++;
   }
   if (n == 0) printf("Error: no line!\n");
   else printf("The average of col %d is %f\n", k, sum / n);
 }
 // colAver_fscanf:
 void getColAver(FILE* fp) {
   float f;
   float sum = 0;
   int n = 0;  // num of lines.
   while (fscanf(fp, "%*s%f%*[^\n]s", &f) == 1) {
     sum += f;
     n++;
   }
   if (n == 0) printf("Error: no line!\n");
   else printf("The average of col 2 is %f\n", sum / n);
 }

以上就是詳解C語言讀取文件求某一列的平均值的詳細內(nèi)容,更多關(guān)于C語言讀取文件求某一列的平均值的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • C語言實現(xiàn)火車票管理系統(tǒng)

    C語言實現(xiàn)火車票管理系統(tǒng)

    這篇文章主要為大家詳細介紹了C語言實現(xiàn)火車票管理系統(tǒng),文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-03-03
  • C語言實現(xiàn)三子棋小游戲全程詳解

    C語言實現(xiàn)三子棋小游戲全程詳解

    完成一個三子棋的代碼并不是很難,有困難且重要的是完成這個游戲代碼所具備的思想,因為思想上的進步才是真正的進步,當我們有了這個思想上的武器,寫出別的代碼,難度就不會高
    2022-05-05
  • C++ Boost Flyweight庫使用介紹

    C++ Boost Flyweight庫使用介紹

    Boost是為C++語言標準庫提供擴展的一些C++程序庫的總稱。Boost庫是一個可移植、提供源代碼的C++庫,作為標準庫的后備,是C++標準化進程的開發(fā)引擎之一,是為C++語言標準庫提供擴展的一些C++程序庫的總稱
    2022-12-12
  • 基于C語言實現(xiàn)的aes256加密算法示例

    基于C語言實現(xiàn)的aes256加密算法示例

    這篇文章主要介紹了基于C語言實現(xiàn)的aes256加密算法,結(jié)合具體實例形式詳細分析了C語言實現(xiàn)的aes256加密算法實現(xiàn)步驟與使用技巧,需要的朋友可以參考下
    2017-02-02
  • 淺析C++中的函數(shù)重載

    淺析C++中的函數(shù)重載

    這篇文章主要介紹了淺析C++中的函數(shù)重載,在C++中,可以為兩個或兩個以上的函數(shù)提供相同的函數(shù)名稱,只要參數(shù)類型不同,或者參數(shù)類型相同而參數(shù)個數(shù)不同,又或者參數(shù)類型參數(shù)個數(shù)相同,參數(shù)次序不同,稱為函數(shù)重載,需要的朋友可以參考下
    2023-08-08
  • C++代碼實現(xiàn)雙向鏈表

    C++代碼實現(xiàn)雙向鏈表

    這篇文章主要為大家詳細介紹了C++代碼實現(xiàn)雙向鏈表,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-05-05
  • Qt如何自定義滑動條

    Qt如何自定義滑動條

    這篇文章主要介紹了Qt如何自定義滑動條問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-11-11
  • C++構(gòu)造函數(shù)和析構(gòu)函數(shù)的使用與講解

    C++構(gòu)造函數(shù)和析構(gòu)函數(shù)的使用與講解

    今天小編就為大家分享一篇關(guān)于C++構(gòu)造函數(shù)和析構(gòu)函數(shù)的使用與講解,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2018-12-12
  • c語言與c++基礎知識點(必看)

    c語言與c++基礎知識點(必看)

    下面小編就為大家?guī)硪黄猚語言與c++基礎知識點(必看)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2016-07-07
  • C++實現(xiàn)LeetCode(兩個有序數(shù)組的中位數(shù))

    C++實現(xiàn)LeetCode(兩個有序數(shù)組的中位數(shù))

    這篇文章主要介紹了C++實現(xiàn)LeetCode(兩個有序數(shù)組的中位數(shù)),本篇文章通過簡要的案例,講解了該項技術(shù)的了解與使用,以下就是詳細內(nèi)容,需要的朋友可以參考下
    2021-07-07

最新評論