欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

c語言實(shí)現(xiàn)詞頻統(tǒng)計的簡單實(shí)例

 更新時間:2016年09月06日 14:44:04   投稿:jingxian  
下面小編就為大家?guī)硪黄猚語言實(shí)現(xiàn)詞頻統(tǒng)計的簡單實(shí)例。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧

需求:

1.設(shè)計一個詞頻統(tǒng)計軟件,統(tǒng)計給定英文文章的單詞頻率。

2.文章中包含的標(biāo)點(diǎn)不計入統(tǒng)計。

3.將統(tǒng)計結(jié)果以從大到小的排序方式輸出。

設(shè)計:

1.因?yàn)槭强鐚I(yè)0.0···并不會c++和java,只能用僅學(xué)過的C語言進(jìn)行編寫,還是挺費(fèi)勁的。

2.定義一個包含單詞和頻率兩個成員的結(jié)構(gòu)體來統(tǒng)計詞頻(進(jìn)行了動態(tài)分配內(nèi)存,可以處理較大文本)。

3.使用fopen函數(shù)讀取指定的文檔。

4.使用fgetc函數(shù)獲取字符,再根據(jù)取得的字符是否是字母進(jìn)行不同的處理。

5.采用快速排序法對統(tǒng)計結(jié)果進(jìn)行排序。

5.將整個統(tǒng)計結(jié)果循環(huán)輸出。

部分代碼:

結(jié)構(gòu)體定義:

struct fre_word
{
  int num;
  char a[18];
}; 

分配初始內(nèi)存:

struct fre_word *w;
  w=(struct fre_word *)malloc(100*p*sizeof(struct fre_word));//給結(jié)構(gòu)體分配初始內(nèi)存

讀取文本:

printf("輸入讀入文件的名字:");
  scanf("%s", filename);                   //輸入需要統(tǒng)計詞頻的文件名
  if((fp=fopen(filename, "r"))==NULL)
  {
    printf("無法打開文件\n");
    exit(0);
  }

單詞匹配:

/****************將單詞出現(xiàn)次數(shù)設(shè)置為1****************************/
  for(i=0;i<100;i++)
  {  
    (w+i)->num=1;
  }
/****************單詞匹配****************************************/
  i=0;
  while(!feof(fp))//文件尚未讀取完畢
  {
    ch=fgetc(fp);
    (w+i)->a[j]='\0';
    if(ch>=65&&ch<=90||ch>=97&&ch<=122)              //ch若為字母則存入
    {
      (w+i)->a[j]=ch;
      j++;
      flag=0;                         //設(shè)標(biāo)志位判斷是否存在連續(xù)標(biāo)點(diǎn)或者空格
    }
    else if(!(ch>=65&&ch<=90||ch>=97&&ch<=122)&&flag==0)    //ch若不是字母且上一個字符為字母
    {    
      i++;
      j=0;
      flag=1;
      for(m=0;m<i-1;m++)                  //匹配單詞,若已存在則num+1
      {
        if(stricmp((w+m)->a,(w+i-1)->a)==0)
        {
          (w+m)->num++;
          i--;
        }
      }
    }
/****************動態(tài)分配內(nèi)存****************************************/
    if(i==(p*100))                           //用i判斷當(dāng)前內(nèi)存已滿
    {
      p++;
      w=(struct fre_word*)realloc(w,100*p*(sizeof(struct fre_word)));
      for(n=i;n<=100*p;n++)                      //給新分配內(nèi)存的結(jié)構(gòu)體賦初值
        (w+n)->num=1;

    }
  }

快速排序:

void quick(struct fre_word *f,int i,int j) 
{
  int m,n,temp,k;
  char b[18]; 
  m=i; 
  n=j; 
  k=f[(i+j)/2].num;              //選取的參照
  do 
  { 
    while(f[m].num>k&&m<j) m++;       // 從左到右找比k小的元素
    while(f[n].num<k&&n>i) n--;       // 從右到左找比k大的元素 
    if(m<=n) 
    {                    //若找到且滿足條件,則交換 
      temp=f[m].num;
      strcpy(b,f[m].a);
      f[m].num=f[n].num; 
      strcpy(f[m].a,f[n].a);
      f[n].num=temp; 
      strcpy(f[n].a,b);
      m++; 
      n--; 
    } 
  }
  while(m<=n); 
  if(m<j) quick(f,m,j);           //運(yùn)用遞歸
  if(n>i) quick(f,i,n); 
}

結(jié)果輸出:

for(n=0;n<=i;n++)
  {
    printf("文檔中出現(xiàn)的單詞:");
    printf("%-18s",(w+n)->a);
    printf("其出現(xiàn)次數(shù)為:");
    printf("%d\n",(w+n)->num);
  }

測試用例:

看了之前同學(xué)的博客以及老師的評論,就使用了較長的文本進(jìn)行測試,用的是奧巴馬就職演講稿。

部分測試結(jié)果:

以上這篇c語言實(shí)現(xiàn)詞頻統(tǒng)計的簡單實(shí)例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • 淺析C++中的虛函數(shù)

    淺析C++中的虛函數(shù)

    以下是對C++中的虛函數(shù)進(jìn)行了詳細(xì)的分析介紹,需要的朋友可以過來參考下
    2013-08-08
  • C++野指針和懸空指針的實(shí)現(xiàn)方法

    C++野指針和懸空指針的實(shí)現(xiàn)方法

    野指針和懸空指針是指針中常見的兩個概念,本文詳細(xì)的介紹了這兩種的使用,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2021-08-08
  • C++讀取注冊表的實(shí)現(xiàn)方法

    C++讀取注冊表的實(shí)現(xiàn)方法

    這篇文章主要介紹了C++讀取注冊表的實(shí)現(xiàn)方法的相關(guān)資料,希望通過本文能幫助到大家,讓大家理解掌握實(shí)現(xiàn)這樣的功能,需要的朋友可以參考下
    2017-10-10
  • 數(shù)據(jù)結(jié)構(gòu)課程設(shè)計- 解析最少換車次數(shù)的問題詳解

    數(shù)據(jù)結(jié)構(gòu)課程設(shè)計- 解析最少換車次數(shù)的問題詳解

    數(shù)據(jù)結(jié)構(gòu)課程設(shè)計- 解析最少換車次數(shù)的問題詳解
    2013-05-05
  • C++ deque與vector對比的優(yōu)缺點(diǎn)

    C++ deque與vector對比的優(yōu)缺點(diǎn)

    這篇文章主要介紹了C++中deque與vector相比的優(yōu)勢與劣勢,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)吧
    2023-01-01
  • Qt編寫地圖實(shí)現(xiàn)實(shí)時動態(tài)軌跡效果

    Qt編寫地圖實(shí)現(xiàn)實(shí)時動態(tài)軌跡效果

    實(shí)時動態(tài)軌跡主要是需要在地圖上動態(tài)顯示GPS的運(yùn)動軌跡,也是編寫地圖時一個重要的功能。本文將利用Qt實(shí)現(xiàn)這一功能,需要的可以參考一下
    2022-02-02
  • 基于C語言實(shí)現(xiàn)簡單的掃雷小游戲

    基于C語言實(shí)現(xiàn)簡單的掃雷小游戲

    這篇文章主要為大家詳細(xì)介紹了基于C語言實(shí)現(xiàn)簡單的掃雷小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2021-11-11
  • C++之默認(rèn)參數(shù)詳解

    C++之默認(rèn)參數(shù)詳解

    這篇文章主要介紹了C++的默認(rèn)參數(shù),是C++入門學(xué)習(xí)中的基礎(chǔ)知識,需要的朋友可以參考下,希望能夠給你帶來幫助
    2021-11-11
  • C++ 類的賦值運(yùn)算符''''=''''重載的方法實(shí)現(xiàn)

    C++ 類的賦值運(yùn)算符''''=''''重載的方法實(shí)現(xiàn)

    這篇文章主要介紹了C++ 類的賦值運(yùn)算符'='重載的方法實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-02-02
  • C++中線程池ThreadPool源碼解析

    C++中線程池ThreadPool源碼解析

    線程池(threadpool)作為五大池之一(內(nèi)存池、連接池、線程池、進(jìn)程池、協(xié)程池),線程池的應(yīng)用非常廣泛,不管事客戶端程序還是后臺服務(wù)端,都是提高業(yè)務(wù)處理能力的必備模塊
    2022-09-09

最新評論