用C語言實現了對英文文章中單詞頻率的統計，得到出現最多的前十個！

本文轉載自查看原文 2014-03-02 13:16 4261

這是一道我們軟件工程的個人作業，得到了這個題目，我第一個念頭就是用C語言來編寫，畢竟別的語言不太精通只能選擇C語言！

程序說明：對於這個問題我的理解就是要通過結構體來實現對單詞和出現次數的統計，先將文章讀入，然后通過每次讀入一個字符來判斷它是否是字母，如果不是字母，那么就說明一個單詞已經結束了，通過這樣來確定單詞的結束！通過將單詞存入一個緩沖的數組，然后再和結構體的數組進行對比，如果單詞有重復，那就將該單詞出現的次數加一，如果沒有出現，那就繼續運行！最后通過一個冒泡排序算法，將A[i].num從大到小排序，最后輸出出現字數最多的前十個！

程序代碼：

#include "stdafx.h"

#include "stdio.h"

#include "string.h"

struct word

{

char str[30]; //單詞

int num; //單詞出現的次數

}A[1000];

int sum; //單詞的總個數

void chuli(char s[])

{

int i,j;

int flag=0; //flag為零時沒有重復的

for(i=0;i<=sum;i++)

{

if(strcmp(A[i].str,s)==0)

{

A[i].num++;

flag=1;

sum++;

}

if(flag==0)

{

for(j=0;j<30;j++)

A[sum].str[j]=s[j];

A[sum].num++;

sum++;

}

void paixu()

{

int i,j;

struct word a;

for(i=0;i<sum;i++)

{

for(j=i+1;j<sum;j++)

if(A[i].num<A[j].num)

{

a=A[j];

A[j]=A[i];

A[i]=a;

}

int main()

{

char ch,s[30];

int i,flag=0;

FILE *fp;

fp=fopen("d:\\a.txt","r");

if(fp==NULL)

{

printf("此文件不存在！\n");

}

sum=0;

ch=NULL;

for(i=0;i<1000;i++)

A[i].num=0;

while(ch!=-1)

{

for(i=0;i<30;i++)

s[i]='\0';

ch=fgetc(fp);

if((65<=ch&&ch<=90)||(ch>=97&&ch<=122))

{

for(i=0;;i++)

{

s[i]=ch;

ch=fgetc(fp);

if((65<=ch&&ch<=90)||(ch>=97&&ch<=122))continue;

else break;

}

chuli(s);

}

paixu();

printf("該文章共有：%d個單詞\n",sum);

printf("該文章中單詞出現頻率最高的前十個從小到大依次為：\n");

for(i=0;i<10;i++)

printf("%s出現次數為：%d\n",A[i].str,A[i].num);

return 0;

}

程序不足：區分了單詞的大小寫，因為有些單詞的首字母是否大寫表示的單詞意思不同，我就將這中情況看做不同的單詞！

程序截圖：

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 統計一篇英文文章內每個單詞出現頻率，並返回出現頻率最高的前10個單詞及其出現次數算法題：讀入一篇英文文章，統計其中的單詞，並得到每個單詞出現的次數【shell腳本實例】shell腳本統計單詞頻率、出現次數最多的n個單詞對英文文檔中的單詞與詞組進行頻率統計單詞統計_統計文章中每個單詞出現的頻率統計一篇英文文章中的單詞數 c語言實現詞頻統計 C語言數據結構統計英文文字每個“單詞”出現次數基於java：讀寫一個英文的txt文件，記錄單詞個數，並輸出十個出現最多的單詞及出現的個數； java實現文件單詞頻率統計