哈夫曼树的构建及应用


哈夫曼树,又称最优树,是一类带权路径最短的树。

哈夫曼树和哈夫曼的存储表示:

typedef struct{ unsigned int weight; unsigned int parent,lchild,rchild; }HTNode,*HuffmanTree;//动态分配数组存储哈夫曼树
typedef char **HuffmanCode;//动态分配数组存储哈夫曼编码表

应用:

【问题描述】

利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。但是,这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站写一个哈夫曼的编/译码系统。

【基本要求】

一个完整的系统应具有以下功能:

(1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。

(2) E:编码(Encoding)。利用以建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。

(3) D:译码(Decoding)。利用已经建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件TextFile中。

(4) P:打印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码,同时将此字符形式的编码写入文件CodePrint中。

(5) T:打印哈夫曼树(Tree printing)。将已经在内存中的哈夫曼树以直观的方式(树或凹入表形式)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint中。

【测试数据】

(1) 利用教科书例6-2中的数据调试程序。

(2) 用下表给出的字符集和频度的实际统计数据建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAM IS MY FAVORITE”。

字符

       A     B    C    D     E    F    G    H    I    J    K     L    M

频度

186   64    13    22   32  103    21   15   47   57   1    5     32   20

字符

N     O     P    Q    R     S    T    U    V    W    X    Y     Z

频度

57    63    15    1    48    51   80   23   8    18   1    16    1

【实现提示】

(1) 编码结果以文本式存储在文件CodeFile中。

(2) 用户界面可以设计为“菜单”方式:显示上述功能符号,再加上“Q”,表示退出运行Quit。请用户键入一个选择功能符。此功能执行完毕后再显示此菜单,直至某次用户选择了“Q”为止。

(3) 在程序的一次执行过程中,第一次执行I,D或C命令之后,哈夫曼树已经在内存了,不必再读入。每次执行中不一定执行I命令,因为文件hfmTree可能早已建好。

【选作内容】

(1) 上述文件CodeFile中的每个“0”或“1”实际上占用了一个字节的空间,只起到示意或模拟的作用。为最大限度地利用码点存储能力,试改写你的系统,将编码结果以二进制形式存放在文件CodeFile中。

(2) 修改你的系统,实现对你的系统的源程序的编码和译码(主要是将行尾符编/译码问题)。

(3) 实现各个转换操作的源/目的文件,均由用户在选择此操作时指定。

#include<iostream.h>
//using namespace std;
#include<stdio.h> #include<string.h> #include<stdlib.h> #include<fstream.h>
#define num 1000 typedef struct//哈夫曼树的结构体
{ char ch; int weight;//权值
    int parent,lchild,rchild; }HTNode,*HuffmanTree; typedef char **HuffmanCode; void Select(HuffmanTree &HT,int a,int *p1,int *p2) //Select函数,选出HT树到a为止,权值最小且parent为0的2个节点
{ int i,j,x,y,count,temp; for(j=1,count=1;j<=a;j++) { if(HT[j].parent==0) { if(count==1) x=j; if(count==2) y=j; count++; } if(count>2) break; } if(HT[x].weight>HT[y].weight)//令x结点权值小于y结点权值
 { temp=y; y=x; x=temp; } i=(x>y?x:y)+1; while(i<=a) { if(HT[i].parent==0) { if(HT[i].weight<HT[x].weight) { y=x; x=i; } else { if(HT[i].weight>=HT[x].weight&&HT[i].weight<HT[y].weight) y=i; } } i++; } *p1=HT[x].weight<=HT[y].weight?x:y; *p2=HT[x].weight>HT[y].weight?x:y; } void HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int n)//构建赫夫曼树HT,并求出n个字符的赫夫曼编码HC
{ int i,start,c,f,m,w; int p1,p2; char *cd,z; if(n<=1) exit(1); m=2*n-1;//n个叶子结点的哈夫曼树共有2n-1个结点
    HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));//0号单元未使用
    for(i=1;i<=n;i++)//初始化n个叶子结点
 { printf("请输入第%d字符信息和权值:",i); scanf("%c%d",&z,&w); while(getchar()!='\n') { continue; } HT[i].ch=z; HT[i].weight=w; HT[i].parent=0; HT[i].lchild=0; HT[i].rchild=0; } for(i=n+1;i<=m;i++)//初始化其余结点
 { HT[i].ch='0'; HT[i].weight=0; HT[i].parent=0; HT[i].lchild=0; HT[i].rchild=0; } for(i=n+1;i<=m;i++)//建立哈夫曼树
 { Select(HT,i-1,&p1,&p2); HT[p1].parent=i;HT[p2].parent=i; HT[i].lchild=p1;HT[i].rchild=p2; HT[i].weight=HT[p1].weight+HT[p2].weight; } //从叶子到根逆向求每个字符的哈夫曼编码
    HC=(HuffmanCode)malloc((n+1)*sizeof(char *)); cd=(char *)malloc(n*sizeof(char)); cd[n-1]='\0'; for(i=1;i<=n;i++) { start =n-1; for(c=i,f=HT[i].parent;f!=0;c=f,f=HT[f].parent) { if(HT[f].lchild==c) cd[--start]='0'; else cd[--start]='1'; } HC[i]=(char *)malloc((n-start)*sizeof(char)); strcpy(HC[i],&cd[start]); } free(cd); } int main() { char code[100],h[100],hl[100]; int n,i,j,k,l; ifstream input_file; ofstream output_file; FILE *fp1,*fp2,*fp3,*fp4,*fp5; char choice,str[100]; HuffmanTree HT; HuffmanCode HC; cout<<" 哈夫曼编码器\n"; while(choice!='Q'&&choice!='q')            //当choice的值不为q且不为Q时循环
 { cout<<"功能: "<<"I(初始化)"<<""<<"E(编码)"<<""<<"D(译码)"<<""<<"P(打印)"<<""<<"Q(退出)\n"; cout<<"请输入您要选择的功能:"; cin>>choice; if(choice=='I'||choice=='i')              //初始化赫夫曼树
 { cout<<"请输入字符个数:"; cin>>n; HuffmanCoding(HT,HC,n); for(i=1;i<=n;++i) { cout<<HT[i].ch<<":"<<HC[i]<<endl; } fp1=fopen("hfmTree.txt","w"); for(i=1;i<=n;++i) { fprintf(fp1,"(%c %s)\n",HT[i].ch,HC[i]); } fclose(fp1); cout<<"赫夫曼树已经创建完毕,并且已经放入hfmTree.txt文件中!"<<endl; } else if(choice=='E'||choice=='e')           //进行编码,并将字符放入ToBeTran.txt,码值放入CodeFile.txt中
 { printf("请输入字符:"); gets(str); fp2=fopen("ToBeTran.txt","w"); fprintf(fp2,"%s",str); fclose(fp2); fp3=fopen("CodeFile.txt","w"); for(i=0;i<strlen(str);i++){ for(j=1;j<=n;++j) { if(HT[j].ch==str[i]) { fprintf(fp3,"%s",HC[j]); break; } } } fclose(fp3); cout<<"\n"; fp4=fopen("CodeFile.txt","r"); char H1;//从CodeFile.txt中读入编码,输出在终端
            cout<<"编码值为:\n"; while(!feof(fp4)) { H1=fgetc(fp4); cout<<H1; } fclose(fp4); cout<<"\n编码完毕,并且已经存入CodeFile.txt文件!\n"; } else if(choice=='D'||choice=='d')     //读入CodeFile.txt中的编码进行译码,将译出来的字符放入Textfile.txt中
 { input_file.open("CodeFile.txt"); if(!input_file){ cout<<"can't open file!"<<endl; return 1; } input_file>>h; input_file.close(); output_file.open("Textfile.txt"); if(!output_file) { cout<<"can't open file!"<<endl; return 1; } k=0; while(h[k]!='\0')           //先用编码中的前几个和字符的编码相比较,然后往后移
 { for(i=1;i<=n;i++){ l=k; for(j=0;j<strlen(HC[i]);j++,l++) { hl[j]=h[l]; } hl[j]='\0'; if(strcmp(HC[i],hl)==0) { output_file<<HT[i].ch; k=k+strlen(HC[i]); break; } } } output_file.close(); input_file.open("Textfile.txt"); if(!input_file){ cout<<"can't open file!"<<endl; return 1; } // input_file>>h;
            input_file.getline(h,100);//获取文件里的一行
            cout<<"译码结果为:"; printf("%s\n",h); input_file.close(); cout<<"译码结果已存入Textfile.txt中\n"; } else if(choice=='P'||choice=='p')//每行50个代码
 { char a[num]; fp4=fopen("CodeFile.txt","r"); fgets(a,num,fp4); cout<<"打印代码文件:"<<endl; int l=strlen(a); for(int j=0;j<l;j++) { cout<<a[j]; if((j+1)%50==0) cout<<endl; } fclose(fp4); fp5=fopen("CodePrint.txt","w"); for(int k=0;k<l;k++) { fprintf(fp5,"%c",a[k]); if((k+1)%50==0) { fprintf(fp5,"\n"); } } cout<<"\n该字符形式已存入CodePrint.txt中\n"; fclose(fp5); } else if(choice=='Q'||choice=='q')            //退出程序
 { exit(0); } else               //如果选了选项之外的就让用户重新选择
 { cout<<"您没有输入正确的步骤,请重新输入!"<<endl; } cout<<endl; } return 0; }

用上的几个文本需要自己新建。


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM