北邮数据结构实验 第四次实验 哈夫曼树

合集下载

数据结构实验哈夫曼树编码

数据结构实验哈夫曼树编码

实验四哈夫曼树编码一、实验目的1、掌握哈夫曼树的一般算法;2、掌握用哈夫曼树对字符串进行编码;3、掌握通过哈夫曼树对字符编码进行译码得过程。

二、实验基本要求1、设计数据结构;2、设计编码算法;3、分析时间复杂度和空间复杂度三、程序实现此程序中包含六个函数:Select()、HuffmanTree()、BianMa()、BianMa2()、YiMa()、Sum(),其功能及实现过程如下:#include <iostream.h>struct element//哈夫曼树结点类型{int weight;int lchild,rchild,parent;};struct Char//字符编码表信息{char node;int weight;char code[20];};void Select(element hT[],int &i1,int &i2,int k)//在hT[]中查找最小值及次小值{int min1=9999,min2=9999;i1=i2=0;for(int i=0;i<k;i++)if(hT[i].parent==-1)if(hT[i].weight<min1){min2=min1;i2=i1;min1=hT[i].weight;i1=i;}else if(hT[i].weight<min2){min2=hT[i].weight;i2=i;}}void HuffmanTree(element huffTree[],Char zifuma[],int n) //构建哈夫曼树{int i,k,i1,i2;for(i=0;i<2*n-1;i++) //初始化{huffTree[i].parent=-1;huffTree[i].lchild=-1;huffTree[i].rchild=-1;}for(i=0;i<n;i++) //构造n棵只含有根结点的二叉树huffTree[i].weight=zifuma[i].weight;for(k=n;k<2*n-1;k++) //n-1次合并{Select(huffTree,i1,i2,k); //在huffTree中找权值最小的两个结点i1和i2huffTree[i1].parent=k; //将i1和i2合并,则i1和i2的双亲是khuffTree[i2].parent=k;huffTree[k].weight=huffTree[i1].weight+huffTree[i2].weight;huffTree[k].lchild=i1;huffTree[k].rchild=i2;}}void BianMa(element huffTree[],Char zifuma[],int n)//根据哈夫曼树编码{int i,m,k,j,l;char temp[20];if(n==1){ zifuma[0].code[0]='0';zifuma[0].code[1]=0;}else {for(i=0;i<n;i++){j=0;k=huffTree[i].parent;l=i;while(k!=-1){if(huffTree[k].lchild==l)temp[j++]='0';else temp[j++]='1';l=k;k=huffTree[k].parent;}k=j-1;for(m=0;m<j;m++)zifuma[i].code[m]=temp[k--];zifuma[i].code[m]=0;}}void BianMa2(Char zifuma[],char zifu[],char bianma[],int n)//根据编码表对字符串编码{int i,j,k,m;i=k=0;while(zifu[i]){for(j=0;j<n;j++)if(zifu[i]==zifuma[j].node){m=0;while(zifuma[j].code[m])bianma[k++]=zifuma[j].code[m++];}i++;}bianma[k]=0;}void YiMa(element huffTree[],Char zifuma[],char bianma[],char yima[],int n)//根据编号的码元译成字符串{int i,j,k;i=j=0;if(n==1)while(bianma[i++])yima[j++]=zifuma[0].node;else{while(bianma[i]){k=2*(n-1);while(!(huffTree[k].lchild==-1&&huffTree[k].rchild==-1))if(bianma[i++]=='0')k=huffTree[k].lchild;elsek=huffTree[k].rchild;yima[j++]=zifuma[k].node;}}yima[j]=0;}void Sum(char zifu[],Char bianma[],int &n)//计算字符串中字符种类的个数及其出现次数{i=j=0;while(zifu[i]){for(int k=0;k<j;k++)if(bianma[k].node==zifu[i]){bianma[k].weight++;break;}if(k==j){bianma[j].node=zifu[i];bianma[j++].weight=1;}i++;}n=j;}void main(){int n,i;char a[50],b[200],c[50];element huffTree[100];Char w[50];cout<<"请输入需要编码的字符串:\n";cin.getline(a,49);Sum(a,w,n);cout<<"该字符串中共有"<<n<<"类字符。

数据结构(C语言版)实验报告(哈夫曼树)

数据结构(C语言版)实验报告(哈夫曼树)

《数据结构与算法》实验报告一、需求分析1.问题描述:利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。

但是,这要求在发送端通过一个编码系统对待传数据预先编码,在接收端将传来的数据进行译码(复原)。

对于双工通道(及可以双向传输信息的通道),每端都需要一个完整的编/译码系统。

试为这样的信息收发站写一个哈夫曼的编/译码系统。

2.基本要求一个完整的系统应具有以下功能:(1)I:初始化(Initialization)。

从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。

(2)E:编码(Encoding)。

利用已建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。

(3)D:译码(Decoding)。

利用已建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件TextFile中。

(4)P:印代码文件(Print)。

将文件CodeFile以紧凑格式显示在终端上,每行50个代码。

同时将此字符形式的编码文件写入文件CodePrin中。

(5)T:印哈夫曼树(Tree printing)。

将已在内存中的哈夫曼树以直观的方式(树或凹入表形式)显示出,同时将此字符形式的哈夫曼树写入文件TreePrint中。

3.测试数据(1)利用教科书例6-2中的数据调试程序。

(2)用下表给出的字符集和频度的实际统计数据建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAM IS MY FAVORITE”。

4,实现提示(1)编码结果以文本方式存储在文件CodeFile中。

(2)用户界面可以设计为“菜单”方式:显示上述功能符号,再加上“Q”表示退出运行Quit。

请用户键入一个选择功能符。

此功能执行完毕后再显示此菜单,直至某次用户选择了“Q”为止。

(3)在程序的一次执行过程中,第一次执行I、D或C命令之后,哈夫曼树已经在内存了,不必再读入。

北邮-数据结构-哈夫曼树报告

北邮-数据结构-哈夫曼树报告

数据结构欧阳学文实验报告实验名称:哈夫曼树学生姓名:袁普班级:211125班班内序号:14号学号:210681日期:12月1.实验目的和内容利用二叉树结构实现哈夫曼编/解码器。

基本要求:1、初始化(Init):能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立哈夫曼树2、建立编码表(CreateTable):利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。

3、编码(Encoding):根据编码表对输入的字符串进行编码,并将编码后的字符串输出。

4、译码(Decoding):利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。

5、打印(Print):以直观的方式打印哈夫曼树(选作)6、计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫曼编码的压缩效果。

7、可采用二进制编码方式(选作)测试数据:I love data Structure, I love Computer。

I will try my best to study data Structure.提示:1、用户界面可以设计为“菜单”方式:能够进行交互。

2、根据输入的字符串中每个字符出现的次数统计频度,对没有出现的字符一律不用编码2. 程序分析2.1 存储结构用struct结构类型来实现存储树的结点类型struct HNode{int weight; //权值int parent; //父节点int lchild; //左孩子int rchild; //右孩子};struct HCode //实现编码的结构类型{char data; //被编码的字符char code[100]; //字符对应的哈夫曼编码};2.2 程序流程2.3算法1:void Huffman::Count()[1] 算法功能:对出现字符的和出现字符的统计,构建权值结点,初始化编码表[2] 算法基本思想:对输入字符一个一个的统计,并统计出现次数,构建权值数组,[3] 算法空间、时间复杂度分析:空间复杂度O(1),要遍历一遍字符串,时间复杂度O(n)[4] 代码逻辑:leaf=0; //初始化叶子节点个数int i,j=0;int s[128]={0}; 用于存储出现的字符for(i=0;str[i]!='\0';i++) 遍历输入的字符串s[(int)str[i]]++; 统计每个字符出现次数for(i=0;i<128;i++)if(s[i]!=0){data[j]=(char)i; 给编码表的字符赋值weight[j]=s[i]; 构建权值数组j++;}leaf=j; //叶子节点个数即字符个数for(i=0;i<leaf;i++)cout<<data[i]<<"的权值为:"<<weight[i]<<endl;算法2:void Init();[1] 算法功能:构建哈弗曼树[2] 算法基本思想:根据哈夫曼树构建要求,选取权值最小的两个结点结合,新结点加入数组,再继续选取最小的两个结点继续构建。

数据结构——实验四哈夫曼树与哈夫曼编码

数据结构——实验四哈夫曼树与哈夫曼编码

软件学院哈夫曼树与哈夫曼编码实验报告课程名称:数据结构姓名:郑斌学号:201370034217班级:卓越131实验四哈夫曼树与哈夫曼编码一、实验目的1、使学生熟练掌握哈夫曼树的生成算法。

2、熟练掌握哈夫曼编码的方法。

二、实验内容本次实验提供3个题目,难度相当,学生可以根据自己的情况选做,其中题目一是必做题,其它选作!题目一、哈夫曼树和哈夫曼编码[问题描述]一电文,有若干个不同字符,要求从终端输入这些不同字符及其出现的频率,然后对这些字符进行哈夫曼编码,并输出。

[测试数据]利用教材P.148 例6-2中的数据调试程序 (可自己设定测试数据)。

[选作内容]1、打印出该哈夫曼树2、若从终端输入任意一段电文(假设仅为26个大小写英文字母),试编程高效地求出该段电文的哈夫曼编码。

提示:如何快速统计不同字符的出现频率3、译码:将上述1的编码结果还原成电文。

三、算法设计1)本程序包含三个模块1.void Select(HuffmanTree HT,int i,int &s1,int &s2)//选择函数2.voidHuffmanCoding(HuffmanTree&HT,HuffmanCode&HC,int *w,int n) w存放n个权值, 构造哈夫曼树p,3.Void Huffmancode(HuffmanTree &HT,HuffmanCode &HC,int n)求出哈夫曼编码hc并输出哈弗曼编码四、实验结果图1-1 输入哈弗曼树的权值图1-2 显示哈弗曼树表与其编码五、总结通过做哈弗曼树实验让对最优二叉树这种结构有了更深的了解和应用,对我以后的编程产生了比较深远的影响。

六、源程序(带注释)#include<iostream>#include<iomanip>#include<stdlib.h>#include<string.h>#include<stdio.h>using namespace std;typedef struct{int weight;int parent,lchild,rchild;char charr;}HTNode,*HuffmanTree;typedef char **HuffmanCode;void Select(HuffmanTree HT,int i,int &s1,int &s2){int j,k=1;while(HT[k].parent!=0)k++;s1=k;for(j=1;j<=i;++j)if(HT[j].parent==0&&HT[j].weight<HT[s1].weight)s1=j;k=1;while((HT[k].parent!=0||k==s1))k++;s2=k;for(j=1;j<=i;++j)if(HT[j].parent==0&&HT[j].weight<HT[s2].weight&&j!=s1)s2=j;}void HuffmanCoding(HuffmanTree &HT,int *w,int n){int m,i,s1,s2;if(n <= 1) return;m = 2 * n - 1;HT = (HuffmanTree)malloc((m + 1) * sizeof(HTNode));for(i = 1;i <= n;++i){HT[i].weight = w[i]; HT[i].lchild = 0;HT[i].rchild = 0; HT[i].parent = 0;}for(i = n + 1;i <= m;++i){HT[i].weight = 0; HT[i].lchild = 0;HT[i].rchild = 0; HT[i].parent = 0;}//构建哈弗曼树for(i = n + 1;i <= m;++i){Select(HT,i - 1,s1,s2);//选择parent为0且weight最小的两个结点,期序号分别为s1,s2HT[s1].parent = i; HT[s2].parent = i;HT[i].lchild = s1; HT[i].rchild = s2;HT[i].weight = HT[s1].weight + HT[s2].weight;}cout<<"\n哈弗曼树表如下:"<<endl;//打印哈弗曼树表cout<<" i weight parent lchild rchild"<<endl;HuffmanTree p;for(p=HT+1,i=1;i<=m;i++,p++)cout<<setw(2)<<i<<setw(7)<<p->weight<<setw(6)<<p->parent<<setw(7)<<p->l child<<setw(8)<<p->rchild<<endl;}void Huffmancode(HuffmanTree &HT,HuffmanCode &HC,int n){char *cd;int c,f,start;int i;HC = (HuffmanCode)malloc((n + 1) * sizeof(char *));cd = new char[n];cd[n - 1] = '\0';//编码结束标志for(i = 1;i <= n;++i){start = n - 1;for(c = i,f = HT[i].parent;f != 0;c = f,f =HT[f].parent){if(HT[f].lchild == c) cd[--start] = '0';else cd[--start] = '1';}HC[i] = (char *)malloc((n - start) * sizeof(char));strcpy(HC[i],&cd[start]);}cout << endl;cout<<"哈夫曼编码如下:";for(i=1;i<=n;++i)//逐个字符求赫夫曼编码{start=n-1;for(c=i,f=HT[i].parent;f!=0;c=f,f=HT[f].parent)//从叶子到根逆向求编码if(HT[f].lchild==c)cd[--start]='0';elsecd[--start]='1';HC[i]=(char*)malloc((n-start)*sizeof(char));//为第i个字符编码分配空间strcpy(HC[i],&cd[start]);//从cd复制编码到HCprintf("\nHT[%d] 节点的哈夫曼编码是: %s 对应权值为:%d",i,HC[i],HT[i].weight);}cout<<endl;free(cd);}int main(){HuffmanTree HT;HuffmanCode HC;int *w;char *e;char c;int i,n,m,wei;cout << "--请输入哈弗曼树的带权数目--" << endl;cin >> n;w = new int[n + 1];e = new char[n + 1];for(i = 1;i <= n;i++){cout << "--请输入第" << i << "个元素的权值--";cin >> wei;w[i] = wei;}HuffmanCoding(HT,w,n);m = 2 * n - 1;Huffmancode(HT,HC,n);return 0;}。

哈夫曼树_实验报告

哈夫曼树_实验报告

一、实验目的1. 理解哈夫曼树的概念及其在数据结构中的应用。

2. 掌握哈夫曼树的构建方法。

3. 学习哈夫曼编码的原理及其在数据压缩中的应用。

4. 提高编程能力,实现哈夫曼树和哈夫曼编码的相关功能。

二、实验原理哈夫曼树(Huffman Tree)是一种带权路径长度最短的二叉树,又称为最优二叉树。

其构建方法如下:1. 将所有待编码的字符按照其出现的频率排序,频率低的排在前面。

2. 选择两个频率最低的字符,构造一棵新的二叉树,这两个字符分别作为左右子节点。

3. 计算新二叉树的频率,将新二叉树插入到排序后的字符列表中。

4. 重复步骤2和3,直到只剩下一个节点,这个节点即为哈夫曼树的根节点。

哈夫曼编码是一种基于哈夫曼树的编码方法,其原理如下:1. 从哈夫曼树的根节点开始,向左子树走表示0,向右子树走表示1。

2. 每个叶子节点对应一个字符,记录从根节点到叶子节点的路径,即为该字符的哈夫曼编码。

三、实验内容1. 实现哈夫曼树的构建。

2. 实现哈夫曼编码和译码功能。

3. 测试实验结果。

四、实验步骤1. 创建一个字符数组,包含待编码的字符。

2. 创建一个数组,用于存储每个字符的频率。

3. 对字符和频率进行排序。

4. 构建哈夫曼树,根据排序后的字符和频率,按照哈夫曼树的构建方法,将字符和频率插入到哈夫曼树中。

5. 实现哈夫曼编码功能,遍历哈夫曼树,记录从根节点到叶子节点的路径,即为每个字符的哈夫曼编码。

6. 实现哈夫曼译码功能,根据哈夫曼编码,从根节点开始,按照0和1的路径,找到对应的叶子节点,即为解码后的字符。

7. 测试实验结果,验证哈夫曼编码和译码的正确性。

五、实验结果与分析1. 构建哈夫曼树根据实验数据,构建的哈夫曼树如下:```A/ \B C/ \ / \D E F G```其中,A、B、C、D、E、F、G分别代表待编码的字符。

2. 哈夫曼编码根据哈夫曼树,得到以下字符的哈夫曼编码:- A: 00- B: 01- C: 10- D: 11- E: 100- F: 101- G: 1103. 哈夫曼译码根据哈夫曼编码,对以下编码进行译码:- 00101110111译码结果为:BACGACG4. 实验结果分析通过实验,验证了哈夫曼树和哈夫曼编码的正确性。

(完整word版)哈夫曼树实验报告

(完整word版)哈夫曼树实验报告

实验报告1、实验目的:(1)理解哈夫曼树的含义和性质。

(2)掌握哈夫曼树的存储结构以及描述方法。

(3)掌握哈夫曼树的生成方法。

(4)掌握哈夫曼编码的一般方法,并理解其在数据通讯中的应用.2、实验内容:哈夫曼树与哈弗曼编码、译码a。

问题描述:哈夫曼问题的提出可以参考教材P。

145。

利用哈弗曼编码进行通信可以大大提高通信利用率,缩短信息传输时间,降低传输成本。

但是,这要求在发送端通过一个编码系统对待传数据预先编码,在接收端将传来的数据进行译码.b。

算法提示:参见教材P.147—148算法6.12、6。

13的描述.3、实验要求:建立哈夫曼树,实现编码,译码。

错误!.初始化(Initialization)。

从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。

○2。

编码(Encoding).利用已建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran 中的正文进行编码,然后将结果存入文件CodeFile中。

○3.译码(Decoding ).利用已建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件T extFile 中。

错误!.输出代码文件(Print).将文件CodeFile以紧凑格式显示在终端上,每行50个代码。

同时将此字符形式的编码文件写入文件CodePrint中。

错误!。

输出哈夫曼树(TreePrinting).将已在内存中的哈夫曼树以直观的方式(树或凹入表形式)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint中。

测试数据:设权值c= (a,b, c, d , e, f,g,h)w=(5,29,7,8,14,23,3,11),n=8。

按照字符‘0’或‘1’确定找左孩子或右孩子,则权值对应的编码为:5:0001,29:11,7:1110,8:111114:110,23:01,3:0000,11:001。

北邮-数据结构-哈夫曼树报告Word版

北邮-数据结构-哈夫曼树报告Word版

数据结构实验报告实验名称:哈夫曼树学生姓名:袁普班级:2013211125班班内序号:14号学号:2013210681日期:2014年12月实验目的和内容利用二叉树结构实现哈夫曼编/解码器。

基本要求:1、初始化(Init):能够对输入的任意长度的字符串 s进行统计,统计每个字符的频度,并建立哈夫曼树2、建立编码表(CreateTable):利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。

3、编码(Encoding):根据编码表对输入的字符串进行编码,并将编码后的字符串输出。

4、译码(Decoding):利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。

5、打印(Print):以直观的方式打印哈夫曼树(选作)6、计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫曼编码的压缩效果。

7、可采用二进制编码方式(选作)测试数据:I love data Structure, I love Computer。

I will try my best to studydata Structure.提示:1、用户界面可以设计为“菜单”方式:能够进行交互。

2、根据输入的字符串中每个字符出现的次数统计频度,对没有出现的字符一律不用编码2. 程序分析2.1 存储结构用struct结构类型来实现存储树的结点类型struct HNode{int weight; //权值int parent; //父节点int lchild; //左孩子int rchild; //右孩子};struct HCode //实现编码的结构类型{char data; //被编码的字符char code[100]; //字符对应的哈夫曼编码};2.2 程序流程2.3 关键算法分析算法1:void Huffman::Count()[1] 算法功能:对出现字符的和出现字符的统计,构建权值结点,初始化编码表[2] 算法基本思想:对输入字符一个一个的统计,并统计出现次数,构建权值数组,[3] 算法空间、时间复杂度分析:空间复杂度O(1),要遍历一遍字符串,时间复杂度O(n)[4] 代码逻辑:leaf=0; //初始化叶子节点个数int i,j=0;int s[128]={0}; 用于存储出现的字符for(i=0;str[i]!='\0';i++) 遍历输入的字符串s[(int)str[i]]++; 统计每个字符出现次数for(i=0;i<128;i++)if(s[i]!=0){data[j]=(char)i; 给编码表的字符赋值weight[j]=s[i]; 构建权值数组j++;}leaf=j; //叶子节点个数即字符个数for(i=0;i<leaf;i++)cout<<data[i]<<"的权值为:"<<weight[i]<<endl;算法2:void Init();[1] 算法功能:构建哈弗曼树[2] 算法基本思想:根据哈夫曼树构建要求,选取权值最小的两个结点结合,新结点加入数组,再继续选取最小的两个结点继续构建。

数据结构哈夫曼树实验报告

数据结构哈夫曼树实验报告

数据结构哈夫曼树实验报告一、实验内容本次实验的主要内容是哈夫曼树的创建和编码解码。

二、实验目的1. 理解并掌握哈夫曼树的创建过程;2. 理解并掌握哈夫曼编码的原理及其实现方法;3. 掌握哈夫曼树的基本操作,如求哈夫曼编码和哈夫曼解码等;4. 学习如何组织程序结构,运用C++语言实现哈夫曼编码和解码。

三、实验原理哈夫曼树的创建:哈夫曼树的创建过程就是一个不断合并权值最小的两个叶节点的过程。

具体步骤如下:1. 将所有节点加入一个无序的优先队列里;2. 不断地选出两个权值最小的节点,并将它们合并成为一个节点,其权值为这两个节点的权值之和;3. 将新的节点插入到队列中,并继续执行步骤2,直到队列中只剩下一棵树,这就是哈夫曼树。

哈夫曼编码:哈夫曼编码是一种无损压缩编码方式,它根据字符出现的频率来构建编码表,并通过编码表将字符转换成二进制位的字符串。

具体实现方法如下:1. 统计每个字符在文本中出现的频率,用一个数组记录下来;2. 根据字符出现的频率创建哈夫曼树;3. 从根节点开始遍历哈夫曼树,给左分支打上0的标记,给右分支打上1的标记。

遍历每个叶节点,将对应的字符及其对应的编码存储在一个映射表中;4. 遍历文本中的每个字符,查找其对应的编码表,并将编码字符串拼接起来,形成一个完整的编码字符串。

哈夫曼解码就是将编码字符串还原为原始文本的过程。

具体实现方法如下:1. 从根节点开始遍历哈夫曼树,按照编码字符串的位数依次访问左右分支。

如果遇到叶节点,就将对应的字符记录下来,并重新回到根节点继续遍历;2. 重复步骤1,直到编码字符串中的所有位数都被遍历完毕。

四、实验步骤1. 定义编码和解码的结构体以及相关变量;3. 遍历哈夫曼树,得到每个字符的哈夫曼编码,并将编码保存到映射表中;4. 将文本中的每个字符用其对应的哈夫曼编码替换掉,并将编码字符串写入到文件中;5. 使用哈夫曼编码重新构造文本,并将结果输出到文件中。

五、实验总结通过本次实验,我掌握了哈夫曼树的创建和哈夫曼编码的实现方法,也学会了如何用C++语言来组织程序结构,实现哈夫曼编码和解码。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据结构实验报告1.实验要求本实验为可选实验,用于提高同学们使用数据结构解决实际问题的能力。

通过选择下面3个题目之一进行实现,掌握如下内容:栈和递归地深度应用了解Huffman的思想和算法实现矩阵和相关算法在BMP图像中的应用进一步提高编程能力利用二叉树结构实现哈夫曼编/解码器。

基本要求:1、初始化(Init):能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立哈夫曼树2、建立编码表(CreateTable):利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。

3、编码(Encoding):根据编码表对输入的字符串进行编码,并将编码后的字符串输出。

4、译码(Decoding):利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。

5、打印(Print):以直观的方式打印哈夫曼树(选作)6、计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫曼编码的压缩效果。

7、可采用二进制编码方式(选作)测试数据:I love data Structure, I love Computer.I will try my best to study data Structure.提示:1、用户界面可以设计为“菜单”方式:能够进行交互。

2、根据输入的字符串中每个字符出现的次数统计频度,对没有出现的字符一律不用编码。

2. 程序分析2.1存储结构:(1)三叉树:class Huffman{private:HNode*HTree;//哈夫曼树结点HCode*HCodeTable;//哈夫曼编码表char b[1000];//记录所有输入内容被编码后的结果char c[127];char letter[1000];//输入内容的保存void SelectMin(int &x,int &y,int k);//求最小权重的字符node*count;//计算各个字符出现次数int n;//输入字符的种类(个数)int l;public:Huffman();void CreateHTree();//创建哈夫曼树void CreateCodeTable();//创建哈夫曼编码表void Encode();//编码void Decode();//解码};结点结构为如下所示:三叉树的节点结构:struct HNode//哈夫曼树结点的结构体{ int weight;//结点权值int parent;//双亲指针int lchild;//左孩子指针int rchild;//右孩子指针char data;//字符};示意图为:int weight int parent int lchild int rchild chardata编码表节点结构:struct HCode//编码表结构体{char data;//字符char code[100];//编码内容};示意图为:char data char code[100]基本结构体记录字符和出现次数:struct node{int num;char data;};示意图为:int num char data2.关键算法分析(1).初始化:伪代码:1.输入需要编译的文本内容2.将输入的内容保存到动态建立的node型数组count中3.统计出现的字符种类的数目,并且保存到private型变量nHuffman::Huffman()//将输入数据保存到Huffman类中{l=0;n=0;count=new node[127];cout<<"请输入需要编译压缩的内容"<<endl;cin.getline(letter,200,'\n');for(int j=0;j<127;j++) //一个号码代表一种字符{count[j].num=0;}while(letter[l]!='\0')//在结束之前,每输入一个字符,则对应字符的数目则自增1 {++count[letter[l]].num;count[letter[l]].data=letter[l];++l;}for(int k=0;k<127;k++) {if(count[k].num>0){n++;}//在某个字符出现此书num不为0时,n自增1,最终n为出现的字符种类数目}其时间复杂度为O(n)(2).创建哈夫曼树(void HuffmanTree::CreateCodeTable(Node *p))算法伪代码:1.创建一个长度为2*n-1的三叉链表2.将存储字符及其权值的链表中的字符逐个写入三叉链表的前n个结点的data域,并将对应结点的孩子域和双亲域赋为空3.从三叉链表的第n个结点开始,3.1从存储字符及其权值的链表中取出两个权值最小的结点x,y,记录其下标x,y。

3.2将下标为x和y的哈夫曼树的结点的双亲设置为第i个结点3.3将下标为x的结点设置为i结点的左孩子,将下标为y的结点设置为i结点的右孩子,i结点的权值为x结点的权值加上y结点的权值,i结点的双亲设置为空4.根据哈夫曼树创建编码表源代码为:void Huffman::CreateHTree(){l=0;HTree=new HNode[2*n-1];//建立含有n种字符的哈夫曼树只需要2*n-1个结点即可for(int i=0;i<n;i++){while (count[l].num==0)//如果count内的权重为0,即该字符没有出现,则跳过,i自增继续寻找出现过的字符{l++;}HTree[i].weight=count[l].num;//将count里统计的次数传入哈夫曼树的节点中,作为字符权重HTree[i].lchild=-1;HTree[i].rchild=-1;HTree[i].parent=-1;//将左右孩子结点和父节点都置空HTree[i].data=count[l].data;//将count内的有效字符传入哈夫曼树的结点l++;}int x=-1,y=-1;for(int i=n;i<2*n-1;i++)//开始建立哈夫曼树{SelectMin(x,y,i);//挑选三者中的权重较小的两个HTree[x].parent=HTree[y].parent=i;//令较小的x、y为孩子节点,该两个结点的父节点是iHTree[i].weight=HTree[x].weight+HTree[y].weight;//i结点字符的权重赋为是左右孩子字符权重之和HTree[i].lchild=x;//左孩子为xHTree[i].rchild=y;//右孩子为yHTree[i].parent=-1;//父节点置空x=-1;y=-1;//将x、y重新赋值为零,进行下一次比较建树}其时间复杂度为:O(n)(3).创建编码表算法伪代码:1.初始化编码表2.初始化一个指针,从链表的头结点开始,遍历整个链表2.1 将链表中指针当前所指的结点包含的字符写入编码表中2.2 得到该结点对应的哈夫曼树的叶子结点及其双亲2.3 如果哈夫曼树只有一个叶子结点,将其字符对应编码设置为02.4 如果不止一个叶子结点,从当前叶子结点开始判断2.4.1 如果当前叶子结点是其双亲的左孩子,则其对应的编码为0,否则为12.4.2 child指针指向叶子结点的双亲,parent指针指向child指针的双亲,重复2.4.1的操作2.5 将已完成的编码倒序2.6 取得链表中的下一个字符3.输出编码表源代码为:void Huffman::CreateCodeTable()//建立哈夫曼编码表{HCodeTable=new HCode[n];//建立动态编码表for(int i=0;i<n;i++){HCodeTable[i].data=HTree[i].data;int child=i;int parent=HTree[i].parent;int k=0;while(parent!=-1){if(child==HTree[parent].lchild)//判断该节点是父节点的左孩子或右孩子,左孩子则编码为0,右孩子则编码为1HCodeTable[i].code[k]='0';elseHCodeTable[i].code[k]='1';k++;child=parent;//将该节点的父节点作为新的孩子节点,继续进行编码输出parent=HTree[child].parent;}HCodeTable[i].code[k]='\0';//code数组以\0结尾Reverse(HCodeTable[i].code);//由于是从下到上输出,顺序是相反的,所以还需要逆置才能输出字符的编码值}cout<<endl<<endl<<"每个字符的编码为:"<<endl;for(int i=0;i<n;i++){cout<<HCodeTable[i].data<<": "<<HCodeTable[i].code<<endl;//逐个输出对应的字符和其编码}}}其时间复杂度为:O(n)(4)选择两个最小权值的函数void Huffman::SelectMin(int &x,int &y,int k) 算法伪代码:1.从下标为i=0的开始遍历。

前两次将x,y赋值为序号最小的两个结点的地址序号。

2.开始进行比较:进行如下分类对于任何不存在父节点的结点:若x权值<=y权值(1)且i权值>=y权值,则无疑i权值最大,为输出x、y为权值较小的两个故而x,y值不便;(2)其余情况皆为x、i的权值是较小的两个,令y赋值为i,则保证x、y权值是最小的两个。

若y权值<=x权值(1)且i权值>=x权值,则i权值是最大,x、y不变。

(2)其余情况皆为i、y权值最小,令x赋值为i,保证x、y序号结点的权值最小3.完成如上循环,直至i=k则推出循环,第k个结点在树的位置已经确定源代码为:void Huffman::SelectMin(int &x,int &y,int k)//选出权值较小的两个字符结点{int i=0;while(i<k){while(i<k&&HTree[i].parent==-1)//若结点不具有父结点且满足i<k则进行如下循环,建立新子树{if(x==-1)x=i;else if(y==-1)y=i;elseif(HTree[x].weight<=HTree[y].weight){if(HTree[y].weight<=HTree[i].weight){y=y;x=x;}elsey=i;}elseif(HTree[x].weight>HTree[y].weight){if(HTree[i].weight>=HTree[x].weight){x=x;y=y;}elsex=i;}i++;}i++;}}其时间复杂度为O(n)(5). 将字符串倒序的函数(void HuffmanTree::Reverse(char *pch))算法伪代码:1.得到字符串的长度2.初始化两个记录下标的变量,一个为字符串开头字符所在的下标i,另一个为字符串结尾字符所在的下标j3.将下标为i和j的字符交换4.i++,j - -源代码:void Reverse(char a[]){char b[100];int i=0,j=0;while(a[i]!='\0'){b[i]=a[i];i++;}b[i]='\0';i--;while(i>=0){a[j]=b[i];i--;j++;}a[j]='\0';}其时间复杂度为O(n)(6).编码函数(void Huffman::Encode(a[]))算法伪代码:1. 从开头的字符开始,逐一对a中的字符进行编码2. 在编码表中查找与当前字符对应的字符3.如果找到了与当前字符对应的编码表中的字符,将其编码追加到解码串的末尾。

相关文档
最新文档