版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录TOC\o"1-3"\h\u28012一、概述 一、概述本设计是对输入的一串电文字符实现赫夫曼编码,再对赫夫曼编码生产的代码串进行译码,输出电文字符串。在当今信息爆炸时代,如何采用有效的数据压缩技术节省数据文件的存储空间和计算机网络的传送时间越来越引起人们的重视,赫夫曼编码正是一种应用广泛且非常有效的数据压缩技术。二、系统分析赫夫曼编码的应用很广泛,利用赫夫曼树求得的用于通信的二进制编码成为赫夫曼编码。树中从根到每个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和每个叶子对应的字符的编码,这就是赫夫曼编码。通常我们把数据压缩的过程称为编码,解压缩的过程称为解码。电报通信是传递文字的二进制码形式的字符串,但在信息传递时,总希望总长度能尽可能短,即采用最短码。假设每种字符在电文中出现的次数为Wi,编码长度为Li,电文中有n种字符,则电文编码总长为∑WiLi。若将此对应到二叉树上,Wi为叶节点的权,Li为根节点到叶节点的路径长度。那么,∑WiLi恰好为二叉树上带权路径长度。因此,设计电文总长最短的二进制前缀编码,就是以n种子符出现的频率作权,构造一刻赫夫曼树,此构造过程成为赫夫曼编码。根据设计要求和分析,要实现设计,必须实现以下方面的功能:赫夫曼树的建立;赫夫曼编码的生成;编码文件的译码;三、概要设计程序由哪些模块组成以及模块之间的层次结构、各模块的调用关系;每个模块的功能。voidmain()voidHufffmanEncoding(HuffmanTreeHT,HuffmanCodeHC)//编码部分char*decode(HuffmanCodeHc)//译码voidChuffmanTree(HuffmanTreeHT,HuffmanCodeHC,intcnt[],charstr[])//生成Huffman树voidselect(HufmanTreeHT,intk,int&s1,int&s2)//找寻parent为0,权最小的两个节点其流程图如下:进行相应的操作进行相应的操作输出结果结束构造赫夫曼树程序结束退出对编码串译码对字符串编码开始进行相应的操作四、详细设计4.1赫夫曼树的建立由赫夫曼算法的定义可知,初始森林中共有n棵只含根节点的二叉树。算法的第二步是:将当前森林中的两颗根节点的二叉树,合并成一颗新的二叉树;每合并一次,森林中就减少一棵树,产生一个新节点。显然要进行n-1次合并,所以共产生n-1个新节点,它们都是具有两个孩子分支结点。由此可知,最新求得的赫夫曼树中一共有2n-1个结点,其中n个结点是初始森林的n个孤立结点。并且赫夫曼树中没有度数为1的分支结点。我们可用一个大小为2n-1的一维数组来存储赫夫曼树中的结点。因此,赫夫曼树的存储结构描述为:#definen100#definem2*n-1typedefstruct{intweight;intlchild,rchild,parent;}HTNode;TtypedefHTNodeHuffmanTree[m+1];开始开始结束第i个结点权值i=num?创建赫夫曼树输出字符统计情况第i个根结点i=2*num-1?i=num?否是否是否是4.1.1选择选择parent为0且权值最小的两个根结点的算法voidselect(HuffmanTreeT,intk,int*s1,int*s2){//在HT[1……k]中选择parent为0且权值最小的两个根结点,其序号分别为S1和S2inti,j;intmin1=100;for(i=1;i<=k;i++)//查找s1if(T[i].weight<min1&&T[i].parent==0){j=i;min1=T[i].weight;}*s1=j;min1=32767;for(i=1;i<=k;i++)//查找s2,不和s1相同if(T[i].weight<min1&&T[i].parent==0&&i!=(*s1)){j=i;min1=T[i].weight;}*s2=j;}4.1.2统计字符串中字符的种类以及各类字符的个数假设电子文件字符串全是大写字母,那么该算法的实现思想是:先定义一个含有26个元素的临时整型数组,用来存储各种字母出现的次数。应为大写字母的ASCII码与整数1~26个元素之间相差64,因此在算法中使用字母减去64作为统计数组的下标对号入座,无须循环判断来实现,从而提高了效率;另外,要求出电文字符串中有多少种字符,并保存这些字符以供编码时使用。统计和保存都比较容易,用一个循环来判断先前统计好的各类字符个数的数组元素是否为零,若不为零,则将其值存入一个数组对应的元素中,同时将其对应的字符也存入另一个数组元素中。具体实现如下:intjsq(char*s,intcnt[],charstr[]){//统计各字符串中各种字母的个数以及字符的种类char*p;inti,j,k;inttemp[27];for(i=1;i<=26;i++)temp[i]=0;for(p=s;*p!='\0';p++){//统计各种字符个数if(*p>='A'&&*p<='Z'){k=*p-64;temp[k]++;}}j=0;for(i=1,j=0;i<=26;i++)//统计有多少种字符if(temp[i]!=0){j++;str[j]=i+64;//将对应的数组送到数组中cnt[j]=temp[i];//存入对应数组的权值}returnj;}4.1.3构造赫夫曼树voidChuffmanTree(HuffmanTreeHT,HuffmanCodeHC,intcnt[],charstr[]){//构造赫夫曼树HTinti,s1,s2;for(i=1;i<=2*num-1;i++)//初始化HT,左右孩子,双亲,权值都为0{HT[i].lchild=0;HT[i].rchild=0;HT[i].parent=0;HT[i].weight=0;}for(i=1;i<=num;i++)//输入num个叶节点的权值HT[i].weight=cnt[i];for(i=num+1;i<=2*num-1;i++)//从numd后面开始新建结点存放新生成的父节点{select(HT,i-1,&s1,&s2);//在HT[1……i-1]中选择parent为0且权值最小的两个根结点,其序号分别为s1和s2HT[s1].parent=i;HT[s2].parent=i;//将s1和s2的parent赋值HT[i].lchild=s1;HT[i].rchild=s2;//新结点的左右孩子HT[i].weight=HT[s1].weight+HT[s2].weight;//新结点的权值}for(i=0;i<=num;i++)//输入字符集中的字符HC[i].ch=str[i];i=1;while(i<=num)printf("字符%c,次数为:%d\n",HC[i].ch,cnt[i++]);}4.2赫夫曼编码要求电文的赫夫曼编码,必须先定义赫夫曼编码类型,根据设计要求和实际需要定义的类型如下:typedefstruct{charch;charbits[n+1];intstart;}CodeNode;typedefCodeNodeHuffmanCode[n];4.2.1赫夫曼编码算法voidHuffmanEncoding(HuffmanTreeHT,HuffmanCodeHC){//根据赫夫曼树HT求赫夫曼编码表HCintc,p,i;charcd[n];intstart;cd[num]='\0';for(i=1;i<=num;i++){start=num;c=i;while((p=HT[c].parent)>0)//直至上诉到ht[c]是树根为止{//若HT[c]是HT[p]的孩子,则生成0;否则生成代码1cd[--start]=(HT[p].lchild==c)?'0':'1':c=p;}//endofwhilestrcpy(HC[i].bits,&cd[start]);HC[i].len=num-start;}}4.2.2建立正文的编码文件建立编码文件的基本思想是:将要编码的字符串中的字符逐一与预先生成赫夫曼树时保保存的字符编码对照表进行比较,找到之后,对该字符的编码写入代码文件,直至所有字符处理完毕为止。具体算法如下:viodcoding(huffmanCodeHC,char*str){inti,j;FILE*fp;fp=fopen(“codefile.tex”,”w”);while(*str){//对电文中字符逐一生成编码并写入文件for(i=1;i<=num;i++)if(HC[i].ch==*str){for(j=0;j<=HC[i].len;j++)fputc(HC[i].bits[j],fp);break;}str++;}fclose(fp);}4.3代码文件的译码译码的基本思想是:读文件中编码,并与生成的赫夫曼编码表比较,遇到相等时,即取出其对应的字符存入一个新串中。Char*decode(HuffmanCodeHC){//代码文件codefile.tex译码FILE*fp;charstr[254];char*p;staticcharcd[n+1]inti,j,k=0,cjs;fp=fopen(“codefile.tex”,”r”);while(!feof(fp)){cjs=0;for(i=0;i<=num&&cjs==0&&!feof(fp);i++){cd[i]=‘’;cd[i+1]='\0';cd[i]=fgetc(fp);for(j=1;j<=num;j++)if(strcmp(HC[i].bits,cd)==0){str[k]=HC[j].ch;k++;cjs=1;break;}}str[k]='\0';;p=str;returnp;}五、运行与测试运行结果为六、总结与心得本次编写过程中出现了较多的问题,比如开始对赫夫曼树的理解不是很清楚,导致在编写过程中某些代码错误而没能及时修改,在最后进行修改时遇到了较多的麻烦。但是经过这次对赫夫曼树的学习后,我了解到赫夫曼编码(HuffmanCoding)是一种编码方式,以赫夫曼树—即最优二叉树,带权路径长度最小的二叉树,经常应用于数据的无损耗压缩。总之受益匪浅。参考文献【1】《数据结构》严蔚敏.清华大学出版社.【2】《数据结构课程设计》苏仕华.极械工业出版社.【3】《程序设计》谭浩强.清华大学出版社.附录#include<stdio.h>#include<string.h>#definen100//叶子结点数#definem2*n-1//赫夫曼树种的结点总数typedefstruct{charch;charbits[9];//存放编码位串intlen;//编码长度}CodeNode;typedefCodeNodeHuffmanCode[n+1];typedefstruct{intweight;//权值intlchild,rchild,parent;//左右孩子及双亲指针}HTNode;//树中的结点类型typedefHTNodeHuffmanTree[m+1];//0号单元不可用intnum;//字母类型的个数voidselect(HuffmanTreeT,intk,int*s1,int*s2){//在HT[1……k]中选择parent为0且权值最小的两个根结点,其序号分别为S1和S2inti,j;intmin1=100;for(i=1;i<=k;i++)//查找s1if(T[i].weight<min1&&T[i].parent==0){j=i;min1=T[i].weight;}*s1=j;min1=32767;for(i=1;i<=k;i++)//查找s2,不和s1相同if(T[i].weight<min1&&T[i].parent==0&&i!=(*s1)){j=i;min1=T[i].weight;}*s2=j;}intjsq(char*s,intcnt[],charstr[]){//统计各字符串中各种字母的个数以及字符的种类char*p;inti,j,k;inttemp[27];for(i=1;i<=26;i++)temp[i]=0;for(p=s;*p!='\0';p++){//统计各种字符个数if(*p>='A'&&*p<='Z'){k=*p-64;temp[k]++;}}j=0;for(i=1,j=0;i<=26;i++)//统计有多少种字符if(temp[i]!=0){j++;str[j]=i+64;//将对应的数组送到数组中cnt[j]=temp[i];//存入对应数组的权值}returnj;}voidChuffmanTree(HuffmanTreeHT,HuffmanCodeHC,intcnt[],charstr[]){//构造赫夫曼树HTinti,s1,s2;for(i=1;i<=2*num-1;i++)//初始化HT,左右孩子,双亲,权值都为0{HT[i].lchild=0;HT[i].rchild=0;HT[i].parent=0;HT[i].weight=0;}for(i=1;i<=num;i++)//输入num个叶节点的权值HT[i].weight=cnt[i];for(i=num+1;i<=2*num-1;i++)//从numd后面开始新建结点存放新生成的父节点{select(HT,i-1,&s1,&s2);//在HT[1……i-1]中选择parent为0且权值最小的两个根结点,其序号分别为s1和s2HT[s1].parent=i;HT[s2].parent=i;//将s1和s2的parent赋值HT[i].lchild=s1;HT[i].rchild=s2;//新结点的左右孩子HT[i].weight=HT[s1].weight+HT[s2].weight;//新结点的权值}for(i=0;i<=num;i++)//输入字符集中的字符HC[i].ch=str[i];i=1;while(i<=num)printf("字符%c,次数为:%d\n",HC[i].ch,cnt[i++]);}voidHuffmanEncoding(HuffmanTreeHT,HuffmanCodeHC){//根据赫夫曼树HT求赫夫曼编码表HCintc,p,i,j;//c和p分别指示T中孩子和双亲的位置charcd[n];//临时存放编码串intstart;//指示编码在cd中的起始位置cd[num]='\0';//最后一位放上串结束符for(i=1;i<=num;i++){start=num;//初始位置c=i;//从叶子节点T[i]开始上溯while((p=HT[c].parent)>0)//直至上溯到HT[c]是树根为止{//若T[c]是T[p]的做孩子,则生成0;否则生成代码1cd[--start]=(HT[p].lchild==c)?'0':'1';//cd数组用来存放每一个字母对应的01编码,c=p;}//while结束strcpy(HC[i].bits,&cd[start]);//将cd数组中德01代码复制到i结点中HC[i].len=num-start;}//for结束}voidcoding(HuffmanCodeHC,char*str){inti,j;FILE*fp;fp=fopen("codefile.txt","w");while(*str){for(i=1;i<=num;i++)if(HC[i].ch==*str){for(j=0;j<HC[i].len;j++){fputc(HC[i].bits[j],fp);}break;}str++;}fclose(fp);}char
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大班玩球的班本课程设计
- 《全自动生产线质量监测故障诊断系统研究》
- 《新生代员工加班行为对员工满意度的影响研究》
- 播音配音课程设计思路
- 《基于ADDIE模型的单元教学设计实验研究》
- 校园汽车租赁合同协议
- 产品销售和服务合同
- 智能租赁系统开发合同
- 建筑行业绿色建筑材料研发与推广方案
- 动物世界绘本故事解读
- 【课件】体量与力量-雕塑的美感+课件-高中美术人美版(2019)美术鉴赏
- 化工生产仿真综合实训报告
- 关于民宿管家培训
- 维保措施及方案设计流程
- 桥架及电缆敷设施工方案及流程
- 人工智能革命AI对全球劳动力市场的影响
- 第三单元名著阅读《经典常谈》-2023-2024学年八年级语文下册同步教学课件
- 人体解剖学与组织胚胎学说课讲解
- 预防艾滋梅毒乙肝培训课件
- 伯努利原理及其应用
- 建筑施工安全风险辨识风级管控(台账)清单
评论
0/150
提交评论