




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、福建农林大学计算机与信息学院数据结构课程设计设计:哈夫曼编译码器姓名:韦邦权专业:2013级计算机科学与技术学号:13224624班级:13052316完成日期:2013.12.28哈夫曼编译码器一、需求分析在当今信息爆炸时代,如何采用有效的数据压缩技术节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视,哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。哈夫曼编码是一种编码方式,以哈夫曼树即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。哈夫曼编码使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算
2、概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。哈夫曼编码的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。树中从根到每个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符的编码,这就是哈夫曼编码。哈夫曼译码输入字符串可以把它编译成二进制代码,输入二进制代码时可以编译成字符串。二、设计要求对输入的一串电文字符实现哈夫曼编码,再对哈夫曼编码生成的代码串进行译码,输出
3、电文字符串。通常我们把数据压缩的过程称为编码,解压缩的过程称为解码。电报通信是传递文字的二进制码形式的字符串。但在信息传递时,总希望总长度能尽可能短,即采用最短码。假设每种字符在电文中出现的次数为Wi,编码长度为Li,电文中有n种字符,则电文编码总长度为WiLi。若将此对应到二叉树上,Wi为叶结点的权,Li为根结点到叶结点的路径长度。那么,WiLi恰好为二叉树上带权路径长度。因此 ,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。设计实现的功能: (1) 哈夫曼树的建立; (2) 哈夫曼编码的生成; (3) 编码文件的译码。 三、概要
4、设计哈夫曼编译码器的主要功能是先建立哈夫曼树,然后利用建好的哈夫曼树生成哈夫曼编码后进行译码 。在数据通信中,经常需要将传送的文字转换成由二进制字符0、1组成的二进制串,称之为编码。构造一棵哈夫曼树,规定哈夫曼树中的左分之代表0,右分支代表1,则从根节点到每个叶子节点所经过的路径分支组成的0和1的序列便为该节点对应字符的编码,称之为哈夫曼编码。最简单的二进制编码方式是等长编码。若采用不等长编码,让出现频率高的字符具有较短的编码,让出现频率低的字符具有较长的编码,这样可能缩短传送电文的总长度。哈夫曼树课用于构造使电文的编码总长最短的编码方案。设计包含的几个方面: 哈夫曼树的建立赫夫曼树的建立由赫
5、夫曼算法的定义可知,初始森林中共有n棵只含有根结点的二叉树。算法的第二步是:将当前森林中的两棵根结点权值最小的二叉树,合并成一棵新的二叉树;每合并一次,森林中就减少一棵树,产生一个新结点。显然要进行n1次合并,所以共产生n1个新结点,它们都是具有两个孩子的分支结点。由此可知,最终求得的哈夫曼树中一共有2n1个结点,其中n个结点是初始森林的n个孤立结点。并且哈夫曼树中没有度数为1的分支结点。我们可以利用一个大小为2n-1的一维数组来存储赫夫曼树中的结点。定义的结构体类型如下:typedef struct char data; /结点字符 int weight; /权值 int parent; /
6、双亲结点 int lchild; /左孩子结点 int rchild; /右孩子结点HTNode; 哈夫曼编码 要求电文的哈夫曼编码,必须先定义哈夫曼编码类型,根据设计要求和实际需要定义的类型如下: typedet struct char cdN; / 存放编码的数组int start; /从start 开始读cd中的哈夫曼编码Hcode; / 编码结构体类型 代码文件的译码 译码的基本思想是:读文件中编码,并与原先生成的哈夫曼编码表比较,遇到相等时,即取出其对应的字符存入一个新串中。四、详细设计字符统计int jsq(char *s,int cnt,char str)char *p;int
7、i,j,k;for(i=1;i<=256;i+)cnti=0;for(p=s;*p!='0'p+)k=*p;cntk+;j=0;for(i=1,j=0;i<=256;i+) if(cnti!=0) j+; return j;哈夫曼树的算法void CreateHT(HTNode ht,int n,char str,int cn) /创建哈夫曼树函数for(int input=1;input<=256;input+)strinput=input;int l=0;for(int output=1;output<=256;output+)if(cnoutput
8、 !=0)htl.data=stroutput; /按字母顺序将出现的字母依次存入数组hthtl.weight=cnoutput;l+; int i,k,lnode,rnode; int min1,min2; for (i=0;i<2*n-1;i+) hti.parent=hti.lchild=hti.rchild=0; /所有结点的相关域置初值0 for (i=n;i<2*n-1;i+) /构造哈夫曼树 min1=min2=MAX; /int的范围是-32768-32767 lnode=rnode=0; /lnode和rnode记录最小权值的两个结点位置 for (k=0;k&l
9、t;=i-1;k+) /选出每次外层循环最小权值的两个结点 if (htk.parent=0) /只在尚未构造二叉树的结点中查找 if (htk.weight<min1) /比min1小时 min2=min1;rnode=lnode; min1=htk.weight;lnode=k; else if (htk.weight<min2) /比min1大,比min2小 min2=htk.weight;rnode=k; htlnode.parent=i;htrnode.parent=i; /两个最小节点的父节点是i hti.weight=htlnode.weight+htrnode.we
10、ight; /两个最小节点的父节点权值为两个最小节点权值之和 hti.lchild=lnode;hti.rchild=rnode; /父节点的左节点和右节点哈夫曼编码void CreateHCode(HTNode ht,HCode hcd,int n) int i,p,c; HCode hc; for (i=0;i<n;i+) /根据哈夫曼树求哈夫曼编码 hc.start=n; /初始位置 c=i; /从叶子结点hti开始上溯 p=hti.parent; while (p!=0) /循序直到树根结点结束循环 hc.cdhc.start-=(htp.lchild)=c?'0'
11、;:'1' /左孩子记为0,右孩子记为1 c=p; p=htp.parent; /与上句c=i;p=hti.parent同义,促进循环 hc.start+; /start指向哈夫曼编码hc.cd中最开始字符 hcdi=hc; 哈夫曼译码void deHCode(HTNode ht,HCode hcd,int n,char str) /译码函数printf("输出译码结果为:n");int i,j,k,x,m=0;char codeMAX;for (i=0;i<MAX;i+) for (j=0;j<n;j+)if(stri=htj.data) /循
12、环查找与输入字符相同的编号,相同的就输出这个字符的编码for (k=hcdj.start;k<=n;k+) codem=hcdj.cdk; /将输出的编码赋值到数组中 m+; break; /输出完成后跳出当前for循环codem='#' /把要进行译码的字符串存入code数组中while(code0!='#')for (i=0;i<n;i+)m=0; /m为想同编码个数的计数器 for (k=hcdi.start,j=0;k<=n;k+,j+) /j为记录所存储这个字符的编码个数if(codej=hcdi.cdk) /当有相同编码时m值加1m
13、+;if(m=j) /当输入的字符串与所存储的编码字符串个数相等时则输出这个的data数据printf("%c",hti.data);for(x=0;codex-j!='#'x+) /把已经使用过的code数组里的字符串删除codex=codex+j; /删除j个数,往前移动j位printf("n");主函数void main()char stMAX,sstMAX;int cn257;int n,i;printf("请输入字符串(任意字符):n");gets(st);n=jsq(st,cn,sst);/99for(i=
14、0;i<99;i+)ssti=sti;/HTNode htM;HCode hcdN;CreateHT(ht,n,st,cn); CreateHCode(ht,hcd,n); outputHCode(ht,hcd,n);editHCode(ht,hcd,n,sst);deHCode(ht,hcd,n,sst);五、调试输出哈夫曼编码输出编码结果输出译码结果附录源程序#include <stdio.h>#include <string.h> /gets()函数需要#define N 256 /义用N表示50叶节点数#define M 2*N-1 /用M表示节点总数 当
15、叶节点数位n时总节点数为2n-1#define MAX 32767typedef struct char data; /结点字符 int weight; /权值 int parent; /双亲结点 int lchild; /左孩子结点 int rchild; /右孩子结点HTNode;/ typedef struct char cdN; /存放哈夫曼码 int start; /从start开始读cd中的哈夫曼码HCode;/int jsq(char *s,int cnt,char str)char *p;int i,j,k;for(i=1;i<=256;i+)cnti=0;for(p=s
16、;*p!='0'p+)k=*p;cntk+;j=0;for(i=1,j=0;i<=256;i+) if(cnti!=0) j+; return j;/void CreateHT(HTNode ht,int n,char str,int cn) /创建哈夫曼树函数for(int input=1;input<=256;input+)strinput=input;int l=0;for(int output=1;output<=256;output+)if(cnoutput !=0)htl.data=stroutput; /按字母顺序将出现的字母依次存入数组htht
17、l.weight=cnoutput;l+; int i,k,lnode,rnode; int min1,min2; for (i=0;i<2*n-1;i+) hti.parent=hti.lchild=hti.rchild=0; /所有结点的相关域置初值0 for (i=n;i<2*n-1;i+) /构造哈夫曼树 min1=min2=MAX; /int的范围是-32768-32767 lnode=rnode=0; /lnode和rnode记录最小权值的两个结点位置 for (k=0;k<=i-1;k+) /选出每次外层循环最小权值的两个结点 if (htk.parent=0)
18、 /只在尚未构造二叉树的结点中查找 if (htk.weight<min1) /比min1小时 min2=min1;rnode=lnode; min1=htk.weight;lnode=k; else if (htk.weight<min2) /比min1大,比min2小 min2=htk.weight;rnode=k; htlnode.parent=i;htrnode.parent=i; /两个最小节点的父节点是i hti.weight=htlnode.weight+htrnode.weight; /两个最小节点的父节点权值为两个最小节点权值之和 hti.lchild=lnode
19、;hti.rchild=rnode; /父节点的左节点和右节点/void CreateHCode(HTNode ht,HCode hcd,int n) int i,p,c; HCode hc; for (i=0;i<n;i+) /根据哈夫曼树求哈夫曼编码 hc.start=n; /初始位置 c=i; /从叶子结点hti开始上溯 p=hti.parent; while (p!=0) /循序直到树根结点结束循环 hc.cdhc.start-=(htp.lchild)=c?'0':'1' /左孩子记为0,右孩子记为1 c=p; p=htp.parent; /与上
20、句c=i;p=hti.parent同义,促进循环 hc.start+; /start指向哈夫曼编码hc.cd中最开始字符 hcdi=hc; /void outputHCode(HTNode ht,HCode hcd,int n) /输出哈夫曼编码的列表 int i,k; printf(" 输出哈夫曼编码:n"); for (i=0;i<n;i+) /输出data中的所有数据, printf(" %c:t",hti.data); for (k=hcdi.start;k<=n;k+) /输出所有data中数据的编码 printf("%c
21、",hcdi.cdk); /从初最开始的字符起输出 printf("n"); /void editHCode(HTNode ht,HCode hcd,int n,char str) /编码函数int i,j,k;printf("n输出编码结果:n");for (i=0;i<MAX;i+) for (j=0;j<n;j+)if(stri=htj.data) /循环查找与输入字符相同的编号,相同的就输出这个字符的编码for (k=hcdj.start;k<=n;k+) printf("%c",hcdj.cdk); break; /输出完成后跳出当前for循环printf("n");/void deHCode(HTNode ht,HCode hcd,int n,char str) /译码函数printf("输出译码结果为:n");int i,j,k,x,m=0;char codeMAX;for (i=0;i<MAX;i+) for (j=0;j<n;j+)if(stri=htj.data) /循环查找与输入字符相同的编号,相同的就输出这个字符的编码for
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 认知神经科学与心理测量创新融合研究-全面剖析
- 佛山水塔施工方案
- 传统皮革工艺在现代箱包设计中的新诠释-全面剖析
- 可逆脱敏技术的分类与应用-全面剖析
- 舟状头治疗药物研发-全面剖析
- 金属花格栅施工方案
- 2025年征信考试题库:征信数据分析与报告撰写核心知识点与实战应用试题
- 2025年小学英语毕业考试模拟试卷(口语能力提升与实际应用)
- 三维建模与分析技术-全面剖析
- 2025年摄影师职业技能鉴定试卷:摄影作品版权交易与代理试题
- 小学生理财小知识主题班会精编ppt
- DBJ∕T 15-104-2015 预拌砂浆混凝土及制品企业试验室管理规范
- T-CAMET 04017.5-2019 城市轨道交通 全自动运行系统规范 第5部分:工程安全评估
- 互联网开放平台解决方案
- 腺样体肥大诊疗与腺样体切除术(概述、临床表现与危害、诊断、治疗及腺样体切除术)
- 贾宝玉形象分析PPT课件(PPT 30页)
- 建筑工程质量通病课件
- 阿坝州果蔬产业发展现状及展望
- Q∕GDW 10799.6-2018 国家电网有限公司电力安全工作规程 第6部分:光伏电站部分
- 农产品检测中心检测用样品制备作业指导书
- GMP附录5中药制剂ppt课件
评论
0/150
提交评论