(完整word版)数据结构课程设计(哈夫曼编码)_第1页
(完整word版)数据结构课程设计(哈夫曼编码)_第2页
(完整word版)数据结构课程设计(哈夫曼编码)_第3页
(完整word版)数据结构课程设计(哈夫曼编码)_第4页
(完整word版)数据结构课程设计(哈夫曼编码)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 (完整 word 版)数据结构课程设计(哈夫曼编码)目 录目 录. 11 课程设计的目的和意义. 32 需求分析. 53 系统设计. 6(1)设计思路及方案. 6(2)模块的设计及介绍. 6(3)主要模块程序流程图. 94 系统实现.14(1)主调函数.14(2)建立HuffmanTree.14(3)生成Huffman编码并写入文件 .18(4)电文译码.195 系统调试.22小 结.25参考文献.26附录 源程序.27共 33 页 第 1 页 (完整 word 版)数据结构课程设计(哈夫曼编码)共 33 页 第 2 页 (完整 word 版)数据结构课程设计(哈夫曼编码)1 课程设计的目的

2、和意义在当今信息爆炸时代,如何采用有效的数据压缩技术来节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视。哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。哈夫曼编码的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。树中从根到每个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1的序列作为和各个对应的字符的编码,这就是哈夫曼编码。通常我们把数据压缩的过程称为编码,解压缩的过程称为解码。电报通信是传递文字的二进制码形式的字符串。但在信息传递时,总希望总长度尽可能最短,即采用最短码。作为软

3、件工程专业的学生,我们应该很好的掌握这门技术。在课堂上,我们能过学到许多的理论知识,但我们很少有过自己动手实践的机会!课程设计就是为解决这个问题提供了一个平台。在课程设计过程中,我们每个人选择一个课题,认真研究,根据课堂讲授内容,借助书本,自己动手实践。这样不但有助于我们消化课堂所讲解的内容,还可以增强我们的独立思考能力和动手能力;通过编写实验代码和调试运行,我们可以逐步积累调试 C 程序的经验并逐渐培养我们的编程能力、用计算机解决实际问题的能力。在课程设计过程中,我们不但有自己的独立思考,还借助各种参考文献来帮助我们完成系统。更为重要的是,我们同学之间加强了交流,在对问题的认识方面可以交换不

4、同的意见.同时,师生之间的互动也随之改善,我们可以通过具体的实例来从老师那学到更多的实用的知识。共 33 页 第 3 页 (完整 word 版)数据结构课程设计(哈夫曼编码)数据结构课程具有比较强的理论性 ,同时也具有较强的可应用性和实践性 .课程设计是一个重要的教学环节.我们在一般情况下都能够重视实验环节,但是容易忽略实验的总结,忽略实验报告的撰写。通过这次实验让我们明白:作为一名大学生必须严格训练分析总结能力、书面表达能力。需要逐步培养书写科学实验报告以及科技论文的能力。只有这样,我们的综合素质才会有好的提高。共 33 页 第 4 页 (完整 word 版)数据结构课程设计(哈夫曼编码)2

5、 需求分析题目:哈夫曼编码/译码器问题描述:利用哈夫曼编码进行信息通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本.但是这要求在发送端通过一个编码系统对待传数据预先编码;在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站写一个哈夫曼码的编译码系统。具体要求:初始化:键盘输入字符集大小 n 及 n 个字符和 m 个权值,建立哈夫曼树,并将它存于文件 hfmtree 中。1)编码:利用建好的哈夫曼树,对文件 tobetrans 中的正文进行编码,然后将结果存入文件 codefile 中。2)3)4)5)6

6、)解码:利用建好的哈夫曼树将文件 codefile 中的代码进行译码,结果存入文件 textfile 中。打印代码文件:将文件 codefile 以紧凑格式显示在终端上,每行 50 个代码.同时将此字符形式的编码文件写入文件 codeprint 中.打印哈夫曼树:将已在内存中的哈夫曼树以直观的方式(树或凹入表形式)显示在终端上,同时将此字符形式的哈夫曼树写入文件 treeprint 中。设字符集及频度如下表:J K L M格频度 186 64 23 22 32 103 21 15 47 57 1 5 32 20字符 N O P Q R S T U V W X Y Z频度 20 56 19 2

7、50 51 55 30 10 11 2 21 2共 33 页 第 5 页 (完整 word 版)数据结构课程设计(哈夫曼编码)3 系统设计(1)设计思路及方案本课题是用最优二叉树即哈夫曼树来实现哈夫曼编码译码器的功能。假设每种字符在电文中出现的次数为 Wi,编码长度为 Li,电文中有 n 种字符,则电文编码总长度为(W1L1)+(W2L2)+ +(Wi*Li)。若将此对应到二叉树上,Wi 为叶结点,Li 为根结点到叶结点的路径长度。那么,(W1*L1)+(W2*L2)+ +(Wi*Li)恰好为二叉树上带权路径长度。因此,设计电文总长最短的二进制前缀编码,就是以 n 种字符出现的频率作权,构造一

8、棵哈夫曼树,此构造过程称为哈夫曼编码。该系统将实现以下几大功能:从硬盘读取字符串,建立哈夫曼树,输出哈夫曼树的存储结构的初态和终态,输出各种字符出现的次数以及哈夫曼编码的译码等。(2)模块的设计及介绍从硬盘读取字符串fileopen(参数)实现命令;打印输出;建立 HuffmanTree通过三个函数来实现:void select(参数)初始化;共 33 页 第 6 页 (完整 word 版)数据结构课程设计(哈夫曼编码)for接受命令;处理命令;说明:在 ht1。.。.k中选择 parent 为 0 且权值最小的两个根结点的算法int jsq(参数)初始化;for接受命令;处理命令;说明:统计

9、字符串中各种字母的个数以及字符的种类void ChuffmanTree()初始化;for共 33 页 第 7 页 (完整 word 版)数据结构课程设计(哈夫曼编码)接受命令;处理命令;输出字符统计情况;说明:构造哈夫曼树输出哈夫曼树的存储结构的初态和终态分别调用 print1()和 print2()来实现void print1(参数)初始化;输出初态;说明:输出哈夫曼树的初态void print2(参数)for输出终态;说明:输出哈夫曼树的终态共 33 页 第 8 页 (完整 word 版)数据结构课程设计(哈夫曼编码)哈夫曼编码和译码void HuffmanEncoding(参数)定义变量

10、;处理命令;说明:哈夫曼编码char*decode(参数)定义变量;while接受命令;处理命令;说明:哈夫曼译码(3)主要模块程序流程图下面介绍三个主要的程序模块流程图:主函数流程图:共 33 页 第 9 页 (完整 word 版)数据结构课程设计(哈夫曼编码)开始否打开文件?是字符总数 num统计字符种类及频率建立哈夫曼树结束图 3.1流程图注释:该图比较简单,主要是调用各个函数模块,首先代开已经存在的文件,然后统计总的字符数以及出现的各个字符和频率.然后才开始建立哈夫曼树,接着在哈夫曼树的基础上对其进行编码,编码之后才是译码。最后输出结束。共 33 页 第 10 页 (完整 word 版

11、)数据结构课程设计(哈夫曼编码)构造哈夫曼树:开始第 i 个结点权值否i=num?是第 i 个根结点否是创建哈夫曼树输出字符统计情况否i=num?是结束图 3.2流程图注释:该图是表示构造哈夫曼树的过程。首先输入 num 个叶结点的权值,当 i=num 是循环结束。然后进行哈夫曼树的构建,当 i=2*num-1 是循环结束。最后输出所得到的字符统计情况。共 33 页 第 11 页 (完整 word 版)数据结构课程设计(哈夫曼编码)哈夫曼编码:开始Cd-start=0,start=numTp.lchlid=c?是否Cd-start=1是i=num?否结束图 3。3流程图解释:该流程图表四哈夫曼

12、编码情况.首先初始化,Cdstart=0,start=num。然后进行编码,使用了一个三目运算符.cdstart =(Tp.lchild=c) ? 0 : 1,即当cd-start=Tp.lchild= =c 时,cd-start=0;当 cd-start=Tp。lchild!= =c 时,cd-start=1。这个编码循环一直到 i=num 时结束。共 33 页 第 12 页 (完整 word 版)数据结构课程设计(哈夫曼编码)共 33 页 第 13 页 (完整 word 版)数据结构课程设计(哈夫曼编码)4 系统实现各模块关键代码及算法的解释:(1)主调函数代码解释:这是 main 函数里

13、的各个函数调用情况。fileopen(string);/从硬盘中读取文件num=jsq(string,cnt,str);DhuffmanTree(HT,cnt,str);/统计字符种类及各类字符出现的频率printf(”HuffmanTree 的初态:n);print1(HT);/输出哈夫曼树的初态ChuffmanTree(HT,HC,cnt,str);/建立哈夫曼树HuffmanEncoding(HT,HC);/生成哈夫曼编码printf(”HuffmanTree 的终态:n);print2(HT);/输出哈夫曼树的终态/读编码文件译码s=decode(HC);printf(译码后的字符串:

14、n”);printf(%sn,s);/输出译码后的字符串(2)建立 HuffmanTree代码解释:该函数为在 ht1.。k中选择 parent 为 0 且权值最小的两个根结点的算法,其序号为 s1 和 s2。void select(HuffmanTree T,int k,int s1,int &s2)int i,j;共 33 页 第 14 页 (完整 word 版)数据结构课程设计(哈夫曼编码)int min1=101;for(i=1;i=k;i+)if(Ti。weightmin1 &Ti。parent=0)j=i;min1=Ti。weight;s1=j;min1=32767;for (i=

15、1;i=k;i+)if(Ti。weightmin1 & Ti.parent=0 & i!=s1)j=i;min1=Ti.weight;s2=j;代码解释:下面函数用来统计字符串中各种字母的个数以及字符的种类.当字符在 A 和 Z之间时即被计数,并用 strj 保存字母到数组中,用 cntj统计每种字符个数。j 返回总共读取的字符数目。int jsq(char *s,int cnt,char str)int i,j,k;char p;int temp27;共 33 页 第 15 页 (完整 word 版)数据结构课程设计(哈夫曼编码)for(i=1;i=26;i+)tempi=0;for(p=s

16、; p!=0;p+)if(*p=A&p=Z)k=p64;tempk+;/统计各种字符的个数for(i=1,j=0;i=26;+i)if(tempi!=0 )j+;strj=i+64;/送对应的字母到数组中cntj=tempi; /存入对应字母的权值return j;/j 是输入字母总数代码解释:下面函数用来构造哈夫曼树 HT。首先初始化哈夫曼树,然后输入前面统计的各结点的权值,用 for 循环来构造哈夫曼树.void ChuffmanTree(HuffmanTree HT,HuffmanCode HC,int cnt,char str)共 33 页 第 16 页 (完整 word 版)数据结构

17、课程设计(哈夫曼编码)int i,s1,s2;for(i=1;i=2*num-1;i+)/初始化 HT,2*num-1 是指哈夫曼/所有的结点数目HTi.lchild=0;HTi。rchild=0;HTi.parent=0;HTi。weight=0;for(i=1;i=num;i+)HTi.weight=cnti;/输入 num 个叶结点的权值for(i=num+1;i=2num-1;i+)select(HT,i1,s1,s2);HTs1。parent=i;HTs2。parent=i;HTi.lchild=s1; HTi.rchild=s2;HTi.weight=HTs1.weight+HTs

18、2。weight;/在 ht1.k中选择 parent 为 0 且权值最小/的两个根结点,其序号为 s1 和 s2,i 为双亲for(i=0;i=num;i+) /输入字符集的中字符HCi。ch=stri;i=1;while(i=num)/字符的种类共 33 页 第 17 页 (完整 word 版)数据结构课程设计(哈夫曼编码)printf(”字符c 次数:dn,HCi。ch,cnti+);/输出统计的情况(3)生成 Huffman 编码并写入文件代码解释:根据哈夫曼树 T 求哈夫曼编码 H.void HuffmanEncoding(HuffmanTree T,HuffmanCode H)in

19、t c,p,i;char cdn;int start;cdnum=0;for(i=1;i=num;+i)/c 和 p 分别指示 t 中孩子和双亲/临时存放编码串/指示码在 cd 中的起始位置/最后一位(第 num 个)放上串结束符start=num;c=i;/初始位置/从叶子结点 ti开始上溯while((p=Tc.parent)0) /直至上溯到 tc是树根为止cd-start=(Tp。lchild=c) ? 0 : 1;c=p;/若 tc是 tp的左孩子/则生成 0;否则生成底码strcpy(Hi。bits,cdstart);Hi.len=numstart;共 33 页 第 18 页 (完

20、整 word 版)数据结构课程设计(哈夫曼编码)代码解释:对 str 所代表的字符串进行编码并写入文件。将翻译的二进制码写入文本文件。void coding(HuffmanCode HC ,char str)int i,j;FILE *fp;fp=fopen(”codefile.txt”,”w”);while(*str)for(i=1;i=num;i+)if(HCi. ch=str)for(j=0 ;j=HCi。len;j+)fputc(HCi.bitsj,fp) ;break;str+;fclose(fp);(4)电文译码代码解释:代码文件 codefile.txt 的译码,将翻译的二进制码

21、译成原来的字符.共 33 页 第 19 页 (完整 word 版)数据结构课程设计(哈夫曼编码)char*decode(HuffmanCode HC) FILE *fp;char str254;/假设远文本文件不超过 254 个字符char *p;static char cdn+1;int i,j,k=0,cjs;fp=fopen(codefile。txt,r”);/一只读的方式打开文本文档/codefile。txtwhile(!feof(fp)/feof(fp)判断文件是否真正结束,/feof(fp)=1 时文件结束cjs=0;for(i=0;inum cjs=0 & !feof(fp);i

22、+)cdi= ;cdi+1=0;cdi=fgetc(fp);/数组接受从 fp 指针所指向文件中读/入的一个字符for(j=1;j=num;j+)if(strcmp(HCj.bits,cd)=0)strk=HCj 。ch;k+;共 33 页 第 20 页 (完整 word 版)数据结构课程设计(哈夫曼编码)cjs=1;break;/haffman 编码和密码译码相比较strk=0;p=str;return p;共 33 页 第 21 页 (完整 word 版)数据结构课程设计(哈夫曼编码)5 系统调试图 5.1输出哈夫曼树存储结构的初态(见图 5。2):共 33 页 第 22 页 (完整 wo

23、rd 版)数据结构课程设计(哈夫曼编码)输出哈夫曼树存储结构的终态(见图 5.4):由此可见,此次测试很成功。我们能够将文本文档中的文段读出,并将其统计并输出字符种类和每种字符出现的频率。同时输出哈夫曼树存储结构的初态和终态。然后输出译码后的字符。共 33 页 第 23 页 (完整 word 版)数据结构课程设计(哈夫曼编码)共 33 页 第 24 页 (完整 word 版)数据结构课程设计(哈夫曼编码)小 结通过一周的课程设计使我对哈夫曼树以及哈夫曼编码有了更深的认识和理解,也使我更加明白哈夫曼编码译码在信息技术中的重要性和地位.首先我谈谈我在设计期间我遇到的难点。开始的时候,代码中有许多的

24、错误,特别是有一个“无法找到文件的错误让我束手无策,最后还是屏蔽了定义的四个头文件然后慢慢地改正错误才让我又看到了希望。然后在实现文章的读入时,由于对文件不是太熟悉,只好翻开C 语言书本仿照其模式编写,但后来进入了死循环,最后的解决方式是把 main 函数里的一个 do while 循环去掉。在程序中,我还另外加了一个功能-输出哈夫曼树的存储结构的初态和终态。这使得我更加的明白了哈夫曼到底是怎么存储信息的.许多的错误让我明白了一个道理-细心是非常重要的。同时,对于编程者而言,思路清晰是相当重要的.在适当的时候和同学一起交流探讨是一个十分好的学习机会。请教老师也很重要,因为毕竟我们是新手,对于某

25、些问题很难弄清楚.而且,某些错误对于我们来说有时候想半天都弄不来,但老师几下下就搞好了,这样就更加有效地节约了时间。这次课程设计不但让我学得了一些编程知识,还学会了系统的做一份课程设计报告,学会了如何截图,学会了如何更好的画流程图,明白了做事情只有认真,才能真正做得更好!共 33 页 第 25 页 (完整 word 版)数据结构课程设计(哈夫曼编码)参考文献1 严蔚敏.数据结构(C 语言版)。清华大学出版社,20072 苏仕华。数据结构课程设计.机械工业出版社,20073 谭浩强.C 语言程序设计教程。高等教育出版社,2006共 33 页 第 26 页 (完整 word 版)数据结构课程设计(

26、哈夫曼编码)附录 源程序include include string.hinclude stdlib。hincludefstream.h/*类型相关变量的定义*#define n 100/叶子结点数#define m 2n-1typedef structchar ch;/哈夫曼树中的结点树char bits9;/存放编码位串int len;CodeNode;typedef CodeNode HuffmanCoden+1;typedef struct int weight;/权值int lchild,rchild,parent;HTNode;/左右孩子几双亲指针typedef HTNode Hu

27、ffmanTreem+1;int num;/0 号单元不用/*建立 HuffmanTree*void select(HuffmanTree T,int k,int s1,int &s2) /在 ht1.。.k中选择 parent 为 0 且权值最小的两个根结点的算法/其序号为 s1 和 s2int i,j;int min1=101;for(i=1;i=k;i+)if(Ti.weightmin1 &Ti。parent=0)j=i;min1=Ti.weight;s1=j;min1=32767;for (i=1;i=k;i+)if(Ti。weightmin1 Ti.parent=0 & i!=s1)

28、共 33 页 第 27 页 (完整 word 版)数据结构课程设计(哈夫曼编码)j=i;min1=Ti.weight;s2=j;int jsq(char *s,int cnt,char str) /统计字符串中各种字母的个数以及字符的种类int i,j,k;char *p;int temp27;for(i=1;i=26;i+)tempi=0;for(p=s; *p!=0;p+)/统计各种字符的个数if(*p=A&*p=Z)k=p64;tempk+;for(i=1,j=0;i=26;+i)if(tempi!=0 )j+;strj=i+64;cnt j=tempi;/送对应的字母到数组中/存入对应

29、字母的权值return j;/j 是输入字母总数void ChuffmanTree(HuffmanTree HT,HuffmanCode HC,int cnt,char str)/构造哈夫曼树 HTint i,s1,s2;for(i=1;i=2*num1;i+)/初始化 HT,2*num1 是指哈夫曼树所有的结点数目HTi。lchild=0;HTi。rchild=0;HTi.parent=0;HTi.weight=0;共 33 页 第 28 页 (完整 word 版)数据结构课程设计(哈夫曼编码)for(i=1;i=num;i+)/输入 num 个叶结点的权值HTi。weight=cnti;f

30、or(i=num+1;i=2*num-1;i+) /在 ht1。.k中选择 parent 为 0 且权值最小的两个根结点/其序号为 s1 和 s2/i 为双亲select(HT,i1,s1,s2);HTs1。parent=i;HTs2。parent=i;HTi。lchild=s1; HTi.rchild=s2;HTi。weight=HTs1.weight+HTs2.weight;for(i=0;i=num;i+)HCi.ch=stri;/输入字符集的中字符/字符的种类i=1;while(i=num)printf(”字符%c 次数:%dn”,HCi。ch,cnti+);/*生成 Huffman

31、编码并写入文件*void HuffmanEncoding(HuffmanTree T,HuffmanCode H)/根据哈夫曼树 T 求哈夫曼编码 H/c 和 p 分别指示 t 中孩子和双亲/临时存放编码串int c,p,i;char cdn;int start;/指示码在 cd 中的起始位置/最后一位(第 num 个)放上串结束符cdnum=0;for(i=1;i0) /直至上溯到 tc是树根为止/若 tc是 tp的左孩子,则生成 0;否则生成底码cdstart =(Tp.lchild=c) ? 0 : 1;c=p;strcpy(Hi.bits,&cdstart);Hi.len=num-st

32、art;共 33 页 第 29 页 (完整 word 版)数据结构课程设计(哈夫曼编码)void coding(HuffmanCode HC ,char *str)/对 str 所代表的字符串进行编码 并写入文件int i,j;FILE *fp;fp=fopen(”codefile.txt”,”w”);while(str)for(i=1;i=num;i+)if(HCi. ch=str)for( j=0;j=HCi。len;j+)fputc(HCi。bitsj,fp);break;str+;fclose(fp);/*电文译码*chardecode(HuffmanCode HC)/代码文件 cod

33、efile.txt 的译码FILE fp;char str254;char *p;/假设远文本文件不超过 254 个字符static char cdn+1;int i,j,k=0,cjs;fp=fopen(”codefile.txt”,”r);/一只读的方式打开文本文档 codefile.txtwhile(!feof(fp))/feof(fp)判断文件是否真正结束,feof(fp)=1 时文件结束cjs=0;for(i=0;inum & cjs=0 & !feof(fp);i+)cdi= ;cdi+1=0;cdi=fgetc(fp);/数组接受从 fp 指针所指向文件中读入的一个字符for( j=1;j=num;j+)if(strcmp(HCj。bits,cd)=0)/haffman 编码和密码译码相比较strk=HCj.ch;共 33 页 第 30 页 (完整 word 版)数据结构课程设计(哈夫曼编码)k+;cjs=1;break;strk=0;p=str;return p;/*输出 HuffmanTree 存储结构*void print1(HuffmanTree H

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论