哈夫曼编码实验报告_第1页
哈夫曼编码实验报告_第2页
哈夫曼编码实验报告_第3页
哈夫曼编码实验报告_第4页
哈夫曼编码实验报告_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE5实验一哈夫曼编码一、实验目的掌握哈夫曼编码原理;熟练掌握哈夫曼树的生成方法;3、理解数据编码压缩和译码输出编码的实现。二、实验要求实现哈夫曼编码和译码的生成算法。三、实验内容先统计要压缩编码的文件中的字符字母出现的次数,按字符字母和空格出现的概率对其进行哈夫曼编码,然后读入要编码的文件,编码后存入另一个文件;接着再调出编码后的文件,并对其进行译码输出,最后存入另一个文件中。五、实验原理1、哈夫曼树的定义:假设有n个权值,试构造一颗有n个叶子节点的二叉树,每个叶子带权值为wi,其中树带权路径最小的二叉树成为哈夫曼树或者最优二叉树;2、哈夫曼树的构造:weight为输入的频率数组,把其中的值赋给依次建立的HTNode对象中的data属性,即每一个HTNode对应一个输入的频率。然后根据data属性按从小到大顺序排序,每次从data取出两个最小和此次小的HTNode,将他们的data相加,构造出新的HTNode作为他们的父节点,指针parent,leftchild,rightchild赋相应值。在把这个新的节点插入最小堆。按此步骤可以构造构造出一棵哈夫曼树。

通过已经构造出的哈夫曼树,自底向上,由频率节点开始向上寻找parent,直到parent为树的顶点为止。这样,根据每次向上搜索后,原节点为父节点的左孩子还是右孩子,来记录1或0,这样,每个频率都会有一个01编码与之唯一对应,并且任何编码没有前部分是同其他完整编码一样的。六、实验流程初始化,统计文本文件中各字符的个数作为权值,生成哈夫曼树;根据符号概率的大小按由大到小顺序对符号进行排序;把概率最小的两个符号组成一个节点;重复步骤(2)(3),直到概率和为1;从根节点开始到相应于每个符号的“树叶”,概率大的标“0”,概率小的标“1”;从根节点开始,对符号进行编码;译码时流程逆向进行,从文件中读出哈夫曼树,并利用哈夫曼树将编码序列解码。七、实验程序#include<iostream>#include<fstream>#include<iomanip>#include<vector>usingnamespacestd;typedefstruct//节点结构{ chardata;//记录字符值 longintweight;//记录字符权重 unsignedintparent,lchild,rchild;}HTNode,*HuffmanTree;//动态分配数组存储哈夫曼树typedefchar**HuffmanCode;//动态分配数组存储哈夫曼编码表voidSelect(HuffmanTree&HT,inti,int&s1,int&s2)//在HT[1...t]中选择parent不为0且权值最小的两个结点,其序号分别为s1和s2{ s1=0;s2=0; intn1=30000,n2=30000; for(intk=1;k<=i;k++) { if(HT[k].parent==0) { if(HT[k].weight<n1) { n2=n1;n1=HT[k].weight; s2=s1;s1=k; } else if(HT[k].weight<n2) { n2=HT[k].weight; s2=k; } } }}voidHuffmanCoding(HuffmanTree&HT,HuffmanCode&HC,intn)//将要编码的字符串存入空树中{ ifstreamfin1("zifu.txt"); ifstreamfin2("weight.txt"); if(n<=1)return; intm=2*n-1; inti; HT=newHTNode[m+1]; char*zifu; int*weight;zifu=newchar[n+1]; weight=newint[n+1]; { if(a[i]=='1') p=HT[p].rchild; else p=HT[p].lchild; i++; } fout<<HT[p].data; cout<<HT[p].data; }}voidmain(){ intn; cout<<"输入权值个数:";//设置权值数值 cin>>n; printf("\n"); HuffmanTreeHT;//哈夫曼树HT HuffmanCodeHC;//哈夫曼编码表HC HuffmanCoding(HT,HC,n);//进行哈夫曼编码 printHuffmanCoding(HT,HC,n);//显示编码的字符 printf("\n"); code_file(HT,HC,n);//显示要编码的字符串,并把编码值显示出来 Decoding(HT,HC,n);//译码并显示译码后的字符串 printf("\n\n\n"); system("pause");}八、结果分析哈夫曼编码是动态变长编码,临时建立概率统计表和编码树。概率小的码比较长,概率小的码比较长。概率大的码短,这样把一篇文件编码后,就会压缩许多。从树的角度看,哈夫曼编码方式是尽量把短码都利用上。首先,把一阶节点全都用上,如果码字不够时,然后,再从某个节点伸出若干枝,引出二阶节点作为码字,以此类推,显然所得码长最短,再根据建立的概率统计表合理分布和放置,使其平均码长最短就可以得到最佳码。九、实验总结通过这次实验,我对二叉树和哈希曼树有了更好的认识。在实验过程中,我掌握了哈曼树的构造方法,学会了如何将理论知识传换成实际应用。同时,在解决程序中遇到的一些问题的同时,我也对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论