哈夫曼编码实验报告06574_第1页
哈夫曼编码实验报告06574_第2页
哈夫曼编码实验报告06574_第3页
哈夫曼编码实验报告06574_第4页
哈夫曼编码实验报告06574_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选文档试验报告与总结一、试验目的1、 把握哈夫曼编码原理;2、 娴熟把握哈夫曼树的生成方法; 3、理解数据编码压缩和译码输出编码的实现。二、试验要求实现哈夫曼编码和译码的生成算法。三、试验内容先统计要压缩编码的文件中的字符字母消灭的次数,按字符字母和空格消灭的概率对其进行哈夫曼编码,然后读入要编码的文件,编码后存入另一个文件;接着再调出编码后的文件,并对其进行译码输出,最终存入另一个文件中。五、试验原理1、哈夫曼树的定义:假设有n个权值,试构造一颗有n个叶子节点的二叉树,每个叶子带权值为wi,其中树带权路径最小的二叉树成为哈夫曼树或者最优二叉树;2、哈夫曼树的构造:weight为输入的频率数

2、组,把其中的值赋给依次建立的HT Node对象中的data属性,即每一个HT Node对应一个输入的频率。然后依据data属性按从小到大挨次排序,每次从data取出两个最小和此次小的HT Node,将他们的data相加,构造出新的HTNode作为他们的父节点,指针parent,leftchild,rightchild赋相应值。在把这个新的节点插入最小堆。按此步骤可以构造构造出一棵哈夫曼树。 通过已经构造出的哈夫曼树,自底向上,由频率节点开头向上查找parent,直到parent为树的顶点为止。这样,依据每次向上搜寻后,原节点为父节点的左孩子还是右孩子,来记录1或0,这样,每个频率都会有一个01

3、编码与之唯一对应,并且任何编码没有前部分是同其他完整编码一样的。六、试验流程1 初始化,统计文本文件中各字符的个数作为权值,生成哈夫曼树;2 依据符号概率的大小按由大到小挨次对符号进行排序; 3 把概率最小的两个符号组成一个节点;4 重复步骤(2)(3),直到概率和为1;5 从根节点开头到相应于每个符号的“树叶”,概率大的标“0”,概率小的标“1”;6 从根节点开头,对符号进行编码;7 译码时流程逆向进行,从文件中读出哈夫曼树,并利用哈夫曼树将编码序列解码。七、试验程序#include#include#include#includeusing namespace std;typedef str

4、uct /节点结构char data; /记录字符值long int weight; /记录字符权重unsigned int parent,lchild,rchild;HTNode,*HuffmanTree; /动态安排数组存储哈夫曼树typedef char * *HuffmanCode; /动态安排数组存储哈夫曼编码表void Select(HuffmanTree &HT,int i,int &s1,int &s2) /在HT1.t中选择parent不为0且权值最小的两个结点,其序号分别为s1和s2 s1=0;s2=0;int n1=30000,n2=30000;for(int k=1;k

5、=i;k+)if(HTk.parent=0)if(HTk.weightn1)n2=n1; n1=HTk.weight;s2=s1; s1=k;elseif(HTk.weightn2)n2=HTk.weight;s2=k;void HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int n)/将要编码的字符串存入空树中ifstream fin1(zifu.txt);ifstream fin2(weight.txt);if(n=1)return;int m=2*n-1;int i;HT=new HTNodem+1;char *zifu;int *weig

6、ht; zifu= new charn+1;weight=new intn+1;for(i=1;i=n;i+)/将待编码的字符放在zifu数组中char ch;ch=fin1.get();zifui=ch;for(i=1;iweighti;for( i=1;i=n;i+)HTi.data=zifui;HTi.weight=weighti;for(i=n+1;i=m;i+)HTi.data=;for(i=1;i=m;i+)HTi.parent=HTi.lchild=HTi.rchild=0;for(i=n+1;i=m;+i)int s1,s2;Select(HT,i-1,s1,s2);HTs1.

7、parent=i; HTs2.parent=i;HTi.lchild=s1; HTi.rchild=s2;HTi.weight=HTs1.weight+HTs2.weight;HC=(HuffmanCode)malloc(n+1)*sizeof(char*);开拓一个求编码的工作空间char *cd;cd=(char *)malloc(n*sizeof(char);/开拓空间存放权值cdn-1=0;for(i=1;i=n;i+)int start=n-1;int c,f;for( c=i, f=HTi.parent;f!=0;c=f,f=HTf.parent)/从叶子到根逆向求编码if(HTf

8、.lchild=c)cd-start=0;/若是左孩子编为0elsecd-start=1;/若是右孩子编为1HCi=(char *)malloc(n-start)*sizeof(char); /为第i个编码安排空间strcpy(HCi,&cdstart);delete cd; /释放工作空间void printHuffmanTree(HuffmanTree HT,int n) /显示有n个叶子结点的哈夫曼树的编码表 ofstream fout(hfmtree.txt); /将对应字符的的哈弗曼树存入coutNUM data weight parent lchild rchlidendl;for

9、(int i=1;i=2*n-1;i+)foutHTi.weightsetw(3)HTi.parentsetw(3)HTi.lchildsetw(3)HTi.rchildendl;coutisetw(5)HTi.datasetw(3)HTi.weightsetw(3)HTi.parentsetw(3)HTi.lchildsetw(3)HTi.rchildendl;void printHuffmanCoding(HuffmanTree HT,HuffmanCode HC,int n)/输出字符的对应哈弗曼编码并存入code.txt文件coutHuffman code is:endl;ofstre

10、am fout(code.txt);for(int i=1;i=n;i+)coutHTi.data ;cout(HCi)endl;fout(HCi)endl;void code_file(HuffmanTree HT,HuffmanCode HC,int n)/对文件tobetran.txt进行编码,并将编码存入codefile文件中ifstream fin(tobetran.txt);ofstream fout(codefile.txt);vector a;char ch;while(ch=fin.get()!=*)a.push_back(ch); cout待编码的字符串为:;for(int

11、 k=0;ka.size();k+)coutak;coutendl;coutn编码结果:endl;for(int i=0;ia.size();i+) for(int j=1;j=n;j+)if(ai=HTj.data) foutHCj; break;fin.close();fout.close();void Decoding(HuffmanTree HT,HuffmanCode HC,int n)/打开codefile文件并对文件内容进行译码int const m=2*n-1;ifstream fin(codefile.txt);ofstream fout(textfile.txt);vect

12、or a;for(char c;finc;) a.push_back(c); int count=0;for(int k=0;ka.size();k+) coutak;count+;if(count%50=0)coutendl;int i=0;int p; /用p来记住m的值coutendl;coutn译码结果:endl;while(ia.size()p=m; /从哈弗曼数的根开头遍历while(HTp.lchild) if(ai=1) p=HTp.rchild; else p=HTp.lchild; i+;foutHTp.data; coutHTp.data;void main()int n

13、;coutn; printf(n);HuffmanTree HT; /哈夫曼树HTHuffmanCode HC; /哈夫曼编码表HCHuffmanCoding(HT,HC,n); /进行哈夫曼编码printHuffmanCoding(HT,HC,n); /显示编码的字符printf(n);code_file(HT,HC,n); /显示要编码的字符串,并把编码值显示出来Decoding(HT,HC,n); /译码并显示译码后的字符串printf(nnn);system(pause);八、结果分析哈夫曼编码是动态变长编码,临时建立概率统计表和编码树。概率小的码比较长,概率小的码比较长。概率大的码短,这样把一篇文件编码后,就会压缩很多。从树的角度看,哈夫曼编码方式是尽量把短码都利用上。首先,把一阶节点全都用上,假如码字不够时,然后,再从某个节点伸出若干枝,引出二阶节点作为码字,以此类推,明显所得码长最短,再依据建立的概率统计表合理分布和放置,使其平均码长最短就可以得到最佳码。九、试验总结通过这次试

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论