哈夫曼编码实验报告_第1页
哈夫曼编码实验报告_第2页
哈夫曼编码实验报告_第3页
哈夫曼编码实验报告_第4页
哈夫曼编码实验报告_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验报告与总结一、实验目的1、 掌握哈夫曼编码原理;2、 熟练掌握哈夫曼树的生成方法; 3、理解数据编码压缩和译码输出编码的实现。二、实验要求实现哈夫曼编码和译码的生成算法。三、实验内容先统计要压缩编码的文件中的字符字母出现的次数,按字符字母和空格出现的概率对其进行哈夫曼编码,然后读入要编码的文件,编码后存入另一个文件;接着再调出编码后的文件,并对其进行译码输出,最后存入另一个文件中。五、实验原理1、哈夫曼树的定义:假设有n个权值,试构造一颗有n个叶子节点的二叉树,每个叶子带权值为wi,其中树带权路径最小的二叉树成为哈夫曼树或者最优二叉树;2、哈夫曼树的构造:weight为输入的频率数组,把其

2、中的值赋给依次建立的ht node对象中的data属性,即每一个ht node对应一个输入的频率。然后根据data属性按从小到大顺序排序,每次从data取出两个最小和此次小的ht node,将他们的data相加,构造出新的htnode作为他们的父节点,指针parent,leftchild,rightchild赋相应值。在把这个新的节点插入最小堆。按此步骤可以构造构造出一棵哈夫曼树。    通过已经构造出的哈夫曼树,自底向上,由频率节点开始向上寻找parent,直到parent为树的顶点为止。这样,根据每次向上搜索后,原节点为父节点的左孩子还是右孩子,来记录1或0,这样,每个

3、频率都会有一个01编码与之唯一对应,并且任何编码没有前部分是同其他完整编码一样的。六、实验流程1 初始化,统计文本文件中各字符的个数作为权值,生成哈夫曼树;2 根据符号概率的大小按由大到小顺序对符号进行排序; 3 把概率最小的两个符号组成一个节点;4 重复步骤(2)(3),直到概率和为1;5 从根节点开始到相应于每个符号的“树叶”,概率大的标“0”,概率小的标“1”;6 从根节点开始,对符号进行编码;7 译码时流程逆向进行,从文件中读出哈夫曼树,并利用哈夫曼树将编码序列解码。七、实验程序#include<iostream>#include<fstream>#includ

4、e<iomanip>#include<vector>using namespace std;typedef struct /节点结构char data; /记录字符值long int weight; /记录字符权重unsigned int parent,lchild,rchild;htnode,*huffmantree; /动态分配数组存储哈夫曼树typedef char * *huffmancode; /动态分配数组存储哈夫曼编码表void select(huffmantree &ht,int i,int &s1,int &s2) /在ht1.

5、t中选择parent不为0且权值最小的两个结点,其序号分别为s1和s2 s1=0;s2=0;int n1=30000,n2=30000;for(int k=1;k<=i;k+)if(htk.parent=0)if(htk.weight<n1)n2=n1; n1=htk.weight;s2=s1; s1=k;elseif(htk.weight<n2)n2=htk.weight;s2=k;void huffmancoding(huffmantree &ht,huffmancode &hc,int n)/将要编码的字符串存入空树中ifstream fin1(&quo

6、t;zifu.txt");ifstream fin2("weight.txt");if(n<=1)return;int m=2*n-1;int i;ht=new htnodem+1;char *zifu;int *weight; zifu= new charn+1;weight=new intn+1;for(i=1;i<=n;i+)/将待编码的字符放在zifu数组中char ch;ch=fin1.get();zifui=ch;for(i=1;i<=n;i+)/将带编码字符对应的权值放在weight数组中fin2>>weighti;fo

7、r( i=1;i<=n;i+)hti.data=zifui;hti.weight=weighti;for(i=n+1;i<=m;i+)hti.data=''for(i=1;i<=m;i+)hti.parent=hti.lchild=hti.rchild=0;for(i=n+1;i<=m;+i)int s1,s2;select(ht,i-1,s1,s2);hts1.parent=i; hts2.parent=i;hti.lchild=s1; hti.rchild=s2;hti.weight=hts1.weight+hts2.weight;hc=(huffm

8、ancode)malloc(n+1)*sizeof(char*);开辟一个求编码的工作空间char *cd;cd=(char *)malloc(n*sizeof(char);/开辟空间存放权值cdn-1='0'for(i=1;i<=n;i+)int start=n-1;int c,f;for( c=i, f=hti.parent;f!=0;c=f,f=htf.parent)/从叶子到根逆向求编码if(htf.lchild=c)cd-start='0'/若是左孩子编为'0'elsecd-start='1'/若是右孩子编为

9、9;1'hci=(char *)malloc(n-start)*sizeof(char); /为第i个编码分配空间strcpy(hci,&cdstart);delete cd; /释放工作空间void printhuffmantree(huffmantree ht,int n) /显示有n个叶子结点的哈夫曼树的编码表 ofstream fout("hfmtree.txt"); /将对应字符的的哈弗曼树存入cout<<"num"<<" "<<"data"<&l

10、t;" "<<"weight"<<" "<<"parent"<<" "<<"lchild"<<" "<<"rchlid"<<endl;for(int i=1;i<=2*n-1;i+)fout<<hti.weight<<setw(3)<<hti.parent<<setw(3)<<

11、hti.lchild<<setw(3)<<hti.rchild<<endl;cout<<i<<setw(5)<<hti.data<<setw(3)<<hti.weight<<setw(3)<<hti.parent<<setw(3)<<hti.lchild<<setw(3)<<hti.rchild<<endl;void printhuffmancoding(huffmantree ht,huffmancode hc,i

12、nt n)/输出字符的对应哈弗曼编码并存入code.txt文件cout<<"huffman code is:"<<endl;ofstream fout("code.txt");for(int i=1;i<=n;i+)cout<<hti.data<<" -> "cout<<(hci)<<endl;fout<<(hci)<<endl;void code_file(huffmantree ht,huffmancode hc,int n

13、)/对文件tobetran.txt进行编码,并将编码存入codefile文件中ifstream fin("tobetran.txt");ofstream fout("codefile.txt");vector<char> a;char ch;while(ch=fin.get()!='*')a.push_back(ch); cout<<"待编码的字符串为:"for(int k=0;k<a.size();k+)cout<<ak;cout<<endl;cout<&l

14、t;"n编码结果:"<<endl;for(int i=0;i<a.size();i+) for(int j=1;j<=n;j+)if(ai=htj.data) fout<<hcj; break;fin.close();fout.close();void decoding(huffmantree ht,huffmancode hc,int n)/打开codefile文件并对文件内容进行译码int const m=2*n-1;ifstream fin("codefile.txt");ofstream fout("

15、textfile.txt");vector<char> a;for(char c;fin>>c;) a.push_back(c); int count=0;for(int k=0;k<a.size();k+) cout<<ak;count+;if(count%50=0)cout<<endl;int i=0;int p; /用p来记住m的值cout<<endl;cout<<"n译码结果:"<<endl;while(i<a.size()p=m; /从哈弗曼数的根开始遍历wh

16、ile(htp.lchild) if(ai='1') p=htp.rchild; else p=htp.lchild; i+;fout<<htp.data; cout<<htp.data;void main()int n;cout<<"输入权值个数:" /设置权值数值cin>>n; printf("n");huffmantree ht; /哈夫曼树hthuffmancode hc; /哈夫曼编码表hchuffmancoding(ht,hc,n); /进行哈夫曼编码printhuffmanco

17、ding(ht,hc,n); /显示编码的字符printf("n");code_file(ht,hc,n); /显示要编码的字符串,并把编码值显示出来decoding(ht,hc,n); /译码并显示译码后的字符串printf("nnn");system("pause");八、结果分析哈夫曼编码是动态变长编码,临时建立概率统计表和编码树。概率小的码比较长,概率小的码比较长。概率大的码短,这样把一篇文件编码后,就会压缩许多。从树的角度看,哈夫曼编码方式是尽量把短码都利用上。首先,把一阶节点全都用上,如果码字不够时,然后,再从某个节点伸出若干枝,引出二阶节点作为码字,以此类推

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论