




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验报告与总结一、实验目的1、 掌握哈夫曼编码原理;2、 熟练掌握哈夫曼树的生成方法; 3、理解数据编码压缩和译码输出编码的实现。二、实验要求实现哈夫曼编码和译码的生成算法。三、实验内容先统计要压缩编码的文件中的字符字母出现的次数,按字符字母和空格出现的概率对其进行哈夫曼编码,然后读入要编码的文件,编码后存入另一个文件;接着再调出编码后的文件,并对其进行译码输出,最后存入另一个文件中。五、实验原理1、哈夫曼树的定义:假设有n个权值,试构造一颗有n个叶子节点的二叉树,每个叶子带权值为wi,其中树带权路径最小的二叉树成为哈夫曼树或者最优二叉树;2、哈夫曼树的构造:weight为输入的频率数组,把其
2、中的值赋给依次建立的HT Node对象中的data属性,即每一个HT Node对应一个输入的频率。然后根据data属性按从小到大顺序排序,每次从data取出两个最小和此次小的HT Node,将他们的data相加,构造出新的HTNode作为他们的父节点,指针parent,leftchild,rightchild赋相应值。在把这个新的节点插入最小堆。按此步骤可以构造构造出一棵哈夫曼树。 通过已经构造出的哈夫曼树,自底向上,由频率节点开始向上寻找parent,直到parent为树的顶点为止。这样,根据每次向上搜索后,原节点为父节点的左孩子还是右孩子,来记录1或0,这样,每个频率都会有一个01编码与之
3、唯一对应,并且任何编码没有前部分是同其他完整编码一样的。六、实验流程1 初始化,统计文本文件中各字符的个数作为权值,生成哈夫曼树;2 根据符号概率的大小按由大到小顺序对符号进行排序; 3 把概率最小的两个符号组成一个节点;4 重复步骤(2)(3),直到概率和为1;5 从根节点开始到相应于每个符号的“树叶”,概率大的标“0”,概率小的标“1”;6 从根节点开始,对符号进行编码;7 译码时流程逆向进行,从文件中读出哈夫曼树,并利用哈夫曼树将编码序列解码。七、实验程序#include#include#include#includeusing namespace std;typedef struct
4、/节点结构char data; /记录字符值long int weight; /记录字符权重unsigned int parent,lchild,rchild;HTNode,*HuffmanTree; /动态分配数组存储哈夫曼树typedef char * *HuffmanCode; /动态分配数组存储哈夫曼编码表void Select(HuffmanTree &HT,int i,int &s1,int &s2) /在HT1.t中选择parent不为0且权值最小的两个结点,其序号分别为s1和s2 s1=0;s2=0;int n1=30000,n2=30000;for(int k=1;k=i;k
5、+)if(HTk.parent=0)if(HTk.weightn1)n2=n1; n1=HTk.weight;s2=s1; s1=k;elseif(HTk.weightn2)n2=HTk.weight;s2=k;void HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int n)/将要编码的字符串存入空树中ifstream fin1(zifu.txt);ifstream fin2(weight.txt);if(n=1)return;int m=2*n-1;int i;HT=new HTNodem+1;char *zifu;int *weight;
6、zifu= new charn+1;weight=new intn+1;for(i=1;i=n;i+)/将待编码的字符放在zifu数组中char ch;ch=fin1.get();zifui=ch;for(i=1;iweighti;for( i=1;i=n;i+)HTi.data=zifui;HTi.weight=weighti;for(i=n+1;i=m;i+)HTi.data=;for(i=1;i=m;i+)HTi.parent=HTi.lchild=HTi.rchild=0;for(i=n+1;i=m;+i)int s1,s2;Select(HT,i-1,s1,s2);HTs1.pare
7、nt=i; HTs2.parent=i;HTi.lchild=s1; HTi.rchild=s2;HTi.weight=HTs1.weight+HTs2.weight;HC=(HuffmanCode)malloc(n+1)*sizeof(char*);开辟一个求编码的工作空间char *cd;cd=(char *)malloc(n*sizeof(char);/开辟空间存放权值cdn-1=0;for(i=1;i=n;i+)int start=n-1;int c,f;for( c=i, f=HTi.parent;f!=0;c=f,f=HTf.parent)/从叶子到根逆向求编码if(HTf.lch
8、ild=c)cd-start=0;/若是左孩子编为0elsecd-start=1;/若是右孩子编为1HCi=(char *)malloc(n-start)*sizeof(char); /为第i个编码分配空间strcpy(HCi,&cdstart);delete cd; /释放工作空间void printHuffmanTree(HuffmanTree HT,int n) /显示有n个叶子结点的哈夫曼树的编码表 ofstream fout(hfmtree.txt); /将对应字符的的哈弗曼树存入coutNUM data weight parent lchild rchlidendl;for(int
9、 i=1;i=2*n-1;i+)foutHTi.weightsetw(3)HTi.parentsetw(3)HTi.lchildsetw(3)HTi.rchildendl;coutisetw(5)HTi.datasetw(3)HTi.weightsetw(3)HTi.parentsetw(3)HTi.lchildsetw(3)HTi.rchildendl;void printHuffmanCoding(HuffmanTree HT,HuffmanCode HC,int n)/输出字符的对应哈弗曼编码并存入code.txt文件coutHuffman code is:endl;ofstream f
10、out(code.txt);for(int i=1;i=n;i+)coutHTi.data ;cout(HCi)endl;fout(HCi)endl;void code_file(HuffmanTree HT,HuffmanCode HC,int n)/对文件tobetran.txt进行编码,并将编码存入codefile文件中ifstream fin(tobetran.txt);ofstream fout(codefile.txt);vector a;char ch;while(ch=fin.get()!=*)a.push_back(ch); cout待编码的字符串为:;for(int k=0
11、;ka.size();k+)coutak;coutendl;coutn编码结果:endl;for(int i=0;ia.size();i+) for(int j=1;j=n;j+)if(ai=HTj.data) foutHCj; break;fin.close();fout.close();void Decoding(HuffmanTree HT,HuffmanCode HC,int n)/打开codefile文件并对文件内容进行译码int const m=2*n-1;ifstream fin(codefile.txt);ofstream fout(textfile.txt);vector a
12、;for(char c;finc;) a.push_back(c); int count=0;for(int k=0;ka.size();k+) coutak;count+;if(count%50=0)coutendl;int i=0;int p; /用p来记住m的值coutendl;coutn译码结果:endl;while(ia.size()p=m; /从哈弗曼数的根开始遍历while(HTp.lchild) if(ai=1) p=HTp.rchild; else p=HTp.lchild; i+;foutHTp.data; coutHTp.data;void main()int n;cou
13、tn; printf(n);HuffmanTree HT; /哈夫曼树HTHuffmanCode HC; /哈夫曼编码表HCHuffmanCoding(HT,HC,n); /进行哈夫曼编码printHuffmanCoding(HT,HC,n); /显示编码的字符printf(n);code_file(HT,HC,n); /显示要编码的字符串,并把编码值显示出来Decoding(HT,HC,n); /译码并显示译码后的字符串printf(nnn);system(pause);八、结果分析哈夫曼编码是动态变长编码,临时建立概率统计表和编码树。概率小的码比较长,概率小的码比较长。概率大的码短,这样把一篇文件编码后,就会压缩许多。从树的角度看,哈夫曼编码方式是尽量把短码都利用上。首先,把一阶节点全都用上,如果码字不够时,然后,再从某个节点伸出若干枝,引出二阶节点作为码字,以此类推,显然所得码长最短,再根据建立的概率统计表合理分布和放置,使其平均码长最短就可以得到最佳码。九、实验总结通过这次
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中语文古代知识2
- 小儿口腔养护宝典-让孩子们远离口腔疾病
- 智慧医保未来引领-数字化赋能保险革新
- IT运维新领域-智能化工具驱动的解决方案
- SCMP考试内容及试题及答案指南
- 2024年国际物流师课程大纲与试题答案
- 售前方案设计-客户定制维修方案
- 关注2024年国际物流师试题与答案发布
- CPSM考试轻松复习法试题及答案
- 部编人教版(2024版)一年级语文上册拼音11《ao ou iu》精美课件
- GB/T 7588.2-2020电梯制造与安装安全规范第2部分:电梯部件的设计原则、计算和检验
- GB/T 17457-2019球墨铸铁管和管件水泥砂浆内衬
- 紧急采购申请单
- 小学道德与法治学科高级(一级)教师职称考试试题(有答案)
- 复旦大学英语水平测试大纲9300词汇表讲义
- 最新青岛版科学四年级上册《温度计的秘密》优质课件
- DB63-T 1675-2018+建筑消防设施维护保养技术规范
- 四年级上册美术课件-第12课 精美的邮票 ▏人教新课标 ( ) (共21张PPT)
- 炉内水处理磷酸盐处理(PT)、磷酸盐隐藏汇总课件
- 边坡变形观测报告
- 零星材料明细单
评论
0/150
提交评论