版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、信息论与编码课程设计报告设计题目:统计信源熵、香农编码与费诺编码专业班级:XXXXXXXXXXXX姓名:XXXXXXXXXXXX学号:XXXXXXXXXXXX指导老师:XXXXXXXXXXXX成 绩:时间:2015年3月31日目录一、设计任务与要求 2二、设计思路 2三、设计流程图 5四、程序及结果 7五、心得体会 11六、参考文献 12附录 13设计任务与要求1. 统计信源熵 要求:统计任意文本文件中各字符(不区分大小写)数量,计算 字符概率,并计算信源熵。2. 香农编码 要求:任意输入消息概率,利用香农编码方法进行编码,并计算 信源熵和编码效率。3. 费诺编码 要求:任意输入消息概率,利用
2、费诺编码方法进行编码,并计算 信源熵和编码效率。二、设计思路1、统计信源熵:统计信源熵就是对一篇英文文章中的 i 种字符(包括标点符号及空格,英文字母不区分大小写)统计其出现的次数coun(t )i ,然后计算其出现的概率p(i),最后由信源熵计算公式:nH(x)p(xi)log p(xi)n1算出信源熵 H (x) 。所以整体步骤就是先统计出文章中总的字符 数,然后统计每种字符的数目, 直到算出所有种类的字符的个数, 进而算出每种字符的概率,再由信源熵计算公式计算出信源熵。 在这里我选择用 Matlab 来计算信源熵, 因为 Matlab 中系统自带 了许多文件操作和字符串操作函数, 其计算
3、功能强大, 所以计算 信源熵很是简单。2、香农编码信源编码模型:信源编码就是从信源符号到码符号的一种映射f,它把信源输出的符号ai变换成码元序列人f: aixi,i 1,2,.,qNS: s ai,., aq 信源信源编码器AXi以1必2.入 码元Sai ,., aqi 1,2,.,NX : x Xi,.,Xr码符号N次扩展信源无失真编码器凡是能载荷一定的信息量, 且码字的平均长度最短,可分离 的变长码的码字集合都可以称为最佳码。为此必须将概率大的信 息符号编以短的码字,概率小的符号编以长的码字,使得平均码字长度最短。能获得最佳码的编码方法主要有:香农(Shannon)、费诺(Fa no)、哈
4、夫曼(Huffman )编码等。香农第一定理:离散无记忆信源为S SS2 SqP P(s)P(S2).P(Sq)熵H(S),其N次扩展为snP1 2P( 1) P( 2)qP( q)熵为H(SN),码符号集为X (Xi,X2,.,Xr)。先对信源SN进行编码,总可以找到一种编码方法,构成唯一可译码,使S中每个信源符号所需的平均码长满足H(S) 1 Ln log r N NH(S) log r且当N时有lNm N第Hr(S)qNL是平均码长Lp( i) i,i 1i是i对应的码字长度香农编码方法:(1)将信源消息符号按其出现的概率大小依次排列:PlP2Pn(2) 确定满足下列不等式整数码长Ki为
5、lb(Pi) Kilb(Pi) 1(3) 为了编成唯一可译码,计算第i个消息的累加概率为i 1PP(aQk 1(4) 将累加概率P变成二进制数。(5) 取R二进制数小数点后Ki位即为该消息符号的二进制码字3、费诺编码方法(1)将信源消息符号按其出现的概率大小依次排列:P1P2 .Pn(2) 将依次排列的信源符号按概率值分为两大组,使两个组的 概率之和近似相同,并对各组赋予一个二进制码元 “0”和“ 1(3) 将每一大组的信源符号再分为两组,使划分后的两个组的概率之和近似相同,并对各组赋予一个二进制符号 “0”和“ 1(4) 如此重复,直至每个组只剩下一个信源符号为止。(5) 信源符号所对应的码
6、字即为费诺码。三、设计流程图1、统计信源熵 由信源熵计算公式H(x) P(xjlog p(xj计算出信源熵 n 12、香农编码开始输入概率矩阵将概率由大到小排列计算累加概率和概率的个数根据公式调用函数计算码长用循环程序编码并调整输出格式计算信源熵和编码效率输出信源熵、编码效率和码字( 结束 )3、费诺编码开始输入概率矩阵将概率由大到小排列计算累加概率和概率的个数在两组概率之和近似相等的条件下将概率分为两组,各赋予0,1两个码元将每一大组的的概率重复上一步操作,直到每组只剩一个概率用循环程序编码并调整输出格式*计算信源熵和编码效率输出信源熵、编码效率和码字/(结束J四、程序及结果1、统计信源熵的
7、Matlab程序fun cti onh=e ntropy(p)clcfid=fopen( shuju.txt ,广);%打开 txt 文件ex,num=fscanf(fid,%c ,inf)滋取二进制文件的数据,并将数据存入矩阵str1=lower(ex)%各字符串中的大写字母转换成小写字母sort_str1=sort(str1); %按照字符的ASCII值对字符串排序j=1;for i=1:length(sort_str1)-1%计算岀字符串的种类if strcmp(sort_str1(i),sort_str1(i+1)=1%比较两个字符串是否完全相等,相等是1,否则0j=j+1;str2(
8、j)=sort_str1(i);endstr2(j+1)=sort_str1(i+1);endfor i = 1:length(str2)%length函数获取字符串长度str_num=strfind(sort_str1,str2(i);%strfind(S1,S2):寻找 S2 是否匹配 S1,并返回 S2的位置cou nt1(i) = len gth(str_ num);endstr2cou nt=cou nt1(3:e nd)p=cou nt./sum(cou nt)sum(-p.*log2(p)册算信源熵待读取的英文:The Pressure of Graduate StudentsN
9、ow I am a post graduate student, I will graduate next year, so I start to find jobs recently, I feel so much pressure, though I have good education, I still get rejection from the companies. The pressure of graduate students are so heavy, the competition is so fierce that many students cant get the
10、ideal jobs. They should adjust theirstrategies.The pressure of graduate students is so heavy. On the one hand, they don t have experience, so they don t know how to get the job interview and miss many chances. On the other hand, there are more and more students have high education, some have receive
11、d higher education, some have studies abroad which make their resumes stand out. Those average students don t have advantages over the above mentioned ones.Average students need to make their resumes specially, so they can have the chance. They can describe their characteristic to fit the job, the e
12、mployers will see this and give you the chance. Students can also make their internship experience stand out, because the employers pay special attention to it.The job pressure is heavy for every graduate student, if the students take the wise strategy, they can have more chances to get the job.程序运行
13、结果: 总共出现的字符种类: ,.abcdefghijklmnoprstuvwxy 每种字符对应出现的次数: 206 16 11 78 10 33 42 161 10 20 65 5385162158 64 1655 80 113 36 2083204每种字符出现的概率: 0.1672 0.0130 0.0089 0.0633 0.00810.02680.03410.13070.00810.01620.05280.04300.00650.00410.01300.01700.04710.05190.01300.04460.06490.09170.02920.01620.00650.00240.0
14、1620.0032信源熵:Hx4.12502、香农编码程序function c=shannon(p)% p=0.25 0.25 0.20 0.15 0.10 0.05;% shannon(p);p,index=sort(p);p=fliplr(p);%从大到小n=length(p);pa=0; %累加概率for i=2:npa(i)=pa(i-1)+p(i-1);endk=ceil(-log2(p);%码长计算c=cell(1,n); %生成元胞数组,存码字,是 for i=1:nci= ;tmp=pa(i);for j=1:k(i)tmp=tmp * 2;if tmp=1tmp=tmp -
15、1;ci(j)=1 ;elseci(j)=0 ;endendend%p%pa%交换回原来的顺序 c=fliplr(c);c(index)=c;fprintf( 信源信息熵 :n );H=sum(-p.*log2(p) %计算信源熵 fprintf( 平均码长 :n );K=sum(p.*k) %计算平均码长 fprintf( 编码效率 :n ); w=H./K %计算编码效率 fprintf( 码字 :n );c程序运行结果:p=0.25 0.25 0.20 0.15 0.10 0.05; shannon(p);信源信息熵 :cell ,跟上一行不一样11110H = 2.4232 平均码长
16、: K = 2.7000 编码效率 : w = 0.8975 码字: c = 01 00 100 101 11013、费诺编码程序主程序function c=fano1(p)% p=0.25 0.25 0.20 0.15 0.10 0.05% c=fano1(p) n=size(p,2);if n=1c=cell(1,1);c1= ;returnendp,index=sort(p);%按概率排序p=fliplr(p);total=sum(p); %总概率 acc=0; %累积概率 flag=0; %是否到达尾部的标志 for i=1:n-1newacc=acc+p(i);if abs(tota
17、l-2 * newacc)=abs(total - 2*acc) flag=1;break ; end acc=newacc;end if flagi=n;endsplit=i; %从分界点对两边的码递归做fanoc1=fano1(p(1:split-1);c2=fano1(p(split:n);c=cell(1,n); %添加前缀 0, 1 for i=1:split-1ci=strcat( 0 ,c1i);endfor i = split:nci=strcat( 1 ,c2i-split+1 ); end %将顺序调整回去 c=fliplr(c);c(index)=c;子程序functio
18、n =fano2(c,p)for i=1:length(c) %求平均码长count(i)=length(cell2mat(c(i);endfprintf( 信源信息熵 :n );H=sum(-p.*log2(p) %计算信源熵fprintf( 平均码长 :n )K=sum(count.*p) %计算平均码长fprintf( 编码效率 :n )w=H./K%计算编码效率fprintf( 码字 :n)c程序运行结果:p=0.25 0.25 0.20 0.15 0.10 0.05c=fano1(p)fano2(c,p)p = 0.2500 0.2500 0.2000 0.1500 0.1000 0
19、.0500c = 00 01 10 110 1110 1111信源信息熵 :H = 2.4232平均码长 :K = 2.4500编码效率 :w = 0.9891码字:c = 00 01 10 110 1110 1111五、心得体会 做这次课程设计前前后后花了三天时间,之前并没有用心 想,只是看了看网上的资料,看人家都是用什么方法解决的。我 看的有用C (包括C+和C#)语言的,有用 Matlab的,还有用 别的什么软件的。由于我对 Matlab 编程还比较熟悉一点,最后 我还是选择用 Matlab 来做。一开始编程,我甚至连一些常用的 Matlab 函数都忘了,没什么想法后我在网上看了一些人用
20、 Matlab 编的程序,拿来仔细研究后也慢慢着编出了自己的程序。 在编程过程中, 遇到了各种问题问题, 有时由于一个小问题不通, 我要反复琢磨半天, 最后发现是在一个小地方上出错了, 真是备 受煎熬, 但这也是编程的乐趣所在, 在这个过程中自己也学到了 许多编程知识和技巧。在编程过程中,我体会到了 Matlab 功能的强大,我需要好 好学习一下,这对我以后在信号处理与仿真计算上有很大帮助。通过这次课程设计, 我对信息论与编码技术中的一些基础知 识,如信源熵、通信系统模型、信道与信源编码等知识又重新学 习了一下, 感觉虽是学过的知识, 但隔一段时间不看合上书自己 竟然什么也想不起来。 学过的知
21、识, 觉得自己早就已经理解了的, 在实际用来解决问题时又是无从下手, 需多看人家的例子, 在此 基础上才能用来解决自己的问题。 我之所以自己一组, 是想真学 到点东西,这过程中很累人, 但这是因为自己当初没有提早准备, 还有就是自己知识也学的不扎实造成的, 于是感悟到做什么事情 都要有计划地提早准备,不然会坐失良机,最后只能悔不当初。 六、 参考文献1 曹雪虹,宗橙 . 信息论与编码(第二版) . 北京:清华大学, 2009.22 王薇,鑫锋.从零开始学 MATLAB .北京: 电子工业,2012.9附录1、统计信源熵的 Matlab 程序function h=entropy(p)clcfid
22、=fopen( shuju.txt , r ); %打开 txt 文件ex,num=fscanf(fid, %c ,inf) %读取二进制文件的数据,并将数据存入矩阵 str1=lower(ex)%将字符串中的大写字母转换成小写字母sort_str1=sort(str1);%按照字符的 ASCII 值对字符串排序j=1;for i=1:length(sort_str1)-1%计算出字符串的种类if strcmp(sort_str1(i),sort_str1(i+1)=1%比较两个字符串是否完全相等,相等是1,否则 0j=j+1;str2(j)=sort_str1(i);endstr2(j+1)
23、=sort_str1(i+1);endfor i = 1:length(str2) %length 函数获取字符串长度str_num=strfind(sort_str1,str2(i);%strfind(S1,S2):寻找 S2 是否匹配 S1,并返回 S2的位置count1(i) = length(str_num);endstr2count=count1(3:end)p=count./sum(count)sum(-p.*log2(p)%计算信源熵2、香农编码程序function c=shannon(p)% p=0.25 0.25 0.20 0.15 0.10 0.05;% shannon(p
24、);p,index=sort(p);p=fliplr(p);%从大到小n=length(p);pa=0; %累加概率for i=2:npa(i)=pa(i-1)+p(i-1);endk=ceil(-log2(p);%码长计算c=cell(1,n);%生成元胞数组,存码字,是cell ,跟上一行不一样for i=1:nci= ;tmp=pa(i);for j=1:k(i)tmp=tmp * 2;if tmp=1tmp=tmp - 1;ci(j)=1 ;else ci(j)= 0 ;endendend %p %pa %交换回原来的顺序 c=fliplr(c);c(index)=c; fprintf( 信源信息熵 :n ); H=sum(-p.*log2(p) %计算信源熵 fprintf( 平均码长 :n );K=sum(p.*k) %计算平均码长 fprintf( 编码效率 :n );
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 14124-2024机械振动与冲击固定建筑结构的振动振动测量及对结构影响评价的指南
- PB-22-8-Hydroxyisoquinoline-isomer-生命科学试剂-MCE-5052
- Lariciresinol-4-O-β-D-glucopyranoside-生命科学试剂-MCE-5846
- E3-Ligase-Ligand-linker-Conjugate-122-生命科学试剂-MCE-1944
- 二零二五年度航空航天产业融资合作协议书
- 二零二五年度用人单位与派遣公司国际化人才派遣服务协议
- 2025年度音乐制作与音乐版权许可合同
- 2025年度活动板房销售与临时办公场所租赁合同
- 二零二五年度商业地产贷款合同范本
- 2025年度饭店短期餐饮服务员劳务派遣协议
- 《春酒》琦君完整版
- 北师大版(2024新版)七年级上册数学第四章《基本平面图形》测试卷(含答案解析)
- 湖南省邵阳市武冈市2024届高三上学期期中考试地理含答案解析
- 2022年内分泌医疗质量控制评价体系与考核标准
- 春节后复工安全教育培训考试试题及答案
- 寄宿制学校工作总结
- 小学数学6年级应用题100道附答案(完整版)
- 2024年江苏农牧科技职业学院单招职业适应性测试题库含答案
- JT-T 1495-2024 公路水运危险性较大工程专项施工方案编制审查规程
- JT-T-390-1999突起路标行业标准
- 2023年四川省成都市武侯区中考物理二诊试卷(含答案)
评论
0/150
提交评论