基于matlab的英文文本信息量的统计正确_第1页
基于matlab的英文文本信息量的统计正确_第2页
基于matlab的英文文本信息量的统计正确_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验一:英文文本信息量的计算一、 实验目的及要求a) 实验目的1、 通过本实验熟悉Matlab软件编程环境2、 编写M文件实现对英文文本信息量的统计,掌握信息量、信源熵的计算方法b) 实验要求1、 了解matlab中M文件的编辑、调试过程2、 编写程序实现对给定英文文本信息量的统计3、 英文文本中字母不区分大小写,考虑空格的信息量,但不考虑标点符号的信息量4、 建议英文文本采用txt格式二、 实验步骤及运行结果记录a) 实验步骤1、查找各个英文字母及空格出现的频率2、在Matlab中读取给定的英文文章(该文章为txt格式)3、计算英文文章的长度4、统计在该文章中各个字母及空格出现的次数并放入数

2、组N中5、计算各个字母和空格的信息量及整篇文章的信息量6、计算信源熵b)实验结果sumI = 3.0516e+003;H = 4.0324三、 程序流程图(附一)四、 程序清单,并注释每条语句(附二)五、 实验小结通过本次实验熟悉了Matlab软件编程环境和一些函数的功能及使用,掌握了信息量、信源熵的计算方法。输入相应的频率计算各个字母、空格及整篇文章的信息量计算信源熵结束开始读取英文文章计算文章的长度嵌套的for循环语句判断是否符合循环条件判断字是否为大写母放入数组N中对应的位置是判断是否为小写字母放入数组N中对应的位置是判断是否为小写字母放入数组N中对应的位置是真if否elseif否els

3、eif假附一:附二:wenzhang=textread('english text.txt','%5c'); %读取英文文章 M=size(wenzhang); row=M(1,1); line=M(1,2); %文章的长度 N=zeros(1,27); for i=1:row for j=1:line if double(wenzhang(i,j)>96&&double(wenzhang(i,j)<=122 N(1,double(wenzhang(i,j)-96)=N(1,double(wenzhang(i,j)-96)+1; el

4、seif double(wenzhang(i,j)>64&&double(wenzhang(i,j)<=90 N(1,double(wenzhang(i,j)-64)=N(1,double(wenzhang(i,j)-64)+1; elseif double(wenzhang(i,j)=32 N(1,27)=N(1,27)+1; end end end %统计各字母和空格出现的个数并存入N数组中。'a'的值为97,'z'的值为122,'A'的值为65,'Z'的值为90,空格的值为32 for i=1:27P(1,i)=N(1,i)/sum(N);end;%各个字母和空格出现的概率I=zeros(1,27);for i=1:27if (P(1,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论