版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、熵、联合熵、条件熵目标理解各种熵的概念; 掌握离散信源各种熵的基本性质有两个含义: 1、当事件发生前,表示该事件发生的不确定性;2、当事件发生后,标是该事件所提供的信息量 自信息量的单位取决于对数所取的底,若以2为底,单位为比特,以e为底,单位为奈特,以10为底,单位为哈特,通常取比特为单位回顾(1)回顾(1)例1:设天气预报有两种消息,晴天和雨天,出现的概率分别为1/4和3/4,我们分别用 来表示晴天,以 来表示雨天,则我们的信源模型如下: 对一个信源发出不同的消息所含有的信息量也不同。自信息是一个随机变量,不能用它来作为整个信源的信息测度信息熵具有以下两种物理含义:1、表示信源输出前信源的
2、平均不确定性2、表示信源输出后,每个符号所携带的平均信息量熵的单位取决于对数所取的底,若以2为底,单位为比特/符号回顾(2)熵是从整个集合的统计特性来考虑的,它从平均意义上来表征信源的总体特征。说明自信息量I(x1 )和I(x2 )只是表征信源中各个符号的不确定度,一个信源总是包含着多个符号消息,各个符号消息又按概率空间的先验概率分布,因而各个符号的自信息量就不同。所以自信息量不能作为信源总体的信息量。平均不确定度H(X)的定义公式与热力学中熵的表示形式相同,所以又把H(X)称为信源X的熵。熵是在平均意义上来表征信源的总体特性的,可以表征信源的平均不确定度。 说明信息量则只有当信源输出符号而被
3、接收者收到后,才有意义,这就是给予接收者的信息度量,这值本身也可以是随机量,也可以与接收者的情况有关。某一信源,不管它是否输出符号,只要这些符号具有某些概率特性,必有信源的熵值;这熵值是在总体平均上才有意义,因而是一个确定值,一般写成H(X) , X是指随机变量的整体(包括概率分布)。说明作业相关人口问题:在某个地区,一对夫妻只允许生一个孩子,可是这里所有的夫妻都希望能生个男孩传宗接代,因此这里的夫妻都会一直生到生了一个男孩为止,假定生男生女的概率相同问: (1)这个地区男孩会多于女孩吗? (2)一个家庭孩子的个数用离散随机变量X表示,计算X的熵 解: 假定一个家庭里有k个女孩,1个男孩,相应
4、的概率是0.5k * 0.5,因此女孩的平均数是 ,女孩的平均数与男孩的平均数相等。 习题相关设离散无记忆信源其发生的消息为(202120190213001203210110321010021032019223210)(1)此消息的自信息是多少?(2)在此消息中平均每个符号携带的信息量是多少? 解: (1)因为离散信源是无记忆的,所以其发出的消息序列中各符号是统计独立的。因此,此消息的自信息就等于消息中各个符号的自信息之和!根据题意,可得此消息中共有14个“0”符号,13个“1”符号,12个“2”符号,6个“3”符号,则得到消息的自信息是习题相关(2)此消息中共含45个信源符号,这45个信源符
5、号携带着8781比特信息量,则此消息中平均每个符号携带的信息量为(202120190213001203210110321010021032019223210) 注意:此值是此消息中平均每个符号携带的信息量该离散无记忆信源平均每个符号携带的信息量,即信息墒习题相关新授课联合熵与条件熵熵、联合熵与条件熵信息熵的基本性质新授课联合熵与条件熵熵、联合熵与条件熵信息熵的基本性质信源发出序列中只有前后两个符号间有依赖关系:信源的概率空间:连续两个信源符号出现的联合概率分布为:联合熵与条件熵已知符号 出现后,紧跟着 出现的条件概率为: 由二维离散信源的发出符号序列的特点可以把其分成每两个符号一组,每组代表新
6、信源 中的一个符号。并假设组与组之间是统计独立的,互不相关的。 得到一个新的离散无记忆信源 ,其联合概率空间为:联合熵与条件熵根据(信息)熵的定义,可得:(1)联合熵可以表征信源输出长度为2的平均不确定性,或所含有的信息量。说明: 联合熵是随机序列 联合离散符号集上的每个符号对 联合自信息量的数学期望联合熵与条件熵(2)条件熵则:联合熵与条件熵随机序列 的联合符号集上的条件自信息量的数学期望例题已知二维随机变量 的联合概率分布 为 求解:由又由所以新授课联合熵与条件熵 熵、联合熵与条件熵信息熵的基本性质H(X,Y)H(X)H(YX)H(X,Y)H(Y)H(XY) 证明: 熵、联合熵与条件熵 所
7、以熵、联合熵与条件熵证明: 由熵、联合熵与条件熵H(XY)H(Y)H(XY)所以熵、联合熵与条件熵 例 某一二维离散信源其发出的符号只与前一个符号有关,即可用联合概率P(xi ,xj )给出它们的关联程度,如下表所示 求信源的熵H(X)、条件熵H(X2|X1 )和联合熵H(X1,X2 ) 。P(xi ,xj )xjxi01201/41/18011/181/31/18201/187/36 解:根据概率关系可计算得条件概率P(xj|xi),计算 结果列表如下:xjxi01209/111/8012/113/42/9201/87/9P(xixj )xjxi01201/41/18011/181/31/1
8、8201/187/36 得:H(X):表示信源中每个符号的平均信息量(信源熵)。H(Y):表示信宿中每个符号的平均信息量(信宿熵)。H(X|Y):表示在输出端接收到Y的全部符号后,发送端X尚存的平均不确定性。这个对X尚存的不确定性是由于干扰引起的。信道疑义度(损失熵,含糊度)H(Y|X):表示在已知X的全部符号后,对于输出Y尚存的平均不确定性。信道散布度(噪声熵)H(XY):表示整个信息传输系统的平均不确定性(联合熵)。熵的意义(对通信系统) 熵之间的相互关系H(X,Y) = H(X) + H(Y|X)H(X,Y) = H(Y) + H(X|Y)H(X) = H(X|Y)H(Y) = H(Y|
9、X)H(X,Y) 0 ;2)若X与Y独立,则H(X)=H(X|Y) ;3) 如果H(X|YZ)=0,则要么H(X|Y)=0 , 要么H(X|Z)=0 ;4)H(X|X)=0 ;5)若X与Y独立,则H(X|Y)= H(Y|X) .x只有个可能的结果,H(X)0p(x)=p(x|y)H(X|Y=y)=H(X)棋子所在的位置:横格和纵格共同决定FFFTT该信源的熵H(X) log6不满足熵的极值性?2.652.58判断题1)H(X)0 ;2)若X与Y独立,则H(X)=H(X|Y) ;3) 如果H(X|YZ)=0,则要么H(X|Y)=0 , 要么H(X|Z)=0 ;4)H(X|X)=0 ;5)若X与Y
10、独立,则H(X|Y)= H(Y|X) .x只有个可能的结果,H(X)0p(x)=p(x|y)H(X|Y=y)=H(X)棋子所在的位置:横格和纵格共同决定FFFTT该信源的熵H(X) log6不满足熵的极值性?2.652.58作业P22T1 (除I(X;Y)T6 T1 H(X,Y)=1.825 H(X)=0.9183 H(Y)=1T6 H(X,Y|Z)=H(X|Z)+H(Y|X,Z)H(X|Z) 当H(Y|X,Z)=0,即 Y是X、Z的函数时,原式等号成立。有两个同时输出的信源X和Y,其中X的信源符号为A,B,C ,Y的信源符号为D,E,F,G ,已知 P(X )和P(Y|X),求联合信源的联合
11、熵和条件熵。XABCP(x)1/21/31/6P(y|x)D1/43/101/6E1/41/51/2F1/41/51/6G1/43/101/6扩展训练 1解:信源X的熵为:P(x,y)XABCYD1/81/101/36E1/81/151/12F1/81/151/36G1/81/101/36扩展训练 1信源XY输出每一对消息的联合概率为:P(X,Y) = P(Y/X)P(X) ,结果如上表。联合熵: 条件熵: 扩展训练 1从上述结果可得:H(X,Y)=H(X)+H(Y/X) =1.461+1.956=3.417(bit/每对符号)当两个信源统计独立时,H(X,Y)=H(X)+H(Y)为最大。对第
12、二个信源Y,其熵H(Y)的计算。由全概率公式:扩展训练 1联合熵的最大值为:由于信源相关,使联合熵减小,其减小量为:因此:扩展训练 1电视屏上约有 500 600= 3 105个格点,按每点有 10个不同的灰度等级考虑,则共能组成n=103*10个不同的画面。按等概率1/103*10计算,平均每个画面可提供的信息量为 =3 105 3.32 比特/画面 扩展训练 2有一篇千字文章,假定每字可从万字表中任选,则共有不同的千字文 N=100001000=104000 篇 仍按等概率1/100001000计算,平均每篇千字文可提供的信息量为 H(X)logN4 103332 13 104 比特千字文
13、 比较:“一个电视画面”平均提供的信息量远远超过“一篇千字文”提供的信息量。 扩展训练 3该信源X输出符号只有两个,设为0和1。输出符号发生的概率分别为p和q,pq=1。即信源的概率空间为 则二元信源熵为 H(X)= -plogp-qlogq = -plogp-(1-p)log(1-p )=H(p)扩展训练 40 0.2 0.4 0.6 0.8 110.80.60.40.2pH(p)扩展训练 4信源信息熵H(X)是概率p的函数,通常用H(p)表示。p取值于0,1区间。H(p)函数曲线如图所示。从图中看出,如果二元信源的输出符号是确定的,即p=1或q=1,则该信源不提供任何信息。反之,当二元信源
14、符号0和1以等概率发生时,信源熵达到极大值,等于1比特信息量。 扩展训练 4 有一布袋内放l00个球,其中80个球是红色的,20个球是白色的。随便摸出一个球,猜测是什么颜色,那么其概率空间为: 扩展训练 5解:如果被告知摸出的是红球,那么获得的信息量是: I (a1) log p(a1) log0.8= 0.32 (比特)如被告知摸出来的是白球,所获得的信息量应为:I (a2) log p(a2) log0.2 = 2.32 (比特)平均摸取一次所能获得的信息量为 : H(X)= p(a1) I (a1) + p(a2) I (a2) =0.72(比特/符号)扩展训练 5精彩回顾信息重要性: 食指上网,拇指发信!信息论重要性: 量化信息! 消息的信息含量等于该消息的惊奇程度!对数函数量化信息原由? 1位的推广。 64张纸牌的对分搜索。熵是故事
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 烟台理工学院《数据库原理及应用》2021-2022学年第一学期期末试卷
- 许昌学院《计算机网络技术及应用》2021-2022学年第一学期期末试卷
- 五年级数学(小数乘除法)计算题专项练习及答案
- 徐州工程学院《软件工程基础》2022-2023学年第一学期期末试卷
- 班级团体荣誉感的培养计划
- 学期交流会的内容及形式计划
- 提升小学生的创新思维计划
- 无担保借款合同三篇
- 校园绿色发展倡议计划
- 信阳师范大学《计算机组成原理实验》2021-2022学年第一学期期末试卷
- 五年级下册道德与法治6《我参与我奉献》教学反思2篇
- 中国新闻事业发展史 第十四讲 社会主义新闻事业的曲折发展课件
- 部编版一年级上册语文期末试卷
- 梁祝音乐钢琴五线谱
- 班级卫生常规检查评分表
- (交通综合执法)证据登记保存清单
- 《影视艺术概论》课程教学大纲
- 2021学年第二学期常州市西新桥小学综合学科期末检测方案
- CRRT的护理ppt课件(PPT 36页)
- 在全市产教融合型城市建设工作推进会上的讲话
- 杭州市星级公共厕所设计标准导则
评论
0/150
提交评论