版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、协方差与相关系数的概念及性质二、相关系数的意义三、小结第三节协方差及相关系数1教学运用
前面我们学习了随机变量的数学期望和方差,对于多维随机变量,除了其数学期望和方差外,我们还要研究反映各分量之间关系的数字特征,其中最重要的,就是现在要讨论的协方差和相关系数1.问题的提出一、协方差与相关系数的概念及性质2教学运用
在讨论这个问题之前,我们先看一个例子。在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关系。3教学运用
这里有两个变量,一个是父亲的身高,一个是成年儿子身高.为了研究二者关系,英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据,画出了一张散点图。儿子的身高父亲的身高问:父亲及其成年儿子身高存在怎样的关系呢?fatherson4教学运用类似的问题有:1、吸烟和患肺癌有什么关系?2、受教育程度和失业有什么关系?3、高考入学分数和大学学习成绩有什么关系?……???5教学运用协方差6教学运用定义对两个随机向量(X,Y),若E(X-EX)(Y-EY)存在,则称cov(X,Y)=E(X-EX)(Y-EY)
为X和Y的协方差。特别,若X=Y,则cov(X,X)=E(X-EX)2=D(X)因此,方差是协方差的特例,协方差刻画两个随机变量之间的“某种”关系.可以证明若(X,Y)服从二维正态分布,即则2.定义7教学运用可见,若X与Y独立,则4.计算协方差的一个简单公式Cov(X,Y)=0.
Cov(X,Y)=E(XY)-E(X)E(Y)
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)3随机变量和的方差与协方差的关系8教学运用(5)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)(3)Cov(X,Y)=Cov(Y,X)(对称性)5.简单性质(4)Cov(aX,bY)=abCov(X,Y)其中a、b是常数下面请大家利用上面所学的知识进行证明。(1)Cov(X,X)=D(X)(2)Cov(X,c)=0(c为常数)9教学运用
协方差的数值在一定程度上反映了X与Y相互间的联系,但它受X与Y本身数值大小的影响.如令X*=kX,Y*=kY,这时X*与Y*间的相互联系和X与Y的相互联系应该是一样的,但是Cov(X*,Y*)=k2Cov(X,Y)
为了克服这一缺点,在计算X与Y的协方差之前,先对X与Y进行标准化:
再来计算X*和Y*的协方差,这样就引进了相关系数的概念.10教学运用为随机变量X和Y的相关系数(correlationcoefficient).1.定义:若D(X)>0,D(Y)>0,且Cov(X,Y)存在时,称
在不致引起混淆时,记
为.二、相关系数11教学运用2.相关系数的性质注意
|ρXY|
的大小反映了X,Y之间线性关系的密切程度:ρXY=0时,X,Y之间无线性关系;|ρXY|=1时,X,Y之间具有线性关系.12教学运用ρXY>0,X,Y正相关ρXY<0,X,Y负相关ρXY≠0,X,Y相关ρXY=0,X,Y不相关(ρXY=1,X,Y完全正相关)(ρXY=-1,X,Y完全负相关)xy0
完全正相关Y=aX+ba>0xy0
完全负相关Y=aX+ba<013教学运用xy0
完全不相关xy0
正相关xy0
负相关14教学运用例:将一枚密度均匀硬币抛n次,分别以X和Y记作正反面出现的次数,则X和Y的相关系数为A:0B:1C:-1D:1或-1解:因为X+Y=n,即P{Y=-X+n}=1,所以X与Y完全负相关,故从而选C。注:若a>0时,ρXY=1a<0时,ρXY=-1则15教学运用例2(X,Y)的联合分布为:X-101Y-1011/81/81/81/801/81/81/81/8求相关系数ρXY,并判断X,Y是否相关,是否独立.解:X-101Y-1011/81/81/83/81/801/82/81/81/81/83/83/82/83/81XY-101P2/84/82/816教学运用例2(X,Y)的联合分布为:X-101Y-1011/81/81/81/801/81/81/81/8求相关系数ρXY,并判断X,Y是否相关,是否独立.解:从而:X-101Y-1011/81/81/83/81/801/82/81/81/81/83/83/82/83/81另一方面:P(X=-1,Y=-1)=1/8≠P(X=-1)P(Y=-1)=(3/8)×(3/8)所以X与Y不独立.17教学运用
这里可以利用相关系数的定义和微积分的知识可得即为X和Y的相关系数,18教学运用结论19教学运用例3解20教学运用21教学运用
X,Y不相关X,Y相互独立X,Y不相关若(X,Y)服从二维正态分布,X,Y相互独立X,Y不相关不相关与相互独立22教学运用解例423教学运用24教学运用25教学运用
这一讲我们主要介绍了协方差和相关系数,相关系数是刻划两个随机变量间线性相关程度的重要的数字特征,它取值在-1到1之间.
如果两个变量之间存在强相关,则已知一个变量的值对预测另一个变量的值将很有帮助,如前面几个引例。小结26教学运用1.定义27教学运用2.协方差矩阵28教学运用29教学运用
例设随机变量X和Y相互独立且X~N(1,2),Y~N(0,1).试求Z=2X-Y+3的概率密度.
故X和Y的联合分布为正态分布,X和Y的任意线性组合是正态分布.解:
X~N(1,2),Y~N(0,1),且X与Y独立,D(Z)=4D(X)+D(Y)=8+1=9E(Z)=2E(X)-E(Y)+3=2+3=5即
Z~N(E(Z),D(Z))30教学运用故Z
的概率密度是Z~N(5,32)31教学运用契比雪夫不等式证明取连续型随机变量的情况来证明.
切比雪夫不等式32教学运用得33教学运用
切比雪夫不等式只利用随机变量的数学期望及方差就可对的概率分布进行估计。从切比雪夫不等式还可以看出,对于给定的
>0,当方差越小时,事件{|X-E(X)|≥
}发生的概率也越小,即X的取值越集中在E(X)附近.这进一步说明方差确实是一个描述随机变量与其期望值离散程度的一个变量.当D(X)已知时,切贝雪夫不等式给出了X与E(X)的偏差小于
的概率的估计值.
切比雪夫不等式的用途:
(1)证明大数定律;(2)估计事件的概率。34教学运用例1
已知正常男性成人血液中,每一毫升白细胞数平均是7300,均方差是700.利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.解:设每毫升白细胞数为X依题意,E(X)=7300,D(X)=7002所求为
P(5200X9400)P(5200X9400)=P(-2100X-E(X)2100)=P{|X-E(X)|2100}35教学运用由切比雪夫不等式
P{|X-E(X)|2100}即估计每毫升白细胞数在5200~9400之间的概率不小于8/9.36教学运用
例2
设电
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年股权投资合同投资金额及投资用途
- 2024年度医院与学校深化医疗教育资源共享合作协议书3篇
- 2024年股权转让与投资合同关键要素
- 2024年河砂供应合同
- 应用软件课程设计
- 水产罐头加工质量管理与认证体系考核试卷
- 热电联产在能源结构优化的作用考核试卷
- 相同形状配对课程设计
- 《我国公司经理的权利和义务研究》
- 《基于计算机视觉的交通施工场地风险目标辨识与跟踪方法》
- 2024年教师师德师风工作计划(2篇)
- 物流行业服务质量保障制度
- 养老院物资采购流程及制度
- 眼镜店年终总结及计划
- 公务用车车辆安全培训课件
- 《安徽省人力资本对经济高质量发展影响研究》
- 化妆品技术服务合同协议
- 一年级新生家长会课件(共25张课件)
- 工匠精神学习通超星期末考试答案章节答案2024年
- 广东省东华高级中学2025届高一上数学期末考试试题含解析
- GB/T 22081-2024网络安全技术信息安全控制
评论
0/150
提交评论