版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章基本统计概念的回顾第1页,课件共41页,创作于2023年2月第二章基本统计概念的回顾第2页,课件共41页,创作于2023年2月主要内容§2.1随机试验§2.2随机变量§2.3总体的的数字特征§2.4样本分布的数字特征第3页,课件共41页,创作于2023年2月§2.1随机试验随机试验:指至少有两个可能结果,但不确定哪一个结果会出现的过程总体:随机试验所有可能的集合称为总体(population)或样本空间例子:在一种双回合游戏中,O1表示两个回合全部获胜;O2表示第一个回合获胜,第二个回合失败;O3表示第一个回合失败,第二个回合获胜;O4表示两个回合全部失败。样本空间有4种结果组成:{O1,O2,
O3,
O4}样本点:样本空间(或总体)的每一元素,即每一种结果成为样本点第4页,课件共41页,创作于2023年2月§2.1随机试验随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集如果两个事件不能同时发生,则两个事件称为是互斥的如果一个事件的发生与另一个事件的发生的可能性相同,则两个事件称为等可能性的。例如抛一枚硬币,正面朝上和正面朝下是等可能出现的第5页,课件共41页,创作于2023年2月§2.2随机变量一、概率分布
引入一个随机变量来描述总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和连续型两种类型。样本就是n个相互独立的与总体具有相同分布的随机变量x1,……,xn,即n元随机变量。随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集总体与样本间的联系在于具有相同的分布第6页,课件共41页,创作于2023年2月§2.2随机变量一、概率分布
引入一个随机变量来描述总体,随机变量是取值具有随机性的变量,按取值情况可以分为离散型和连续型两种类型。样本就是n个相互独立的与总体具有相同分布的随机变量x1,……,xn,即n元随机变量。随机试验的可能结果组成的集合称为事件,它是样本空间的一个子集总体与样本间的联系在于具有相同的分布第7页,课件共41页,创作于2023年2月§2.2随机变量2、概率分布的含义和性质随机变量X取各个值的概率称为X的概率分布。对一个离散型随机变量X可以给出如下的概率分布:P(X=xi)=pi对于随机变量X(无论连续还是离散)可以确定实值函数F(x),称为累积分布函数(cumulativedistributionfunction,CDF),定义如下F(x)=P(X≤x)第8页,课件共41页,创作于2023年2月概率分布性质(1)取值范围(2)若A,B,C,…为互斥事件,则有P(A+B+C+…)=P(A)+P(B)+P(C)+…对于任意事件A,B则有P(A+B)=P(A)+P(B)-P(AB)(3)若A,B,C,…为互斥事件,且为一完备事件组,则P(A+B+C+…)=P(A)+P(B)+P(C)+…=1(4)事件A,B,C,…称为相互独立的事件,如果有P(ABC…)=P(A)P(B)P(C)+…(5)条件概率P(A|B)=P(AB)/P(B)§2.2随机变量第9页,课件共41页,创作于2023年2月举例:国际贸易专业有200名学生,其中男生120人,女生80人,在这些学生中,40名男生和24名女生计划选学计量经济学,若随机抽取一人,发现这个学生计划选学计量经济学。那么这个学生是男生的概率是多少?第10页,课件共41页,创作于2023年2月3、连续型随机变量的分布函数及概率密度函数对于连续型随机变量,取任何特定数值的概率为0。设F(x)是随机变量X的分布函数,如果对任意实数x,存在非负函数f(x)≥0,使就称f(x)≥0为X的概率密度函数(PDF),且f(x)具有性质§2.2随机变量第11页,课件共41页,创作于2023年2月4、多元随机变量的概率密度函数联合概率密度函数f(X,Y)=P(X=x,Y=y)。边缘概率密度函数f(X),f(Y)。条件概率密度函数f(X|Y)=P(X=x|Y=y)条件概率密度函数f(X|Y)=f(X,Y)/f(Y)独立随机变量如果f(X,Y)=f(X)f(Y),则称变量X和Y是统计独立的§2.2随机变量第12页,课件共41页,创作于2023年2月5、随机变量函数设f(x)是定义在随机变量X的一切可能取值集合上的函数。如果对于X的每一个可能值x,都有另一个随机变量Y的取值y=f(x)与之相对应,则称Y为X的函数,记作Y=f(X)。常常遇到一些随机变量,它们的分布往往难于直接得到(例如滚珠体积的测量值等),但与它们有关系的另一个随机变量的分布却是容易知道的(如滚珠直径的测量值)。因此,就要研究两个随机变量之间的关系,然后通过它们之间的关系,由已知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。§2.2随机变量第13页,课件共41页,创作于2023年2月§2.3对总体的描述:随机变量的数字特征数学期望方差数学期望与方差的图示相关系数与协方差偏度和峰度第14页,课件共41页,创作于2023年2月一、数学期望(集中趋势的度量)1、离散型随机变量数学期望的定义假定有一个离散型随机变量X有n个不同的可能取值x1,x2,……,xn,而p1,p2,……,pn是X取这些值相应的概率,则这个随机变量X的数学期望定义如下:数学期望描述的是随机变量(总体)的一般水平第15页,课件共41页,创作于2023年2月2、连续型随机变量数学期望的定义若连续型随机变量X有分布密度函数f(x),而积分绝对收敛,则称为X的数学期望。数学期望是最容易发生的,因而是可以期待的。它反映数据集中的趋势。一、数学期望(集中趋势的度量)第16页,课件共41页,创作于2023年2月求离散型随机变量数学期望举例例1甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:试比较两射手的射击技术水平,并计算如果二人各发一弹,他们得分和的估计值。解EX=10.4+20.1+30.5=2.1EY=10.1+20.6+30.3=2.2E(X+Y)=2.1+2.2=4.3因为EX<EY,所以乙射手射击水平比较高;二人各发一弹,得分总和最可能在4.3分左右(即4分或5分)第17页,课件共41页,创作于2023年2月例2:第18页,课件共41页,创作于2023年2月3、数学期望的性质(1)如果a、b为常数,则E(aX+b)=aE(X)+b(2)如果X、Y为两个随机变量,则E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分别为X的两个函数,则E[g(X)+f(X)]=E[g(X)]+E[f(X)](4)如果X、Y是两个独立的随机变量,则E(X.Y)=E(X).E(Y)
第19页,课件共41页,创作于2023年2月4、条件期望条件期望值的定义:对于连续型随机变量的条件期望只要把加总符号换成积分号即可。第20页,课件共41页,创作于2023年2月几个重要性质(1)
一般地(2)(3)重期望律:例:已知,则
第21页,课件共41页,创作于2023年2月二、方差:离散程度的度量1、随机变量方差的定义若X为连续型随机变量,则X的方差以下式给出随机变量的方差记作Var(x)。方差的算术平方根叫标准差。第22页,课件共41页,创作于2023年2月2、方差的性质(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(a+bx)=b2Var(x)(6)a,b为常数,x,y为两个相互独立的随机变量,则Var(ax+by)=a2Var(x)+b2Var(y)(7)Var(x)=E(x2)-(E(x))2第23页,课件共41页,创作于2023年2月例3计算本节例1中甲射手的方差例1甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:E(X)=2.1Var(X)=(-1.1)
2
0.4+(-0.1)2
0.1+0.92
0.5=0.89第24页,课件共41页,创作于2023年2月三、数学期望与方差的图示数学期望描述随机变量的集中程度,方差描述随机变量的离散程度。1方差同、期望变大2期望同、方差变小51055第25页,课件共41页,创作于2023年2月四、相关系数与协方差协方差和相关系数都是描述两个随机变量相互关联程度的参数或统计量。方差是度量一个随机变量变异程度的指标,而协方差则是度量两个随机变量协同变动的指标。要度量两个随机变量之间的关系,自然要考察两个变量同时变化——协同变化的情况,于是需要定义协方差。为了弥补协方差的不足——受计量单位和数量尺度的影响,进而定义了度量两个随机变量呈线性相关程度的指标——相关系数。第26页,课件共41页,创作于2023年2月1、协方差(1)定义:令随机变量X和Y的期望分别为E(x),E(y),其协方差为:cov(X,Y)=E[(X-E(x))(Y-E(y))]=E(XY)-E(X)E(Y)一般而言,两随机变量的协方差可正可负。若两变量同方向变动,则协方差为正,反之则为负。第27页,课件共41页,创作于2023年2月(2)
协方差的性质(1)若随机变量X,Y相互独立,则其协方差为0。(2)cov(a+bX,c+dY)=bdcov(X,Y)(3)cov(X,X)=var(X)(3)相关变量的方差若随机变量不是独立的,对于X+Y或X-Y的方差为:Var(X+Y)=var(X)+var(Y)+2cov(X,Y)Var(X-Y)=var(X)+var(Y)-2cov(X,Y)(4)若E(y|x)=E(y),则Cov(x,y)=0证明:利用重期望律第28页,课件共41页,创作于2023年2月2、相关系数相关系数用表示,其计算公式为:从公式可看出两变量的相关系数等于它们的协方差与其各自的标准差之比。相关系数介于-1到1之间。相关系数的典型图形见P31第29页,课件共41页,创作于2023年2月五、偏度(skewness)与峰度(kurtosis)用于描述概率密度函数形状的数字特征。偏度(S)是对称性的度量;峰度(K)是概率密度函数高低或胖瘦的度量1、偏度(S)的计算对于正态分布,S=0;若偏度S的值为正,则其概率密度为正偏或右偏,分布函数有长的右尾;若S的值为负,则其概率密度为负偏或左偏,分布函数有长的左尾。第30页,课件共41页,创作于2023年2月2、峰度(K)的计算概率密度函数的峰度K小于3时,成为低峰态的(胖的或短尾的),峰度K大于3时,称为尖峰态的(瘦的或长尾的)。对于正态分布的峰度为3,称为常峰态的。五、偏度(skewness)与峰度(kurtosis)第31页,课件共41页,创作于2023年2月§2.4样本分布的数字特征一、样本平均数总体的数字特征——是一个固定不变的数,称为参数;样本的数字特征——是随抽样而变化的数,是一个随机变量,称为统计量。样本平均数的定义:对于样本x1,x2,…,xn,则样本平均数为样本平均数用来描述样本的平均水平(一般水平)。第32页,课件共41页,创作于2023年2月二、样本方差和标准差1、定义:对于样本x1,x2,…,xn,则称分别为样本方差和标准差。2、样本序列的正态性检验偏度:峰度:第33页,课件共41页,创作于2023年2月检验样本序列的正态性可采用Jarque-Bera检验。该检验的零假设是样本服从正态分布,检验统计量为其中m是产生样本序列时用到的估计系数的个数。在零假设下JB统计量服从χ2(2)分布。若为原始数据则m=0;若序列是通过模型估计得到的,m为估计的参数个数。2、样本序列的正态性检验第34页,课件共41页,创作于2023年2月检验的显著性水平虚拟假设:H0;对立假设:H1。在假设检验中存在两类错误:拒绝一个其实是真的虚拟假设,即第Ⅰ类错误;第Ⅱ类错误是指H0实际上是错误的,但没有拒绝它。检验的显著性水平(significancelevel)则定义为第Ⅰ类错误的概率,用符号表示为:
α=P(拒绝H0|H0)即当H0为真时拒绝H0的概率。检验的p值
检验的p值(p-value)是指给定t统计量的观测值,能拒绝虚拟假设的最小显著性水平。小的p值是拒绝虚拟假设的证据。检验的显著性水平和p值第35页,课件共41页,创作于2023年2月例如:样本序列取2002年我国30个地区以19
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年度房地产项目电梯采购安装合同3篇
- 2024年上海宝山区二手房买卖合同填写指南2篇
- 2024年度海洋平台防水系统设计合同
- 2024版智能语音识别技术研发合同3篇
- 二零二四年度专利许可使用合同(技术专利)3篇
- 2024年双方共赢:期货居间人合同
- 全新建筑工程内外抹灰施工合同2024版下载
- 医院建设项目管理体系方案
- 2024年天津市九校联考高考地理一模试卷
- 2024年度服装品牌销售代理合同3篇
- 上海海事大学开题报告
- 中医护理门诊管理课件
- 咏春拳教学方案
- 2024版熔化焊接与热切割模拟测试题库含答案 全套
- 中国工会十八大精神知识答题(试题及答案)
- 灵敏素质(教案)人教版体育五年级上册
- 2024版国开电大专本科《劳动与社会保障法》在线形考(形考作业一至四)试题及答案
- 手术室手术器械遗失原因分析品管圈鱼骨图柏拉图对策拟定
- DLT817-2014 立式水轮发电机检修技术规程
- 电线电缆生产企业自查报告
- 建筑机械使用安全技术规程
评论
0/150
提交评论