6第六章概率与抽样分布ppt课件_第1页
6第六章概率与抽样分布ppt课件_第2页
6第六章概率与抽样分布ppt课件_第3页
6第六章概率与抽样分布ppt课件_第4页
6第六章概率与抽样分布ppt课件_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、教学重点教学过程教学总结第六章第六章 概率与抽样分布概率与抽样分布STAT第六章第六章 概率与抽样分布概率与抽样分布 第一节概率基础第一节概率基础 第二节随机变量及其概率分布第二节随机变量及其概率分布 第三节抽样分布第三节抽样分布 第四节第四节 大数定律与中心极限定律大数定律与中心极限定律一、正态分布 1. 描述连续型随机变量的最重要的分布 2. 可用于近似离散型随机变量的分布 例如: 二项分布 3. 经典统计推断的基础概率密度函数f(x) = 随机变量 X 的频数 = 总体方差 =3.14159; e = 2.71828x = 随机变量的取值 (- x 0正态曲线的最高点在均值 ,它也是分布

2、的中位数和众数正态分布是一个分布族,每一特定正态分布通过均值 的标准差来区分,决定曲线的高度,决定曲线的平缓程度,即宽度曲线f(x)相对于均值 对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交正态曲线下的总面积等于1随机变量的概率由曲线下的面积给出XXX 和 对正态曲线的影响xCABx正态分布的概率?d)()(baxxfbxaP标准正态分布一般的正态分布取决于均值 和标准差 计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表x标准正态分布函数xxx,e21)(22任何一个一般的正态分布,可通过下面的

3、线性变换转化为标准正态分布(0,1)XXZNxtxttxxde21d)()(2-2标准正态分布XXXZ 0X 标准正态分布表的使用将一个一般的转换为标准正态分布计算概率时 ,查标准正态概率分布表对于负的 x ,可由 (-x) x得到对于标准正态分布,即XN(0,1),有P (a X b) b aP (|X| a) 2 a 1对于一般正态分布,2(,)()XN XbXaXP aXb 即标准化的例子 P(5 X 6.2) 6.2 50.1210XXZ标准化的例子P(2.9 X 7.1) 5 = 102.97.1X21.1051 . 7 21.1059 . 2XZXZ0 = 1-.21Z.21正态分

4、布(例题分析)正态分布 (例题分析)9525.0)67.1 (67.135351035)10(XPXPXP7938.0)1()67.1(67.1351351035352)102(XPXPXP?186154)8 ,170(1002xPNX人的身高例%45.9521861542/ZZPxP95.096.1;6827.0122PZPZ当当9973.03;9545.0222PZPZ当当二、二、 2分分布布2221121., , (0,1), ( ).niidniiXXNXn构 造 设则 称 为 自 由 度 为 n 的 分 布2. 2分布的密度函数分布的密度函数f(y)曲线曲线 0y, 00y,ey)y

5、( f2y12n)2/n(212/n3. 分位点分位点 设设X 2(n),若对于,若对于 :0 1, 存在存在2( )0n满足满足2( ),P Xn则称则称2( )n为为2( )n分布的上分布的上分位点分位点。2( )n4.性质:性质:a.分布可加性分布可加性 若若X 2(n1),Y 2(n2 ), X, Y独立独立,那么,那么 X + Y 2(n1+n2 )b.期望与方差期望与方差 若若X 2(n),则,则E(X)= n,D(X)=2n1.构造构造 假设假设N(0, 1), 2(n), 与与独立,那么独立,那么 ( )./Tt nnt(n)称为自由度为称为自由度为n的的t分布。分布。三、三、

6、t分布分布t(n) 的图形为的图形为2.2.基本性质基本性质: : (1) f(t) (1) f(t)关于关于t=0(t=0(纵轴纵轴) )对称。对称。 (2) f(t) (2) f(t)的极限为的极限为N(0N(0,1)1)的密度函数,即的密度函数,即 3.3.分位点分位点设设T Tt(n)t(n),若对,若对:0:01,0(n)0, 满足满足PTPTt t(n)=(n)=,则称则称t t(n)(n)为为t(n)t(n)的上侧分位点的上侧分位点221lim( )( ),2tnf ttex )(nt注注:1( )( )tntn )(1nt)(nt四、四、F分布分布1.构造构造 若若x 2(n1

7、), Y2(n2),X, Y独立,独立,那么那么1122/(,)./X nFF n nY n 称为第一自由度为称为第一自由度为n1 ,第二自由度为,第二自由度为n2的的F分布分布,其其概率密度为概率密度为111121/ 212212()/ 22122()(/)2,0( )( ) ()(1)20,0nnnnnnnnnxxnnf xxnx2. F2. F分布的分位点分布的分位点对于对于:0010(n1, n2)0,满足满足PFPFF F(n1, n2)=(n1, n2)=, 则则称称F F(n1, n2)(n1, n2)为为F(n1, n2)F(n1, n2)的的上侧上侧分位点;分位点;),(21

8、nnF第六章第六章 概率与抽样分布概率与抽样分布 第一节概率基础第一节概率基础 第二节随机变量及其概率分布第二节随机变量及其概率分布 第三节抽样分布第三节抽样分布 第四节第四节 大数定律与中心极限定律大数定律与中心极限定律 仅讨论重置试验的抽样分布和不重置试验的抽样分布。三种分布:总体分布、样本分布、抽样分布总体中各元素的观察值所形成的分布 分布通常是未知的可以假定它服从某种分布 总体分布(population distribution)一个样本中各观察值的分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布(sample distribution)样本统样本统计量

9、计量总体未总体未知参数知参数样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量抽样分布 (sampling distribution)是一种理论概率分布样本统计量是随机变量样本均值, 样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布 (sampling distribution)(一样本平均数的分布v样本平均数的分

10、布:是由总体中全部样本平均数的可能值和与之相应的概率组成。例:某施工班组5个人的日工资为34,38,42,46,50元,则总体工人日平均工资为多少?总体日工资方差多少?现用重置方法从5人中随机抽2个构成样本,并列出样本平均数数的分布。样本变量 3438424650343436384042383638404244423840424446464042444648504244464850样本日工资平均数单位:元抽样分布为:抽样分布为:样本日平均工资分布样本日平均工资频数频率343638404244464850合计123454321251/252/253/254/255/254/253/252/251

11、/251求:样本日平均工资的平均数和方差? 元42251502361349191 iiiiiffxxE 2919122)(16 元iiiiffxExxxf元4从例题得到重要结论重置抽样):第一,样本平均数 的平均数数学期望等于总体平均数第二,抽样平均数的标准差反映样本平均数与总体平均数的平均误差程度,称之为抽样平均误差,或抽样标准误差,以 表示。 E xX( )x Xxnx 22XxExExE以上结论具有普遍意义重置抽样):设总体变量X: 其平均数为 标准差为 。样本容量为n的变量:,21NXXX X Xnxxxx,:21 nxxxxn 21 E xX 22XxnXxn则有:1)2)X510样

12、本抽样分布样本抽样分布原总体分布原总体分布xX(二抽样成数的分布原理:把是非标志作为0,1分布。PXP PPP12总体平均数就是总体成数本身总体方差为则抽样成数p的平均数等于总体成数平均数则抽样成数的标准差即抽样平均误差也等于总体成数的方差除以样本单位数之商的平方根 PXpEP nPPnPp12例题:已知某批零件的一级品率为80%,现用重置抽样方法从中抽取100件,求样本一级品率的抽样平均误差。 %4100%801%801nPPp这表明样本成数与总体成数的抽样误差平均来这表明样本成数与总体成数的抽样误差平均来说达到说达到4%4%,随着样本单位数的增加,抽样平均,随着样本单位数的增加,抽样平均误

13、差也将减少。误差也将减少。二、不重置抽样分布(一样本平均数的分布沿用上面的例子加以说明:样本变量34384246503438424650样本日工资平均数单位:元样本日工资的抽样分布样本日平均工资(元)频数频率3621/103821/104042/104242/104442/104621/104821/10合计201利用上面资料计算样本平均数的平均数和样本平均数的方差。 元42xE 2212元x元3212 从上面的计算得出两个结论:第一,不重置抽样的样本平均数的平均数数学期望仍等于总体平均数第二,抽样平均数的标准差也是反映样本平均数与总体平均数的平均误差程度。也称之为抽样平均误差,或抽样标准误差

14、,以 表示。且等于重置抽样平均误差乘以修正因子即可。 XxE 1NnNnXx(二样本成数的分布从总体N个单位中,用不重置抽样方法抽取n个单位计算样本成数p,它的分布就是0,1样本不重置平均数的分布。则有: NnnPPNnNnPPpPpE1111例子:例:要估计某地区10000名适龄儿童的入学率,用不重置抽样方法从这个地区抽取400名儿童,检查有320名儿童入学,求样本入学率的平均误差。已知条件: %16)1(%804003202PPpp )%(21%96.111重置抽样nPPpNnnPPp 样本统计量的抽样分布(一个总体参数推断时)样本均值的抽样分布样本均值的抽样分布样本比例的抽样分布样本比例

15、的抽样分布抽样方差的抽样分布抽样方差的抽样分布样本均值的抽样分布(1正态分布再生定理正态分布再生定理总体变量总体变量 ,则从这个总体中抽取样本容,则从这个总体中抽取样本容量为量为n的样本平均数的样本平均数 也服从正态分布,其平均数也服从正态分布,其平均数 仍为仍为 ,其标准差,其标准差 。即样本平均数。即样本平均数 服从正态分布服从正态分布 。 总体服从正态分布,样本平均数也服从正态分布,总体服从正态分布,样本平均数也服从正态分布,而且样本平均数的分布更加集中于总体平均数的周围而且样本平均数的分布更加集中于总体平均数的周围2(,)XN Xx( )E x( )xXx2( )(,)xxN X(2中

16、心极限定理如果变量X分布的平均数 和标准差 都是有限的数,则从这个总体中抽取的容量为n的样本,样本平均数 的分布随着n的增大而趋近于平均数 、 标准差 为正态分布,即样本平均数 趋近于服从正态分布 。 不论总体是何种分布,只要样本的单位数量增多,则样本平均数就趋于正态分布。 一般认为样本单位数不少于30的是大样本,样本平均数的抽样分布就接近于正态分布。x2( )(,)xN X()XxX( )xX抽样分布与总体分布的关系正态分布正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布样本均值的数学期望样本均值的方差重复抽样不重复抽样样本均值的抽样分布)(XEnX22122

17、NnNnX样本比例的抽样分布总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可表示为比例(proportion)NNNN101或nnPnnP101或容量相同的所有可能样本的样本比例的概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似 一种理论概率分布推断总体总体比例的理论基础样本比例的抽样分布样本比例的数学期望样本比例的方差重复抽样不重复抽样样本比例的抽样分布)(PEnP)1 (21)1 (2NnNnP样本方差的抽样分布样本方差的分布) 1() 1(222nsn22) 1(sn 两个总体参数推断时两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个样本比例之差的抽样分布两个样本比例之差的抽样分布两个样本方差比的抽样分布两个样本方差比的抽样分布两个样本均值之差的抽样分布两个总体都为正态分布,即 , 两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差 方差为各自的方差之和 两个样本均值之差的抽样分布),(2111NX),(2222NX21XX 2121)( XXE222121221nnXX两个样本比例之差的抽样分布两个总体都服从

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论