抽样与抽样分布(5)ppt课件_第1页
抽样与抽样分布(5)ppt课件_第2页
抽样与抽样分布(5)ppt课件_第3页
抽样与抽样分布(5)ppt课件_第4页
抽样与抽样分布(5)ppt课件_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一节 抽样及抽样组织方式第二节 常见的概率分布第三节 抽样分布第5章抽样和抽样分布.第5章 抽样和抽样分布STAT本章重点1、简单随机抽样2、 的抽样分布3、 的抽样分布4、其他组织方式的抽样本章难点1、抽样分布原理2、中心极限定理.指样本单位的抽取不受客观要素及其他系统性要素的影响,每个总体单位都有均等的被抽中时机抽样推断按照随机原那么 从全部研讨对象中抽取一部分单位进展调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。.不能够进展全面调查时不用要进展全面调查时来不及进展全面调查时对全面调查资料进展补充修正时抽样推断的运用.第一节 抽样及抽样组织

2、方式一、抽样的几个根本概念一全及总体和样本总体二总体参数和样本统计量三重置抽样与不重置抽样二、抽样组织方式一简单随机抽样二分层随机抽样三整群抽样四等距抽样五多阶段抽样STAT.一、抽样的几个根本概念一全及总体和样本总体STAT全及总体样本总体又称总体或母体,是统计抽样中所要了解的研讨对象整体。具有独一性。又称样本或子样,是指在统计抽样中按照“等时机原那么从全及总体中抽出的部分单位。样本不具独一性。例如:在100万户居民中,随机抽取1000户居民进展家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民那么构成样本总体。n30称为大样本,n30称为小样本.n/N称为抽样比.

3、二总体参数和样本统计量根据全及总体各单位变量值计算的反映全及总体某数量特征的综合目的,由于全及总体独一确定,故称总体参数。根据样本总体各单位变量值计算的反映样本总体某数量特征的综合目的,由于样本总体不具独一性,故称为样本统计量,它是一个随机变量。STAT.总体参数和样本统计量符号STAT.统计推断全及总体参数未知量样本总体统计量知量抽样推断STAT.三重置抽样与不重置抽样STAT重置抽样又被称作反复抽样、放回抽样抽出个体登记特征放回总体继续抽取特点同一总体单位有能够被反复抽中,而且每次抽取都是独立进展。.三重置抽样与不重置抽样STAT不重置抽样又被称作不反复抽样、不放回抽样抽出个体登记特征继续

4、抽取特点总体单位数减少,同一单位只能够被抽中一次。在延续抽取时,每次抽取都不是独立进展。是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。.二、抽样组织方式STAT一简单随机抽样单纯随机抽样对总体单位逐一编号,然后按随机原那么直接从总体中抽出假设干单位构成样本运用仅适用于规模不大、内部各单位标志值差别较小的总体是最简单、最根本、最符合随机原那么.随机原那么的实现抽签法是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中恣意抽选,签上的号码所对应的单位就是样本单位。随机数表法将总体中每个单位编上号码,然后运用随机数表,查出所要抽取的调查单位。计算机模拟法是将随机数字编

5、制为程序存储在计算机中,需求时将总体中各单位编上号码,启用随机数字发生器输出随机数字,然后从总体中找到相应总体单位构成样本。.随机数字表.二、抽样组织方式STAT二分层随机抽样类型抽样将总体全部单位分类,构成假设干个类型组,然后从各类型中分别抽取样本单位组成样本总体N样本n等额抽取等比例抽取能使样本构造更接近于总体构造,提高样本的代表性;能同时推断总体目的和各子总体的目的.二、抽样组织方式STAT三整群抽样集团抽样 将总体全部单位分为假设干“群,然后随机抽取一部分“群,被抽中群体的一切单位构成样本例:总体群数R=16 样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能

6、节省人力、物力、财力和时间,但其样本代表性能够较差.二、抽样组织方式STAT四等距抽样机械抽样或系统抽样将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。随机起点半距起点对称起点总体单位按某一标志排序按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。.二、抽样组织方式STAT五多阶段抽样 指分两个或两个以上的阶段来完成抽取样本单位的过程例:在某省100多万农户抽取1000户调查农户消费性投资情况。 第一阶段:从该省一切县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡 第三阶段:从被抽中的20个乡中各抽5个村 第四阶段:从被抽中的100个村中各抽1

7、0户样本n=10010=1000(户).第二节 常见的概率分布一、正态分布二、二项分布三、t分布四、卡方分布五、F分布STAT.一、正态分布一正态分布的定义及其特征STATxf (x)f(x) = 随机变量 X 的概率分布密度函数 = 总体均值 = 总体方差 =3.1416; e = 2.7183.正态分布的特征概率密度函数在x 的上方,即f (x)0。正态曲线的最高点在均值,它也是分布的中位数和众数。正态分布是一个分布族,每一特定正态分布经过均值的规范差来区分。曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且实际上永远不会与横轴相交。正态曲线下的总面积等于1。随机变量的概率由曲线下的面

8、积给出。STAT. 和 对正态曲线的影响xf(x)CAB.正态分布的概率abxf(x)概率是曲线下的面积!.二规范正态分布规范正态分布的概率密度函数规范正态分布的分布函数STAT.二规范正态分布STATxms普通正态分布 =1Z规范正态分布 .三正态分布的概率计算计算概率时 ,查规范正态概率分布表对于负的 x ,可由 (-x) x得到对于规范正态分布,即XN(0,1),有P (a X b) b aP (|X| a) 2 a 1对于普通正态分布,即XN( , ),有STAT.【例】设XN(0,1),求以下概率: (1) P(X 2); (3) P(-1X 3) ; (4) P(| X | 2)

9、解:(1) P(X 2)=1- P(2 X)=1-0.9973=0.0227 (3) P(-1X 3)= P(X 3)- P(X -1) = (3)- (-1)= (3) 1-(1) = 0.9987-(1-0.8413)=0.8354 (4) P(| X | 2) = P(-2 X | 2)= (2)- (-2) = (2)- 1-(2)=2 (2)- 1=0.9545.【例】设XN(5,32),求以下概率 (1) P(X 10) ; (2) P(2X 2 当n充分大时,其图形类似于规范正态分布密度函数的图形. t分布的密度函数关于x=0对称,且. 不难看到,当n充分大时,t 分布近似N (

10、0,1)分布. 但对于较小的n,t分布与N (0,1)分布相差很大.四、卡方分布STAT记为定义: 设 相互独立, 都服从正态分布N(0,1), 那么称随机变量: 所服从的分布为自在度为 n 的 分布.分布是由正态分布派生出来的一种分布.2分布的特点分布的变量值一直为正 分布的外形取决于其自在度n的大小,通常为不对称的正偏分布,但随着自在度的增大逐渐趋于对称 期望为:E(2)=n,方差为:D(2)=2n(n为自在度) 可加性:假设U和V为两个独立的2分布随机变量,U2(n1), V2(n2),那么U+V这一随机变量服从自在度为n1+n2的2分布 STAT.c2分布 选择容量为n 的简单随机样本

11、计算样本方差S2计算卡方值2 = (n-1)S2/2计算出一切的 2值不同容量样本的抽样分布c2n=1n=4n=10n=20 ms总体.由 分布的定义,不难得到:1. 设 相互独立, 都服从正态分布那么2. 设 且X1,X2相互独立,那么这个性质叫 分布的可加性.运用中心极限定理可得,假设 ,那么当n充分大时,假设的分布近似正态分布N(0,1).那么可以求得, E(X)=n, D(X)=2n假设.由统计学家费舍(R.A.Fisher) 提出的,以其姓氏的第一个字母来命名那么设假设U为服从自在度为n1的2分布,即U2(n1),V为服从自在度为n2的2分布,即V2(n2),且U和V相互独立,那么

12、称F为服从自在度n1和n2的F分布,记为五、F分布STAT.F分布 不同自在度的F分布F(1,10)(5,10)(10,10).即它的数学期望并不依赖于第一自在度n1.X的数学期望为:假设n22假设XF(n1,n2), X的概率密度为.第三节 抽样分布一、抽样推断的实际根底二、单一总体样本均值、样本比例的抽样分布三、两个总体均值之差、比例之差的抽样分布STAT.一、抽样推断的实际根底大数定律大数法那么假设随机变量总体存在着有限的平均数和方差,那么对于充分大的抽样单位数n,可以以几乎趋近于1的概率,使抽样平均数与总体平均数的绝对离差的期望为恣意小,即对于恣意的正数有:STAT.【例】设一个总体,

13、含有4个元素个体,即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下均值和方差总体分布14230.1.2.3. 现从总体中抽取n2的简单随机样本,在反复抽样条件下,共有42=16个样本。一切样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个察看值第一个察看值一切能够的n = 2 的样本共16个. 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.0

14、1第二个察看值第一个察看值16个样本的均值x样本均值的抽样分布1.00.1.2.3P ( x )1.53.04.03.52.02.5x.一切样本均值的均值和方差式中:M为样本数目比较及结论:1. 样本均值的均值数学期望等于总体均值 2. 样本均值的方差等于总体方差的1/n.样本均值的分布与总体分布的比较抽样分布 = 2.5 2 =1.25总体分布14230.1.2.3P ( x )1.00.1.2.31.53.04.03.52.02.5x.中心极限定理定理:设X是具有期望值为 ,方差为 的恣意总体,那么样本平均数的抽样分布,将随着n的增大而趋于正态分布,分布方式参数为STAT.中心极限定理当样

15、本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为,方差为 2的一个恣意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布一个恣意分布的总体X.二、单一总体样本均值、样本比例的抽样分布STAT样本抽样分布原总体分布.样本均值的数学期望样本均值的方差反复抽样不反复抽样样本均值的抽样分布STAT.样本比例的数学期望样本比例的方差反复抽样不反复抽样样本比例的抽样分布STAT.例3:假定某统计人员在填写的报表中有2%至少会有一处错误,假设我们检查了一个有600份报表组成的随机样本,其中至少有一处错误的报表所组成的比例在0.0250.070之间的概率有多大?.三、两个总体均值之差、比例之差的抽样分布.两个总体都为正态分布,即 两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差方差为各自的方差之和 两个总体均值之差的抽样分布STAT.两个总体均值之差的抽样分布 m1s1总体1s2 m2总体2抽取简单随机样样本容量 n1计算X1抽取简单随机样样本容量 n2计算X2计算每一对样本的X1-X2一切能够样本的X1-X2m1- m2抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论