抽样与抽样分布概论_第1页
抽样与抽样分布概论_第2页
抽样与抽样分布概论_第3页
抽样与抽样分布概论_第4页
抽样与抽样分布概论_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 4 章 抽样与抽样分布4.1三种不同同性质的的分布4.1.1总体分布布4.1.2样本分布布4.1.3抽样分布布总体中各各单位的的观测值值所形成成的相对对频数分分布。分布通常常是未知知的可以假定定它服从从某种分分布4.1.1总体分布布(populationdistribution)总体从总体中中抽取一一个容量量为的样本,由由这个个观测值形形成的相对频数分布布,称为为样本分分布,也也称经验分布布。当样本容容量n逐渐增大大时,样样本分布布逐渐接接近总体体的分布布4.1.2样本分布布(sampledistribution)样本4.1.3抽样分布布(SamplingDistribution)抽样分布

2、布的形成成过程(samplingdistribution)总体计算样本统计量如:均值、比例、方差等。样本4.2大数定律律与中心心极限定定理4.2.1大数定律律1.独立同分分布大数数定律2.伯努利大大数定律律4.2.2中心极限限定理独立同分分布大数定律律设独立随机变量量服从同一一分布,且存在在数学期期望和方差,对于于任意给给定的有个别现象象受到偶偶然因素素的影响响,对总总体的大大量观察察后进行行平均,能使偶偶然因素素的影响响相互抵抵消,样样本平均均数会稳稳定在附附近,为为样本平平均数估估计总体体均值提提供理论论依据。伯努利大数数定律在独立试试验序列列中,是是事事件在在次次试验中中发生的的次数,

3、是事事件发发生的的概率,对于任任意给定定的有当多次重重复观察察某个现现象时,该现象象发生的的频率与与该现象象发证的的概率之之间的差差距是非非常小的的,是用用频率去去代替概概率提供供理论依依据。4.2.2中心极限限定理(Central Limit Theorem)设总体均均值为,且且存在有有限方差差,从中抽抽取样本本容量为为n的样本。当样本本容量足足够大时时(n30),样本平均均数的的抽样样分布近近似地服服从正态态分布,这就是是著名的的中心极限限定理。4.3常用抽样样分布及及其特点点4.3.1Z分布及其其特点4.3.2t分布及其其特点4.3.3分布及其其特点4.3.4F分布及其其特点4.3.1Z

4、分布及其其特点当连续型随随机变量量X的密度函函数为时,称X服从正态态分布,有时也称称X为正态随随机变量量。设则Z是一个服服从标准准正态分分布的连续型随机变量量,其密度函数数为Z分布及其其特点E(z)=0D(z)=11、z分布以Y轴为中心心,左右右对称2、服从标标准正态态分布的的随机变变量Z的概率,与一般般的正态态随机变变量原理理相同。标准正态态分布概率密度度函数图图4.3.2t分布及其其特点若随机变变量,随机变变量,且随机变变量X与Y相互独立立,则随随机变量量服从自由由度为的的t分布,记记为其密度函函数为t分布及其其特点E(t)=0D(t)=n/(n-2)(n2)1、t分布是对对称分布布,均值

5、值为02、当自由由度n,方差差极限为为1t分布的形形状和自自由度n有关系,自由度度越小,t分布曲线线较为扁扁平,与与标准正正态分布布差异越越大;自自由度越越大,t分布曲线线与标准准正态分分布曲线线的差异异逐渐缩缩小。图4-2标准正态态分布以以及各种种自由度度的t分布的密密度函数数的曲线线4.3.3分布及其其特点若随机变变量独独立立且同为为标准正态态分布,则它们们的平方方和服服从自由由度为n的分分布,记为。其概率密度度函数为为:分布及其特点点E(x)=nD(x)=2n自由度增大,期期望和方方差随之之增大。是一种不不对称偏偏峰分布布,值域域区间(0,+)随自由度度增大,曲线的的最高点点逐渐下下移并

6、向向右移动动,趋于于对称。图4-3不同自由由度的分分布4.3.4F分布及其其特点若随机变变量、相相互独立立,且分分别服从从自由度度为、的的分分布,则则随机变变量服服从第一一自由度度为,第二二自由度度为的的F分布,记记为其密度函函数为:F分布及其其特点E(F)=n2/(n2-2)D(F)=2n22(n1+n2-2)/n1(n2-2)2(n2-4)非对称的的正偏分分布,值值域(0,+)F分布的极极限是正正态分布布,随第第一自由由度n1的增大,分布曲曲线逐渐渐趋于对对称,随随两个自自由度的的增大,分布曲曲线逐渐渐趋于正正态分布布。图4-4不同自由由度的F分布4.4常用统计计量的抽抽样分布布4.4.1

7、样本均值值的抽样样分布4.4.2样本比率率的抽样样分布在重复选选取容量量为n的样本时时,由样样本均值值的所有有可能取取值形成成的相对对频数分布布,一种理论概率分布布。推断总体体均值的理论基基础4.4.1样本均值值的抽样样分布样本均值值的抽样分布布(例题分析析)【例4-1】设一个总总体,含含有4个元素(个体),即总体体单位数数N=4。4个个体分分别为X1=1,X2=2,X3=3,X4=4。从总体体中采取取重复抽抽样方法法抽取容容量为2的随机样样本,写写出样本本均值的的抽样分分布。总体分布14230.1.2.3均值和方方差样本均值值的抽样分布布(例题分析析)现从总体体中抽取取n2的简单随随机样本本

8、,在重重复抽样样条件下下,共有有42=16个样本。所有样样本的结结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)样本均值值的抽样分布布(例题分析析)计算出各各样本的的均值,如下表表。并给给出样本本均值的的抽样分分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P ( x )1.53.04.03.52.02.

9、5样本均值值的抽样分布布(数学期望望与方差差)1.样本均值值的均值值(数学期望望)等于总体均值值2.样本均值值的方差差等于总总体方差差的1/n样本均值值的分布布与总体体分布的的比较(例题分析析)= 2.52=1.25总体分布布14230.1.2.3抽样分布P ( x )1.00.1.2.31.53.04.03.52.02.5x两个重要要结论:1.样本统计计量抽样样分布的的平均数数等于总总体平均均数,即2.样本统计计量抽样样分布的的标准差差等于总总体标准准差除以以样本单单位数的的平方根根。即又称为抽样样标准误差差,用表表示。x样本均值值的抽样样分布以上两个结论论具有普普遍意义这一等式式可以看看出

10、一项项重要事事实抽样平均均误差比比总体标标准差小小的多,仅为其其。例如一个个县的粮粮食亩产产高低悬悬殊,亩亩产标准准差为80公斤,如果随随机抽取取100亩求平均均亩产,那么样样本平均亩产产量的差异就就显著减减小,平平均误差差只及总总体亩产产标准差的的,即8斤。样本均值值的抽样样分布样本均值值的抽样样分布样本均值值的抽样样分布样本抽样样分布原总体分分布样本均值值的抽样分布布与中心极限限定理 = 50 =10X总体分布n = 4抽样分布xn =16当总体服服从正态态分布N(,2)时,来自自该总体体的所有有容量为为n的样本的的均值x也服从正正态分布布,x的数学期期望为,方差为为2/n。即xN(,2/

11、n)中心极限限定理(CentralLimitTheorem)当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布中心极限限定理:设从均均值为,方差为为2的一个任任意总体体中抽取取容量为为n的样本,当n充分大时时,样本本均值的的抽样分分布近似似服从均均值为、方差为为2/n的正态分分布一个任意分布的总体x中心极限限定理(CentralLimitTheorem)x的分布趋趋于正态态分布的的过程抽样分布布与总体体分布的的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布样本分布布样本均值值的数学期望望样本均值值的方差重复抽样不重复抽样样本均值值的抽样分布布(数学期望望与方差差)教材P88总体(或样本)中具有某某种属性性的单位位与全部部单位总总数之比比,称为比率率。不同性别的人与与全部人人数之比比合格品(或不合格格品)与全部产产品总数数之比总体比率可表表示为样本比率可表表示为4.4.2样本比率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论