贾俊平统计学抽样分布_第1页
贾俊平统计学抽样分布_第2页
贾俊平统计学抽样分布_第3页
贾俊平统计学抽样分布_第4页
贾俊平统计学抽样分布_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样分布1整理课件第六章抽样分布6.1统计量6.2三种不同性质的分布6.3一个总体参数推断时样本统计量分布6.4两个总体参数推断时样本统计量分布6.5抽样平均误差2整理课件学习目标区分总体分布、样本分布、抽样分布理解抽样分布与总体分布的关系掌握单总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布掌握抽样平均误差的测度及其影响因素3整理课件6.1统计量统计量的概念常用的统计量4整理课件统计量的概念定义:设X1,X2,……,Xn是从总体X中抽取的样本容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,……,Xn),不依赖任何未知参数,那么称行数T(X1,X2,……,Xn)是一个统计量。统计量是样本的函数统计量不依赖任何未知总体参数根据具体样本的观测值x1,x2,……,xn带入统计量函数,计算出来的值是一个具体的统计量的值。5整理课件常用统计量样本均值,反映总体X数学期望的信息。样本方差、标准差,反映总体X方差、标准差的信息。样本变异系数,反映总体变异系数C的信息。其中,反映随即变量在以它的均值为单位时,取值的离散程度6整理课件常用统计量样本k阶矩,反映总体k阶矩的信息。样本k阶中心矩,反映总体k阶中心矩的信息。样本偏度,反映总体偏度的信息。样本峰度,反映总体的峰度信息。7整理课件6.2三种不同性质的分布总体分布样本分布抽样分布8整理课件总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布

(populationdistribution)总体9整理课件一个样本中各观察值的分布也称经验分布当样本容量n逐渐增大时,样本分布逐渐接近总体的分布样本分布

(sampledistribution)样本10整理课件样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远我们稳定的信息,是进行推断的理论根底,也是抽样推断科学性的重要依据 抽样分布

(samplingdistribution)11整理课件抽样分布

(samplingdistribution)总体计算样本统计量例如:样本均值、比例、方差样本12整理课件6.3样本统计量的抽样分布

(一个总体参数推断时)样本均值的抽样分布样本比例的抽样分布抽样方差的抽样分布13整理课件样本均值的抽样分布14整理课件容量相同的所有可能样本的样本均值的概率分布一种理论概率分布进行推断总体总体均值的理论根底 样本均值的抽样分布15整理课件样本均值的抽样分布

(例题分析)〔重复抽样〕【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1、x2=2、x3=3、x4=4。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差16整理课件样本均值的抽样分布

(例题分析)〔重复抽样〕

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为所有可能的n

=2的样本(共16个)第一个观察值第二个观察值123411,11,21,31,422,12,22,32,433,13,23,33,444,14,24,34,417整理课件样本均值的抽样分布

(例题分析)〔重复抽样〕16个样本的均值(x)第一个观察值第二个观察值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.0

计算出各样本的均值如下表。给出样本均值的抽样分布均值X的取值1.01.52.02.53.03.54.0均值X的个数1234321取值的概率P(X)1/162/163/164/163/162/161/16X样本均值的抽样分布1.000.10.20.3P(X)1.53.04.03.52.02.518整理课件样本均值的分布与总体分布的比较

(例题分析)〔重复抽样〕

=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(X)1.00.1.2.31.53.04.03.52.02.5X19整理课件样本均值的抽样分布

(例题分析)〔不重复抽样〕

如果从总体中抽取n=2的简单随机样本,在不重复抽样条件下,共有4×3=12个样本。所有样本的结果为所有可能的n=2的样本(共12个)第一个观察值第二个观察值123411,21,31,422,12,32,433,13,23,444,14,24,320整理课件样本均值的抽样分布

(例题分析)〔不重复抽样〕16个样本的均值(x)第一个观察值第二个观察值123411.52.02.521.52.53.032.02.53.542.53.03.5

计算出各样本的均值如下表。给出样本均值的抽样分布均值X的取值1.52.02.53.03.5均值X的个数22422取值的概率P(X)2/122/124/122/122/12X样本均值的抽样分布1.000.10.20.3P(X)1.53.04.03.52.02.521整理课件样本均值的抽样分布

(例题分析)〔不重复抽样〕

=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(X)1.00.1.2.31.53.04.03.52.02.5X22整理课件样本均值的抽样分布

与中心极限定理

=50

=10X总体分布n=4抽样分布Xn=16当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值

X也服从正态分布,

X

的数学期望为μ,方差为σ2/n。即

X~N(μ,σ2/n)23整理课件中心极限定理

(centrallimittheorem)当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为

,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体X24整理课件中心极限定理

(centrallimittheorem)的分布趋于正态分布的过程25整理课件抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布抽样分布26整理课件样本均值的抽样分布与中心极限定理

(例题分析)【例】设从一个均值为μ=10,标准差σ=0.6的总体中随机抽取样本容量为n=36的样本,假定该总体不是很有偏,要求:计算样本均值小于9.9的近似概率。计算样本均值超过9.9的近似概率。计算样本均值在总体均值附件0.1范围内的近似概率。解:根据中心极限定理,样本容量>30,可视为样本均值近似服从正态分布。27整理课件样本均值的抽样分布与中心极限定理

(例题分析)因此知,样本均值服从:(1)(2)28整理课件样本均值的抽样分布与中心极限定理

(例题分析)(3)29整理课件样本均值的数学期望样本均值的方差重复抽样不重复抽样样本均值的抽样分布服从〔大样本,或者总体正态条件下〕正态分布样本均值的抽样分布

(数学期望与方差)30整理课件样本均值的抽样分布

(数学期望与方差)比较及结论:1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/n31整理课件均值的抽样标准误所有可能的样本均值的标准差,测度所有样本均值的离散程度,又称为抽样平均误差小于总体标准差计算公式为重复抽样不重复抽样32整理课件样本比例的抽样分布33整理课件总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为

比例

(proportion)34整理课件容量相同的所有可能样本的样本比例的概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似一种理论概率分布推断总体总体比例的理论根底 样本比例的抽样分布35整理课件样本比例的抽样分布

(例题分析)〔重复抽样〕【例】设某机床5台中有2台优、3台良,即总体单位数N=5。5个个体分别为优品A1、A2,良品B1、B2、B3。假设抽到优品,记x=1;假设抽到良品,记x=0。当n=2时,样本比例抽样分布如下表所有可能的n=2的样本(共25个)样本比率样本频率P(p)1(A1,A1)(A1,A2)(A2,A1)(A2,A2)4/250.5(A1,B1)(A1,B2)(A1,B3)(A2,B1)(A2,B2)(A2,B3)(B1,A1)(B1,A2)(B2,A1)(B2,A2)(B3,A1)(B3,A2)12/250(B1,B1)(B1,B2)(B1,B3)(B2,B1)(B2,B2)(B2,B3)(B3,B1)(B3,B2)(B3,B3)9/2536整理课件样本比例的抽样分布

(例题分析)〔重复抽样〕重复抽样样本比例抽样分布04/25P(p)8/2512/2500.51.0

p总体分布:抽样分布:37整理课件样本比例的抽样分布

(例题分析)〔不重复抽样〕【例】仍用上例,采用不重复随即抽样时,机床优质品比率p的抽样分布如下表所有可能的n=2的样本(共20个)样本比率样本频率P(p)1(A1,A2)(A2,A1)2/200.5(A1,B1)(A1,B2)(A1,B3)(A2,B1)(A2,B2)(A2,B3)(B1,A1)(B1,A2)(B2,A1)(B2,A2)(B3,A1)(B3,A2)12/200(B1,B2)(B1,B3)(B2,B1)(B2,B3)(B3,B1)(B3,B2)6/2038整理课件样本比例的抽样分布

(例题分析)〔不重复抽样〕p不重复抽样样本比例抽样分布00.10.20.3P(p)0.40.50.600.51.0总体分布:抽样分布:39整理课件样本比例的抽样分布

(例题分析)【例】设,试给出CX的分布。因此40整理课件样本比例的抽样分布

(例题分析)【例】假定某统计人员在其填写的报表中有2%至少会有一处错误,如果我们检查了一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.025~0.070之间的概率有多大?解:根据中心极限定理,样本容量>30,可视为样本比例近似服从正态分布。总体比例π=0.02。41整理课件样本比例的数学期望样本比例的方差重复抽样不重复抽样样本比例的抽样分布〔大样本条件下〕进行服从正态分布样本比例的抽样分布

(数学期望与方差)42整理课件样本方差的抽样分布43整理课件样本方差的分布对于来自正态总体N(u,σ2)的简单随机样本,那么比值的抽样分布服从自由度为(n-1)的2分布,即44整理课件卡方(

2)分布

(

2distribution)χ2分布:设X1,X2,……,Xn是来自总体N(0,1)的样本,那么统计量服从自由度为n的χ2分布,记为χ2~χ2(n)。设,那么令,那么Y服从自由度为1的2分布,即

当总体,从中抽取容量为n的样本,那么45整理课件分布的变量值始终为正分布的形状取决于其自由度n的大小,通常为不对称的右偏分布,但随着自由度的增大逐渐趋于对称期望为:E(2)=n,方差为:D(2)=2n(n为自由度)可加性:假设U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),那么U+V这一随机变量服从自由度为n1+n2的2分布

2分布

(性质和特点)46整理课件c2分布

(图示)选择容量为n的简单随机样本计算样本方差S2计算卡方值

2=(n-1)S2/σ2计算出所有的

2值不同容量样本的抽样分布c2n=1n=4n=10n=20ms总体47整理课件6.4样本统计量的抽样分布

(两个总体参数推断时)两个样本均值之差的抽样分布两个样本比例之差的抽样分布两个样本方差比的抽样分布48整理课件两个样本均值之差的抽样分布49整理课件两个总体都为正态分布,即,两个样本均值之差的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差方差为各自的方差之和

两个样本均值之差的抽样分布50整理课件两个样本均值之差的抽样分布

m1s1总体1s2

m2总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1-m2抽样分布51整理课件两个样本比例之差的抽样分布52整理课件两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似分布的数学期望为方差为各自的方差之和

两个样本比例之差的抽样分布53整理课件两个样本方差比的抽样分布54整理课件两个样本方差比的抽样分布

两个总体都为正态分布,即X1~N(μ1,σ12)的一个样本,Y1,Y2,…,Yn2是来自正态总体X2~N(μ2,σ22)从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-1)的F分布,即55整理课件由统计学家费舍(R.A.Fisher)提出的,以其姓氏的第一个字母来命名那么设假设U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,那么称F为服从自由度n1和n2的F分布,记为F分布

(Fdistribution)56整理课件F分布

(图示)

不同自由度的F分布F(1,10)(5,10)(10,10)57整理课件随即变量X服从F(n1,n2)分布,那么数学期望和方差分布为:F分布

(Fdistribution)58整理课件F分布

〔性质〕假设F~F(n1,n2〕,那么F分布在上α分位点有性质:59整理课件T统计量的分布60整理课件T

统计量的分布定义:设X~N(0,1),Y~2(n),并且X,Y独立,那么随机变量服从自由度为n的T分布,记为T~T〔n〕。61整理课件T

统计量的分布

设X1,X2,…,Xn1是来自正态总体N~(μ,σ2)的一个样本,称为统计量,它服从自由度为(n-1)的t分布Xt

分布与正态分布的比较正态分布t分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)Z62整理课件T分布

〔性质〕T分布关于X轴〔即t=0〕对称,因此,T分布在α分位点上有63整理课件6.5抽样平均误差抽样平均误差的意义抽样平均误差的计算影响抽样平均误差的因素抽样极限误差概率度64整理课件抽样误差的概念抽样误差:是指样本指标〔统计量〕和总体指标〔参数〕之间数量上的差异。用数学符号表示:65整理课件抽样误差的理解抽样误差是指由于抽样的随机性而产生的那一局部代表性误差,不包括登记误差,也不包括可能发生的偏差。偏差,破坏了抽样的随机原那么而产生的误差;遵守了随机原那么但可能抽到各种不同的样本而产生的误差。随机误差有两种:实际误差和抽样平均误差。实际误差:是指一个样本指标与总体指标之间的差异,这是无法知道的误差。抽样平均误差:是指所有可能出现的样本指标的标准差,也可以说是所有可能出现的样本指标和总体指标的平均离差。66整理课件一、抽样平均误差的意义67整理课件抽样平均误差的意义抽样误差是反映统计量对参数代表性程度的;测定统计量的代表性程度的抽样误差时,把各个可能的统计量与参数之间都存在的抽样误差的所有结果都考虑进去,用平方平均数的方法便可求得标准差,即抽样平均误差。抽样平均误差的意义:是实际可以运用于衡量统计量对于参数代表性程度的一个尺度;是计算统计量与参数之间变异范围的一个根据;在组织抽样调查中,也是确定抽样单位数多少的计算依据之一。68整理课件二、抽样平均误差的计算69整理课件〔一〕抽样平均数〔样本平均数〕的抽样平均误差根据定义:70整理课件1.重复〔回置式〕抽样抽样平均数的抽样平均误差重复抽样的情况下,样本变量是相互独立的,样本变量x与总体变量X同分布。71整理课件2、不重复〔非回置式〕抽样抽样平均数的抽样平均误差不重复抽样的情况下,样本变量不相互独立的。72整理课件式中:表示第i个被抽中的单位取值为的概率,即其中任意一个的概率。73整理课件式中:其中:K,L=1,2,……,N

74整理课件其中:75整理课件76整理课件〔二〕抽样成数〔样本比率〕的抽样平均误差重复抽样抽样成数的平均误差:不重复抽样抽样成数的平均误差:77整理课件〔三〕类型抽样的抽样平均误差类型比例抽样的误差,取决于各组样本单位数的总和与各组组内的方差〔即各组组内标准差的平方〕的平均数。采用等比例类型抽样,那么78整理课件〔三〕类型抽样的抽样平均误差79整理课件类型抽样在等比例抽样时的

抽样误差计算公式在重复抽样条件下:80整理课件类型抽样在等比例抽样时的

抽样误差计算公式不重复抽样条件下:81整理课件〔四〕等距抽样的抽样平均误差无关标志排队等距抽样,一般可以按简单随机抽样方法计算抽样误差。重复抽样:不重复抽样:82整理课件〔四〕等距抽样的抽样平均误差有关标志排队法等距抽样实质上可以看作一种特殊的分类抽样,不同的是分类更细致,组数更多,而在每个组之内那么只抽选一个样本单位。因此,一般认为可以用类型抽样的抽样误差公式来计算抽样误差。∴有关标志排队法等距抽样相当于分成Ni=k的n个组的等比例类型抽样。故83整理课件〔四〕等距抽样的抽样平均误差重复抽样条件下:84整理课件〔四〕等距抽样的抽样平均误差不重复

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论