第五 抽样分布_第1页
第五 抽样分布_第2页
第五 抽样分布_第3页
第五 抽样分布_第4页
第五 抽样分布_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五抽样分布第1页,共86页,2023年,2月20日,星期一参数估计在统计方法中的地位统计方法描述统计推断统计参数估计假设检验第2页,共86页,2023年,2月20日,星期一统计推断的过程样本总体样本统计量例如:样本均值、比例、方差总体均值、比例、方差第3页,共86页,2023年,2月20日,星期一第五章抽样与参数估计第一节抽样与抽样分布第二节参数估计基本方法第三节总体均值和总体比例的区间估计第四节两个总体均值及两个总体比例之差的估计第五节正态总体方差及两正态总体方差比的区间估计第4页,共86页,2023年,2月20日,星期一学习目标了解抽样和抽样分布的基本概念理解抽样分布与总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体比例和总体方差的区间估计第5页,共86页,2023年,2月20日,星期一第一节抽样与抽样分布一.总体、个体和样本二.关于抽样方法样本均值的分布与中心极限定理样本方差的分布两个样本方差比的分布六.T统计量的分布第6页,共86页,2023年,2月20日,星期一总体、个体和样本

(概念要点)总体(Population):调查研究的事物或现象的全体个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体样本容量(Samplesize):样本中所含个体的数量第7页,共86页,2023年,2月20日,星期一抽样方法概率抽样:根据已知的概率选取样本

简单随机抽样:完全随机地抽选样本分层抽样:总体分成不同的“层”,然后在每一层内进行抽样

整群抽样:将一组被调查者(群)作为一个抽样单位等距抽样:在样本框中每隔一定距离抽选一个被调查者非概率抽样:不是完全按随机原则选取样本非随机抽样:由调查人员自由选取被调查者判断抽样:通过某些条件过滤来选择被调查者配额抽样:选择一群特定数目、满足特定条件的被调查者第8页,共86页,2023年,2月20日,星期一样本均值的抽样分布第9页,共86页,2023年,2月20日,星期一所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例等结果来自容量相同的所有可能样本 抽样分布

(概念要点)第10页,共86页,2023年,2月20日,星期一样本均值的抽样分布【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下均值和方差总体分布14230.1.2.3第11页,共86页,2023年,2月20日,星期一样本均值的抽样分布

(一个例子)

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)第12页,共86页,2023年,2月20日,星期一样本均值的抽样分布

(一个例子)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.5x第13页,共86页,2023年,2月20日,星期一所有样本均值的均值和方差式中:M为样本数目比较及结论:1.样本均值的均值(数学期望)等于总体均值

2.样本均值的方差等于总体方差的1/n第14页,共86页,2023年,2月20日,星期一样本均值的分布与总体分布的比较抽样分布=2.5σ2=1.25总体分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x第15页,共86页,2023年,2月20日,星期一样本均值的抽样分布

与中心极限定理=50

=10X总体分布n=4抽样分布Xn=16当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X

的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)第16页,共86页,2023年,2月20日,星期一中心极限定理

(图示)当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体X第17页,共86页,2023年,2月20日,星期一样本方差的抽样分布第18页,共86页,2023年,2月20日,星期一样本方差的分布设总体服从正态分布N~(μ,σ2),X1,X2,…,Xn为来自该正态总体的样本,则样本方差s2

的分布为将2(n–1)称为自由度为(n-1)的卡方分布第19页,共86页,2023年,2月20日,星期一卡方(c2)分布

选择容量为n的简单随机样本计算样本方差S2计算卡方值2=(n-1)S2/σ2计算出所有的

2值不同容量样本的抽样分布c2n=1n=4n=10n=20

ms总体第20页,共86页,2023年,2月20日,星期一均值的标准误所有可能的样本均值的标准差,测度所有样本均值的离散程度小于总体标准差计算公式为第21页,共86页,2023年,2月20日,星期一两个样本方差比的抽样分布第22页,共86页,2023年,2月20日,星期一两个样本方差比的抽样分布

设X1,X2,…,Xn1是来自正态总体N~(μ1,σ12)的一个样本,Y1,Y2,…,Yn2是来自正态总体N~(μ2,σ22)的一个样本,且Xi(i=1,2,…,n1),Yi(i=1,2,…,n2)相互独立,则将F(n1-1,n2-1)称为第一自由度为(n1-1),第二自由度为(n2-1)的F分布第23页,共86页,2023年,2月20日,星期一两个样本方差比的抽样分布

不同样本容量的抽样分布F(1,10)(5,10)(10,10)第24页,共86页,2023年,2月20日,星期一T统计量的分布第25页,共86页,2023年,2月20日,星期一T

统计量的分布

设X1,X2,…,Xn1是来自正态总体N~(μ1,σ12)的一个样本,称为统计量,它服从自由度为(n-1)的t分布Xt

分布与正态分布的比较正态分布t分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)Z第26页,共86页,2023年,2月20日,星期一第二节参数估计基本方法一.点估计二.点估计的优良性准则区间估计第27页,共86页,2023年,2月20日,星期一参数估计的方法矩估计法最小二乘法最大似然法顺序统计量法估计方法点估计区间估计第28页,共86页,2023年,2月20日,星期一被估计的总体参数总体参数符号表示用于估计的样本统计量一个总体均值比例方差两个总体均值之差比例之差方差比第29页,共86页,2023年,2月20日,星期一点估计第30页,共86页,2023年,2月20日,星期一点估计

(概念要点)从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计例如:用样本均值作为总体未知均值的估计值就是一个点估计2. 点估计没有给出估计值接近总体未知参数程度的信息点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等第31页,共86页,2023年,2月20日,星期一1. 用于估计总体某一参数的随机变量如样本均值,样本比例、样本中位数等例如:样本均值就是总体均值的一个估计量如果样本均值x

=3,则3

就是的估计值理论基础是抽样分布估计量

(概念要点)二战中的点估计第32页,共86页,2023年,2月20日,星期一估计量的优良性准则

(无偏性)无偏性:估计量的数学期望等于被估计的总体参数P(X)XCA无偏有偏第33页,共86页,2023年,2月20日,星期一估计量的优良性准则

(有效性)AB中位数的抽样分布均值的抽样分布XP(X)有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量第34页,共86页,2023年,2月20日,星期一估计量的优良性准则

(一致性)一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P(X)X第35页,共86页,2023年,2月20日,星期一区间估计第36页,共86页,2023年,2月20日,星期一区间估计

(概念要点)1. 根据一个样本的观察值给出总体参数的估计范围给出总体参数落在这一区间的概率例如:总体均值落在50~70之间,置信度为95%样本统计量

(点估计)置信区间置信下限置信上限第37页,共86页,2023年,2月20日,星期一置信区间估计

(内容)2

已知2未知均值方差比例置信区间第38页,共86页,2023年,2月20日,星期一落在总体均值某一区间内的样本x_XX=Zx95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.65x+1.65x第39页,共86页,2023年,2月20日,星期一总体未知参数落在区间内的概率表示为(1-为显著性水平,是总体参数未在区间内的概率常用的显著性水平值有99%,95%,90%相应的为0.01,0.05,0.10置信水平第40页,共86页,2023年,2月20日,星期一区间与置信水平均值的抽样分布(1-)%区间包含了

%的区间未包含1-aa/2a/2第41页,共86页,2023年,2月20日,星期一影响区间宽度的因素1. 数据的离散程度,用来测度样本容量,3. 置信水平(1-),影响Z的大小第42页,共86页,2023年,2月20日,星期一第三节总体均值和总体比例

的区间估计一.总体均值的区间估计二.总体比例的区间估计样本容量的确定第43页,共86页,2023年,2月20日,星期一总体均值的区间估计

(2已知)第44页,共86页,2023年,2月20日,星期一总体均值的置信区间

(2已知)1. 假定条件总体服从正态分布,且总体方差(2)已知如果不是正态分布,可以由正态分布来近似(n

30)使用正态分布统计量Z总体均值在1-置信水平下的置信区间为第45页,共86页,2023年,2月20日,星期一总体均值的区间估计

(正态总体:实例)解:已知X~N(,0.152),x=2.14,n=9,1-=0.95,Z/2=1.96

总体均值的置信区间为我们可以95%的概率保证该种零件的平均长度在21.302~21.498mm之间【例】某种零件长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4mm。已知总体标准差=0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。第46页,共86页,2023年,2月20日,星期一总体均值的区间估计

(非正态总体:实例)解:已知x=26,=6,n=100,1-=0.95,Z/2=1.96我们可以95%的概率保证平均每天参加锻炼的时间在24.824~27.176分钟之间【例】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36小时)。第47页,共86页,2023年,2月20日,星期一总体均值的区间估计

(2未知)第48页,共86页,2023年,2月20日,星期一总体均值的置信区间

(2未知)1. 假定条件总体方差(2)未知总体必须服从正态分布使用t分布统计量3.总体均值在1-置信水平下的置信区间为第49页,共86页,2023年,2月20日,星期一总体均值的区间估计

(实例)解:已知X~N(,2),x=50,s=8,n=25,1-=0.95,t/2=2.0639。我们可以95%的概率保证总体均值在46.69~53.30之间【例】从一个正态总体中抽取一个随机样本,n=25,其均值`x=50,标准差s=8。建立总体均值m

的95%的置信区间。第50页,共86页,2023年,2月20日,星期一总体比例的区间估计第51页,共86页,2023年,2月20日,星期一总体比例的置信区间1. 假定条件两类结果总体服从二项分布可以由正态分布来近似使用正态分布统计量Z3.总体比例P

的置信区间为第52页,共86页,2023年,2月20日,星期一总体比例的置信区间

(实例)解:已知n=200,=0.7,n=140>5,n(1-)=60>5,=0.95,Z/2=1.96p

p

p

我们可以95%的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%~76.4%之间【例】某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。第53页,共86页,2023年,2月20日,星期一样本容量的确定第54页,共86页,2023年,2月20日,星期一根据均值区间估计公式可得样本容量n为估计总体均值时样本容量的确定样本容量n与总体方差2、允许误差、可靠性系数Z之间的关系为与总体方差成正比与允许误差成反比与可靠性系数成正比其中:第55页,共86页,2023年,2月20日,星期一样本容量的确定

(实例)解:已知2=1800000,=0.05,Z/2=1.96,=500

应抽取的样本容量为【例】一家广告公想估计某类商店去年所花的平均广告费用有多少。经验表明,总体方差约为1800000元。如置信度取95%,并要使估计处在总体平均值附近500元的范围内,这家广告公司应抽多大的样本?第56页,共86页,2023年,2月20日,星期一根据比例区间估计公式可得样本容量n为估计总体比例时样本容量的确定若总体比例P未知时,可用样本比例来代替

p^其中:第57页,共86页,2023年,2月20日,星期一样本容量的确定

(实例)【例】一家市场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)。解:已知=0.05,=0.05,Z/2=1.96,当p未知时用最大方差0.25代替^

应抽取的样本容量为第58页,共86页,2023年,2月20日,星期一第四节两个总体均值及两个

总体比例之差估计一.两个总体均值之差估计二.两个总体比例之差估计第59页,共86页,2023年,2月20日,星期一两个总体均值之差的估计第60页,共86页,2023年,2月20日,星期一两个样本均值之差的抽样分布

m1s1总体1s2

m2总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1-m2抽样分布第61页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(12、22

已知)1. 假定条件两个样本是独立的随机样本两个总体都服从正态分布若不是正态分布,可以用正态分布来近似(n130和n230)两个独立样本均值之差的抽样分布服从正态分布,其期望值为其标准误差为第62页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(12、22

已知)两个总体均值之差1-2在1-置信水平下的置信区间为使用正态分布统计量Z第63页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(实例)【例】一个银行负责人想知道储户存入两家银行的钱数。他从两家银行各抽取了一个由25个储户组成的随机样本,样本均值如下:银行A:4500元;银行B:3250元。设已知两个总体服从方差分别为A2=2500和B2=3600的正态分布。试求A-B的区间估计(1)置信度为95%(2)置信度为99%BA第64页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(计算结果)解:已知

XA~N(A,2500)

XB~N(B,3600)xA=4500,xB=3250,

A2=2500

B2=3600nA=nB=25(1)

A-B置信度为95%的置信区间为(2)

A-B置信度为99%的置信区间为第65页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(12、22未知,但相等)假定条件两个总体都服从正态分布12、22未知,但12=22总体方差2的联合估计量为估计量x1-x2的标准差为第66页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(12、22未知,但相等)使用t

分布统计量两个总体均值之差1-2在1-置信水平下的置信区间为第67页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(实例)【例】为比较两位银行职员为新顾客办理个人结算账目的平均时间长度,分别给两位职员随机安排了10位顾客,并记录下为每位顾客办理账单所需的时间(单位:分钟),相应的样本均值和方差分别为:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位职员办理账单所需时间均服从正态分布,且方差相等。试求两位职员办理账单的服务时间之差的95%的区间估计。21第68页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(计算结果)解:已知

X1~N(1,2)

X2~N(2,2)x1=22.2,x2=28.5,

s12=16.63s22=18.92

n1=n2=1012=121-2置信度为95%的置信区间为第69页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(12

、22未知,且不相等)假定条件两个总体都服从正态分布12、12未知,且1222使用的统计量为自由度第70页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(12、22未知,且不相等)

两个总体均值之差1-2在1-置信水平下的置信区间为第71页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(续前例)【例】为比较两位银行职员为新顾客办理个人结算账目的平均时间长度,分别给两位职员随机安排了10位顾客,并记录下了为每位顾客办理账单所需的时间(单位:分钟),相应的样本均值和方差分别为:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位职员办理账单所需时间均服从正态分布,但方差不相等。试求两位职员办理账单的服务时间之差的95%的区间估计。12第72页,共86页,2023年,2月20日,星期一两个总体均值之差的估计

(计算结果)

自由度f为1-2置信度为95%的置信区间为解:已知

X1~N(1,2)

X2~N(2,2)x1=22.2,x2=28.5,

s12=16.63s22=18.92

n1=n2=101212第73页,共86页,2023年,2月20日,星期一两个总体比例之差的估计第74页,共86页,2023年,2月20日,星期一1. 假定条件两个总体是独立的两个总体服从二项分布可以用正态分布来近似2. 两个总体比例之差P1-P2在1-置信水平下的置信区间为两个总体比例之差的区间估计第75页,共86页,2023年,2月20日,星期一两个总体比例之差的估计

(实例)【例】某饮料公司对其所做的报纸广告在两个城市的效果进行了比较,它们从两个城市中分别随机地调查了1000个成年人,其中看过广告的比例分别为p1=0.18和p2=0.14。试求两城市成年人中看过广告的比例之差的95%的置信区间。^^绿色健康饮品第76页,共86页,2023年,2月20日,星期一两个总体比例之差的估计

(计算结果)P1-P2置信度为95%的置信区间为解:已知

p1=0.18,p2=0.14,1-=0.95,n1=n2=1000^^我们有95%的把握估计两城市成年人中看过该广告的比例之差在0.79%~7.21%之间第77页,共86页,2023年,2月20日,星期一正态总体方差的区间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论