教育统计学课件-7-抽样理论与参数估计_第1页
教育统计学课件-7-抽样理论与参数估计_第2页
教育统计学课件-7-抽样理论与参数估计_第3页
教育统计学课件-7-抽样理论与参数估计_第4页
教育统计学课件-7-抽样理论与参数估计_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理与教育统计学第六章抽样理论与参数估计心理与教育统计学第六章抽样理论与参数估计本章要点:1.抽样方法;2.抽样分布;3.参数估计;本章要点:概率与概率分布1.抽样的基本概念与方法概率与概率分布1.抽样的基本概念与方法Population&Sample;Populationisacompletesetofindividuals,objects,ormeasurementshavingsomecommonobservablecharacteristic.总体(Population)是具有某些共同的可被观察的特征的人和物的总集合。或者,根据研究目的确定的同质研究对象的全体(集合),分有限总体与无限总体。总体中接受统计观测的每一个对象叫做个体(case),个体是统计的基本单位。DefinitionoftermsPopulation&Sample;总体(PopulatPopulation&Sample;Sampleisasubsetofapopulationthatsharesthesamecharacteristicsasthepopulation.样本(Sample)总体的一个子集,拥有与总体同样的特征。也就是说,按统计的原则和方法从总体中随机抽取一部分个体。样本所含的个体数叫做样本含量(samplesize)。DefinitionoftermsPopulation&Sample;样本(Sample)参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数。

总体样本抽取部分观察单位

统计量

参数

推断inference统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记简单随机抽样概念:从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为样本都有相同的机会(概率)被抽中。

抽取元素的具体方法:a、抽签法;b、随机数字简单随机抽样概念:从总体N个单位中随机地抽取n个单位作为样本等距抽样将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。方法:将总体元素连续编号确定样本间的间距(N/n=K)随机确定一个起点A(1<A<K)后,每隔K个单位抽取一个。等距抽样将总体中的所有单位(抽样单位)按一定顺序排列,在规定分层抽样将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本原则:层间差异大于层内差异(层内样本差异要小;层与曾间的差异尽可能大)方法:按各层比例分配样本元素个数。各个层次按简单随机抽样的方法抽样,产生自己的样本,最后合成整个整体。分层抽样将抽样单位按某种特征或某种规则划分为不同的层,然后从概率与概率分布2.抽样分布概率与概率分布2.抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)总体总体中各元素的观察值所形成的分布总体分布(populati一个样本中各观察值的分布也称经验分布当样本容量n逐渐增大时,样本分布逐渐接近总体的分布

样本分布(sampledistribution)样本一个样本中各观察值的分布样本分布(sampledistr从总体X中,随机抽取n个样本元素:“x1

、x2……xn”,则f(x1

、x2……xn)即统计量的概率分布即抽样分布。例:是样本“x1

、x2……xn”的函数;当“x1

、x2……xn”是随机变量时,也是随机变量;当“x1

、x2……xn”有确定的值时,就是个统计量;样本均值,样本比例,样本方差等均可以形成抽样分布。其结果来自容量相同的所有可能样本抽样分布(samplingdistribution)从总体X中,随机抽取n个样本元素:“x1、x2……xn抽样分布的形成过程(samplingdistribution)总体计算样本统计量如:样本均值、比例、方差样本抽样分布的形成过程(samplingdistributio在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础 样本均值的抽样分布在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相例:设一个总体,含有4个个体,即总体单位数N=4。4个个体的取值分别为x1=1,x2=2,x3=3,x4=4。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差样本均值的抽样分布例:设一个总体,含有4个个体,即总体单位数N=4。4个个现从总体中抽取n=2的简单随机样本;采用重复抽样条件(C41*C41

)所有样本的结果为:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)样本均值的抽样分布现从总体中抽取n=2的简单随机样本;3,43,33,23,1计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P

(x)1.53.04.03.52.02.5样本均值的抽样分布计算出各样本的均值,如下表。并给出样本均值的抽样分布3.样本均值的分布与总体分布的比较=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x样本均值的分布与总体分布的比较=2.5总体分布1样本均值的数学期望样本均值的方差样本均值的抽样分布样本均值的数学期望样本均值的抽样分布样本均值的抽样分布与中心极限定理=50

=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x

的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)样本均值的抽样分布与中心极限定理=50=10X总体中心极限定理当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。一个任意分布的总体x中心极限定理当样本容量足够大时(n30),样本均值的x的分布趋于正态分布的过程中心极限定理x的分布趋于正态分布的过程中心极限定理平均数的抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布平均数的抽样分布与总体分布的关系总体分布正态分布非正态分布大卡方分布不同容量样本的抽样分布c2n=1n=4n=10n=20卡方分布不同容量样本的抽样分布c2n=1n=4n=10n=卡方分布卡方分布卡方分布卡方分布卡方分布不同容量样本的抽样分布c2n=1n=4n=10n=20卡方分布不同容量样本的抽样分布c2n=1n=4n=10n=卡方分布卡方分布卡方分布++++++++++卡方分布++++++++++卡方分布卡方分布卡方分布卡方分布卡方分布卡方分布卡方分布卡方分布卡方分布卡方分布t分布t分布xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z标准正态分布不管n的大小,曲线只有一条,而t分布是一蔟曲线。随着n增大,t分布就越来越接近标准正态分布曲线,而当n接近无穷时,t分布就与标准化整态分布完全重合。t分布xt分布与标准正态分布的比较t分布标准正态分布t不同自由双侧临界值表单侧临界值表t分布双侧临界值表单侧临界值表t分布t分布t分布t分布t分布t分布t分布t分布t分布t分布t分布t分布t分布t分布t分布F分布F(1,10)(5,10)(10,10)F分布F(1,10)(5,10)(10,10)F分布F分布F分布F分布F分布F分布F分布F分布F分布F分布概率与概率分布3.参数估计概率与概率分布3.参数估计参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推统计推断的过程样本总体样本统计量如:样本均值、比例、方差总体均值、比例、方差等统计推断的过程样本总体样本统计量总体均值、比例、方差等估计量:用于估计总体参数的随机变量,如样本均值,样本比例、样本方差等;参数用表示,估计量用表示例如:样本均值就是总体均值的一个估计量估计值:估计参数时计算出来的统计量的具体值。如果样本均值x

=80,则80就是总体平均数的估计值。估计量与估计值

(estimator&estimatedvalue)估计量:用于估计总体参数的随机变量,如样本均值,样本比例、样良好估计量的标准无偏性:估计量抽样分布的数学期望等于被估计的总体参数P(

)BA无偏有偏良好估计量的标准无偏性:估计量抽样分布的数学期望等于被有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效

AB

的抽样分布

的抽样分布P(

)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P(

)一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数估计的方法矩估计法最小二乘法最大似然法顺序统计量法估计方法点估计区间估计计算出样本的一个统计量,以这个统计量作为参数的估计值。计算出样本的两个统计量,以两个统计量之间的区间作为参数的取值范围。参数估计的方法矩估计法最小二乘法最大似然法顺序统计量法估计点估计(pointestimate)用样本的估计量直接作为总体参数的估计值不足:没有给出估计值接近总体参数程度的信息.点估计(pointestimate)用样本的估计量直接作为区间估计(intervalestimate)在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在75~85之间,置信水平是95%

样本统计量

(点估计)置信区间置信下限置信上限区间估计(intervalestimate)在点估计的基础置信区间与置信水平(置信度)统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。置信区间与置信水平(置信度)统计学家在某种程度上确信这个区x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.64x+1.64xx95%的样本-1.96x+1.96x99教育统计学ppt课件-7-抽样理论与参数估计课堂测验1.对10名体院学生进行智力测验,结果得出以下分数:112,127,118,109,113,121,104,105,117,119,试着求出该测验分数总体均值和方差的点估计量。2.评判估计值好坏的标准有:_____、_____、______。无偏性、有效性和一致性。3.何谓无偏性?估计量抽样分布的平均数等于被估计的总体参数

。课堂测验1.对10名体院学生进行智力测验,结果得出以下分数课堂测验4.何谓有效性?对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。5.何谓一致性?随着样本容量的增大,估计量的值越来越接近被估计的总体参数。课堂测验4.何谓有效性?5.何谓一致性?总体均值的区间估计估计总体平均数的步骤:1.根据实得样本的数据,计算样本的平均数与标准差;2.计算标准误;3.确定置信水平或显著性水平;4.根据样本平均数的抽样分布,确定查何种统计表;5.计算置信区间;6.解释总体平均数的置信区间;总体均值的区间估计估计总体平均数的步骤:如果:1.总体服从正态分布,且方差(2)

已知2.如果非正态分布,2未知的大样本(n>30)使用正态分布统计量z总体均值在1-置信水平下的置信区间为总体均值的区间估计如果:总体均值在1-置信水平下的置信区间为总体均值教育统计学ppt课件-7-抽样理论与参数估计教育统计学ppt课件-7-抽样理论与参数估计例.一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3例.一家食品生产企业以生产袋装食品为主,为对产量质量进行监解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:

总体均值在1-置信水平下的置信区间为该食品平均重量的置信区间为[101.44,109.28]解:已知X~N(,102),n=25,1-=95%2未知的大样本(n

30)例:从某年高考随机抽102份作文试卷,算得平均分为26,标准差为1.5,试估计总体平均数95%的置信区间。总体均值的区间估计2未知的大样本(n30)例:从某年高考随机抽解:已知

n=102,1-=95%,z/2=1.96。根据样本数据计算:总体均值在0.95置信水平下的置信区间为:

[25.707,26.293]解:已知n=102,1-=95%,z/2=1.9假定条件总体服从正态分布,且方差(2)

未知小样本(n<30)使用t

分布统计量总体均值在1-置信水平下的置信区间为总体均值的区间估计假定条件总体均值在1-置信水平下的置信区间为总体均值例.已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计例.已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取解:已知X~N(,2),n=16,1-=95%,t/2=2.131

根据样本数据计算得:,

总体均值在1-置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8小时~1503.2小时解:已知X~N(,2),n=16,1-=95%,目的:估计一个总体的方差或标准差假设条

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论