版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章第六章 抽样理论与参数估计抽样理论与参数估计第一节第一节 抽样的基本概念抽样的基本概念 一、概念回顾一、概念回顾 二、抽样方法二、抽样方法 三、抽样设计的意义及原则三、抽样设计的意义及原则 四、样本容量的计算四、样本容量的计算统计推断的可靠性与下列因素有关 1样本对总体的代表性,既涉及到样本对总体的代表性,既涉及到,又涉及到又涉及到。2运用运用及数据处理的准及数据处理的准确性确性3样本对总体样本对总体的的在收集数据的过程中控制选择恰当的方法通过抽样设计控制一、概念回顾一、概念回顾 总体、个体、样本总体、个体、样本 参数、统计量参数、统计量二几种重要的随机抽样方法二几种重要的随机抽样方法
2、1简单随机抽样(simple random sampling)简单随机抽样就是按照随机原则直接从总体简单随机抽样就是按照随机原则直接从总体中抽取出若干个单位作为样本。中抽取出若干个单位作为样本。简单随机抽样法能保证总体中的每一个对象简单随机抽样法能保证总体中的每一个对象都有同等的被抽取到的可能性,并且个体都有同等的被抽取到的可能性,并且个体之间都相互独立。这是在总体异质性不是之间都相互独立。这是在总体异质性不是很大而且所抽取的样本较小时经常采用的很大而且所抽取的样本较小时经常采用的一种形式。一种形式。 简单随机抽样法的局限是:当样本简单随机抽样法的局限是:当样本规模小时,样本的代表性较差。规模
3、小时,样本的代表性较差。 简单随机取样有两种基本方式: 抽签法(drawing lots) 随机数字表法(random number table) 2等距抽样 等距抽样等距抽样(interval sampling)也称为也称为机械抽样或系统抽样。实施时,先把机械抽样或系统抽样。实施时,先把总体中的所有个体按一定顺序编号,总体中的所有个体按一定顺序编号,然后依固定的间隔取样。然后依固定的间隔取样。 等距抽样可以保证样本的成分与总体等距抽样可以保证样本的成分与总体一致,但随机性不如单纯随机抽样法。一致,但随机性不如单纯随机抽样法。应用中可将两种方法结合使用。应用中可将两种方法结合使用。 3分层随机
4、抽样 分层随机取样简称分层抽样分层随机取样简称分层抽样(stratified sampling 或或 hierarchical sampling),是进行),是进行大规模研究时常常使用的抽样方大规模研究时常常使用的抽样方法。法。先将总体按照一定标准先将总体按照一定标准分为若干类型(统计上称为层),再根据分为若干类型(统计上称为层),再根据各层对象的数量在总体数量中所占的比例,各层对象的数量在总体数量中所占的比例,确定从每一种类型(层)中抽取样本的数确定从每一种类型(层)中抽取样本的数量,然后按随机原则和所确定的各层取样量,然后按随机原则和所确定的各层取样的数量,从各层中取样。的数量,从各层中取
5、样。分类的标准要分类的标准要科学,要符合实际情况。各层内的差别要科学,要符合实际情况。各层内的差别要小,而层与层之间的差异则越大越好。小,而层与层之间的差异则越大越好。 :为了调查某区重点中学为了调查某区重点中学720名名高一学生的视力,首先按视力的情高一学生的视力,首先按视力的情况将他们分成况将他们分成(108人人)、(360人)、人)、(252人)三种水平。若用人)三种水平。若用分层抽样法抽取分层抽样法抽取120人进行调查,问人进行调查,问各层应抽多少人?各层应抽多少人? 计算Nnn好好60720360120NNnn中中42720252120NNnn差差最佳配置法
6、 最佳配置法不仅考虑各层的人数比例,而最佳配置法不仅考虑各层的人数比例,而且考虑到了各层的标准差。当各层内的且考虑到了各层的标准差。当各层内的标准差已知,应该在标准差大的层内多标准差已知,应该在标准差大的层内多分配而在标准差小的层内少分配抽样数分配而在标准差小的层内少分配抽样数量。量。最佳配置法可以使得到的样本具有较好的最佳配置法可以使得到的样本具有较好的。 在各层内应抽取个体数计算 公式中,公式中,ni表示从某一层所抽个体数表示从某一层所抽个体数 n表示样本容量表示样本容量 Ni表示某层个体总数表示某层个体总数 i表示某层标准差表示某层标准差 iiiiiNNnn(222)当各个当各个没有现成
7、资料可以应用时,没有现成资料可以应用时,可以先从该层抽一个小样本,由这可以先从该层抽一个小样本,由这一小样本计算出的样本标准差一小样本计算出的样本标准差S对对进行估计。进行估计。iiiiiSNSNnn(223) 分层随机取样法的分层随机取样法的是代表性和是代表性和推论的精确性较好。它适用于总体推论的精确性较好。它适用于总体单位数量较多,并且内部差异较大单位数量较多,并且内部差异较大的研究对象。的研究对象。 分层随机取样法的分层随机取样法的性是要求对性是要求对总体各单位的情况有较多的了解,总体各单位的情况有较多的了解,否则就难以作出科学的分类。否则就难以作出科学的分类。 4两阶段随机抽样 当总体
8、容量很大时,直接以总体中当总体容量很大时,直接以总体中的所有个体为对象,从中进行抽样,的所有个体为对象,从中进行抽样,在实际调查或研究中存在很大困难。在实际调查或研究中存在很大困难。 采用分阶段的抽样方法,可以缩小采用分阶段的抽样方法,可以缩小实际抽样的范围,使实际抽样工作实际抽样的范围,使实际抽样工作能够按研究设计的要求顺利进行。能够按研究设计的要求顺利进行。 两阶段随机抽样(两阶段随机抽样(two-stages random sampling)的一般过程是:)的一般过程是:先将总体分成先将总体分成个部分;个部分;从这从这个部分中随机抽取个部分中随机抽取m个部分作为第一阶段样本个部分作为第一
9、阶段样本;是分别从这是分别从这m个部分中抽取个部分中抽取一定数量(一定数量(ni)的个体构成第二阶段)的个体构成第二阶段样本。样本。5整群抽样 整群随机抽样是先将整群随机抽样是先将总体各单位按一定的总体各单位按一定的标准分成许多群(小标准分成许多群(小组),然后按随机原组),然后按随机原则从这些群中抽取若则从这些群中抽取若干群作为样本。干群作为样本。 整群随机取样法的整群随机取样法的是样本比较集是样本比较集中,适宜于某些特定的研究,尤其是中,适宜于某些特定的研究,尤其是在教育实验中常用此法。此外,在规在教育实验中常用此法。此外,在规模较大的调查研究中,整群随机取样模较大的调查研究中,整群随机取
10、样易于组织,可节省人力、物力和时间。易于组织,可节省人力、物力和时间。 整群随机抽样法的整群随机抽样法的是样本分布不是样本分布不均匀,代表性较差。均匀,代表性较差。 三抽样设计的意义及原则三抽样设计的意义及原则 1 1抽样设计的意义抽样设计的意义 使研究节省人力及费用;使研究节省人力及费用; 使研究节省时间,提高时效性;使研究节省时间,提高时效性;保证研究结果的准确性。保证研究结果的准确性。 2抽样设计的原则 抽样设计的要求是样本对研究总体有良抽样设计的要求是样本对研究总体有良好的好的,即样本的构成与总体保持,即样本的构成与总体保持一致。为了保证这一点,抽样时必须遵一致。为了保证这一点,抽样时
11、必须遵循循(randomization)的基本原)的基本原则。则。 所谓随机化原则,是指在抽样时,样本所谓随机化原则,是指在抽样时,样本中的每一个体都是按照随机的原理被抽中的每一个体都是按照随机的原理被抽取的,总体中每一个体被抽到的可能性取的,总体中每一个体被抽到的可能性是相等的。是相等的。 四四 样本容量的确定样本容量的确定 在应用中应根据研究所要求的精确度及在应用中应根据研究所要求的精确度及经费情况确定样本容量。如果样本容量经费情况确定样本容量。如果样本容量过小,会影响样本对总体的代表性,增过小,会影响样本对总体的代表性,增大抽样误差而降低研究推论的精确性;大抽样误差而降低研究推论的精确性
12、;样本容量过大,虽然减小了抽样误差,样本容量过大,虽然减小了抽样误差,但可能增大过失误差,并且增加不必要但可能增大过失误差,并且增加不必要的人力物力资源的浪费。的人力物力资源的浪费。 样本容量与抽样误差并不样本容量与抽样误差并不是直线关系。是直线关系。 确定容量的基本原则是:确定容量的基本原则是:在尽量节省人力、经费和在尽量节省人力、经费和时间的条件下,确保用样时间的条件下,确保用样本推断总体达到预定的可本推断总体达到预定的可行度及准确性。行度及准确性。2总体平均数估计样本容量的确定 nXZ222dZn其中,最大允许误差为其中,最大允许误差为 ,可信度为,可信度为1。 Xd由由有有(224)可
13、以看到,当可以看到,当确定之后,总体标准差和确定之后,总体标准差和最大允许误差最大允许误差d d是决定样本容量的两个因素。是决定样本容量的两个因素。总体未知 由nSXt222dStn有当样本容量当样本容量n n 未确定时,未确定时,t t 值无法确定,值无法确定,因此一般采用尝试法。因此一般采用尝试法。 (225)拟估计某市高校四级英语考试拟估计某市高校四级英语考试成绩的总体平均分数。以往考试成成绩的总体平均分数。以往考试成绩的标准差为绩的标准差为13,这次的估计最大,这次的估计最大允许误差为允许误差为2分,可信度为分,可信度为95%,问,问应抽取多大的样本?应抽取多大的样本?221396.
14、11633 .16222dZn第二节第二节 样本分布样本分布 一、什么是样本分布一、什么是样本分布 二、正态分布及渐近正态分布二、正态分布及渐近正态分布 三、三、t分布分布 四、四、 分布分布 五、五、F分布分布2一、样本分布一、样本分布/抽样分布抽样分布 样本分布指样本统计量的分布,它是统计样本分布指样本统计量的分布,它是统计推论的重要依据。推论的重要依据。 在谈及样本统计量的分布时,首先要保证在谈及样本统计量的分布时,首先要保证各个样本是独立的,各个样本都服从同样各个样本是独立的,各个样本都服从同样的分布。要保证这一点,取样方法应该用的分布。要保证这一点,取样方法应该用随机抽样的方法。随机
15、抽样的方法。样本统计量的概率分布样本统计量的概率分布是一种理论概率分布是一种理论概率分布随机变量是随机变量是 样本统计量样本统计量样本均值样本均值, 样本比例,样本方差等样本比例,样本方差等结果来自结果来自容量相同容量相同的的所有所有可能样本可能样本提供了样本统计量长远我们稳定的信息,是进提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重行推断的理论基础,也是抽样推断科学性的重要依据要依据 抽样分布 (sampling distribution)抽样分布 (sampling distribution)样本统计量的抽样分布样本统计量的抽样分布1、样本平均数的分布、样
16、本平均数的分布 2、样本方差的抽样分布、样本方差的抽样分布容量相同的所有可能样本的样本均值的概容量相同的所有可能样本的样本均值的概率分布率分布一种理论概率分布一种理论概率分布进行推断总体总体均值进行推断总体总体均值 的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布(例题分析)(重复抽样)5 . 21NxNii25. 1)(122NxNii样本均值的抽样分布 (例题分析)(重复抽样)所有可能的所有可能的n = 2 的样本(共的样本(共16个)个)第一个第一个观察值观察值第二个观察值第二个观察值123411,11,21,31,422,12,22,32,433,13,23,
17、33,444,14,24,34,4样本均值的抽样分布 (例题分析)(重复抽样)16个样本的均值(个样本的均值(x)第一个第一个观察值观察值第二个观察值第二个观察值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.0均值均值X的取值的取值1.01.52.02.53.03.54.0均值均值X的个数的个数1234321取值的概率取值的概率P(X ) 1/16 2/16 3/16 4/16 3/16 2/16 1/16样本均值的分布与总体分布的比较 (例题分析)(重复抽样)5 . 2X21.250.6252X样本均值的抽样分布 (例题分析)(
18、不重复抽样)所有可能的所有可能的n = 2 的样本(共的样本(共12个)个)第一个第一个观察值观察值第二个观察值第二个观察值123411,21,31,422,12,32,433,13,23,444,14,24,3样本均值的抽样分布 (例题分析)(不重复抽样)16个样本的均值(个样本的均值(x)第一第一个个观察观察值值第二个观察值第二个观察值123411.52.02.521.52.53.032.02.53.542.53.03.5均值均值X的取值的取值1.52.02.53.03.5均值均值X的个数的个数22422取值的概率取值的概率P(X ) 2/12 2/12 4/12 2/12 2/12样本均
19、值的抽样分布 (例题分析)(不重复抽样)5 . 2X21.2542524 112X样本均值的抽样分布与中心极限定理X5x50 x5 . 2x中心极限定理(central limit theorem) xn x 抽样分布与总体分布的关系正态分布正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布问题问题 样本平均数的分布是怎么得到的?样本平均数的分布是怎么得到的? 样本平均数分布的平均数与方差和母总体的平均数样本平均数分布的平均数与方差和母总体的平均数与方差有何关系?在不同情况下一样吗?与方差有何关系?在不同情况下一样吗? 什么叫自由度?什么叫自由度? 样本平均数的分
20、布与样本平均数的分布与t分布的关系?分布的关系? 分布是什么分布?特点?应用于?分布是什么分布?特点?应用于? F分布用来分析什么?特点?分布用来分析什么?特点?2二、正态分布及渐近正态分布二、正态分布及渐近正态分布样本平均数的分布样本平均数的分布总体方差已知,总体分布为正态,样本平均数的分布为正态分布。总体方差已知,总体分布为正态,样本平均数的分布为正态分布。总体方差已知,总体分布非正态,当样本容量足够大总体方差已知,总体分布非正态,当样本容量足够大(n30)时,其样本平均数的分布为渐近正态分布。时,其样本平均数的分布为渐近正态分布。XXXuXZnSEnuuiXX .22XXuXZnuuiX
21、 .二、正态分布及渐近正态分布二、正态分布及渐近正态分布方差及标准差的分布方差及标准差的分布自正态分布总体中抽取容量为自正态分布总体中抽取容量为n的样本,当的样本,当n足够大(足够大(n30) ,样本方差及标准差的分布,渐趋于正态分布。,样本方差及标准差的分布,渐趋于正态分布。因此公式要求样本容量足够大,一般难以保证,故标准因此公式要求样本容量足够大,一般难以保证,故标准差及方差的统计推论,较少用到渐近分布,而用其精确差及方差的统计推论,较少用到渐近分布,而用其精确分布(分布( 分布)。分布)。此外,还有多种统计量的分布为正态分布或渐近正态分此外,还有多种统计量的分布为正态分布或渐近正态分布,
22、如两样本平均数之差的分布、相关系数的分布、比布,如两样本平均数之差的分布、相关系数的分布、比率的分布等将在以后章节介绍。率的分布等将在以后章节介绍。nnXsXsss222222 .2三、三、t分布分布t分布是统计分析中应用较多的一种随机变量函数的分布,分布是统计分析中应用较多的一种随机变量函数的分布,是统计学者高赛特是统计学者高赛特1908年在以笔名年在以笔名“Student”发表的一发表的一篇论文中推导的一种分布。这种分布是一种左右对称、篇论文中推导的一种分布。这种分布是一种左右对称、峰态比较高狭、分布形状随样本容量峰态比较高狭、分布形状随样本容量n-1的变化而变化的的变化而变化的一族分布。
23、一族分布。t分布与分布与n-1(自由度自由度)有关,有关, t分布的自由度通常用符号分布的自由度通常用符号df表表示。自由度是指任何变量中可以自由变化的数目,它代示。自由度是指任何变量中可以自由变化的数目,它代表表t分布中独立随机变量的数目。分布中独立随机变量的数目。NxsnsuXt2.1/三、三、t分布分布 t分布的特点分布的特点平均值为平均值为0以平均值以平均值0左右对称的分布,左侧左右对称的分布,左侧t为负值,右侧为负值,右侧t为正值。为正值。变量取值在变量取值在 之间。之间。曲线下总面积为曲线下总面积为1。 t分布曲线随自由度变化而变化,为一簇分布。样本容分布曲线随自由度变化而变化,为
24、一簇分布。样本容量越小,曲线越低阔,样本容量大于量越小,曲线越低阔,样本容量大于30时,时, 曲线接近曲线接近正态分布,当正态分布,当 时,时, t分布与标准正态曲线重分布与标准正态曲线重合,方差为合,方差为1。t分布表的使用分布表的使用 - n三、三、t分布分布样本平均数的分布样本平均数的分布总体分布为正态,方差未知时,样本平均数的分布为总体分布为正态,方差未知时,样本平均数的分布为t分布。分布。当总体分布为非正态而其方差又未知时,若满足当总体分布为非正态而其方差又未知时,若满足n30这一条件,样本平均数的分布近似为这一条件,样本平均数的分布近似为t分布。分布。112121 nxsnxsns
25、nssnnX.四、四、 分布分布定义定义12222222 ndfnsXXndfZuXi.).)22(2四、四、 分布分布2。差差异是否显著的检验以及样本方差与总体方于计数数据的假设检验分布在统计分析中应用分布表(三)分布。似有些离散型的分布也近分布是连续型分布,但。,方差分布的平均数:,这时大于如果分布具有可加性。分布,即分布的和也是值都是正值。分布是一个正偏态分布分布的特点(二)222222222222)475(5.224.3.2.1.22Pdfdfudf五、F分布是是否否取取自自同同一一总总体体。可可分分析析任任意意两两样样本本方方差差,则则,即即从从一一个个总总体体中中抽抽样样若若总总体
26、体方方差差的的比比率率。比比率率为为样样本本方方差差除除以以其其上上式式可可理理解解,、及及、为为:,其其平平均均数数与与方方差差分分别别设设有有两两个个正正态态分分布布总总体体(一一)定定义义21212221212122221212121122122221121212111111 nnnnnnnissFFssnsnnsnFsnXXdfdfFuu2221222122221/)(/)()(/)()()(/五、五、F分布分布)459455(13.2.1.21PPFtFFdfdfFF,分布表(三)相同。值(双侧概率)的平方率的值与分母自由度相同概时,值,分母的自由度为任意当分子的自由度为总为正值。渐
27、趋正态分布。的增加而与同,随分母的自由度不同而不,分布曲线随分子、分布是一个正偏态分布分布的特点(二)样本方差的分布) 1() 1(222nsn22) 1(sn 卡方(2)分布(2 distribution)2分布分布:设设X1,X2,Xn是来自总体是来自总体N(0,1)的样本,的样本,则统计量则统计量 服从自由度为服从自由度为n的的2分布,记为分布,记为2 2(n)。设设 ,则,则令令 ,则,则 Y 服从自由度为服从自由度为1的的 2分布,即分布,即 当总体当总体 ,从中抽取容量为,从中抽取容量为n的样本,的样本,则则222212nXXX),(2NX) 1 , 0 ( NXZ2ZY ) 1
28、(2Y),(2NX222122()1(1)niiXXnSn分布的变量值始终为正分布的变量值始终为正 分布的形状取决于其自由度分布的形状取决于其自由度n的大小,通常为不的大小,通常为不对称的右偏分布,但随着自由度的增大逐渐趋对称的右偏分布,但随着自由度的增大逐渐趋于对称于对称 期望为:期望为:E( 2)=n,方差为:,方差为:D( 2)=2n ( (n为自由度为自由度) ) 可加性:若可加性:若U和和V为两个独立的为两个独立的 2分布随机变量,分布随机变量,U 2(n1), V 2(n2),则则U+V 这一随机变量服从这一随机变量服从自由度为自由度为n1+n2的的 2分布分布 2分布(性质和特点
29、)2分布(图示)选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2 = (n-1)S2/2计算出所有的计算出所有的 2值值总体总体第三节第三节 参数估计参数估计 当在研究中从样本获得一组数据后,如何当在研究中从样本获得一组数据后,如何通过这组数据信息,对总体特征进行估计,通过这组数据信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,也就是如何从局部结果推论总体的情况,称为总体参数估计。称为总体参数估计。 参数估计可分为点估计和区间估计两种。参数估计可分为点估计和区间估计两种。第一节第一节 点估计、区间估计与标准误点估计、区间估计
30、与标准误一、点估计的定义一、点估计的定义点估计是指在进行参数估计时,直接用一个特定点值作为总体参数的估计值。二、良好估计量的标准二、良好估计量的标准无偏性:无偏性:即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。有效性:有效性:当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。一致性一致性:当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐趋近于真值。充分性:充分性:指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息。三、区间估计与标准误三、区间估计与标准误区间估计的定义区间
31、估计的定义是根据样本统计量,利用抽样分布的原理,在一定的可靠程度上,估计出总体参数所在的范围,即以数轴上的一段距离表示未知参数可能落入的范围。置信区间与显著性水平置信区间与显著性水平置信区间:置信区间:也称置信间距,指在一定可靠程度上,总体参数所在的区域距离或区域长度。置信界限(临界值):置信界限(临界值):置信区间的上下两端点值。显著性水平显著性水平:指估计总体参数落在某一区间时,可能犯错误的概率,用符号 表示。有时也称为意义阶段、信任系数等。置信度(置信水平):置信度(置信水平): 。-1三、区间估计与标准误三、区间估计与标准误区间估计的原理与标准误区间估计的原理与标准误区间估计是根据样本
32、分布理论,用样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率。区间估计存在成功估计的概率大小成功估计的概率大小及估计范围大小估计范围大小两个问题。妥协办法:在保证置信度的前提下,尽可能提高精确度。规定正确估计的概率即置信度为0.95和0.99,则显著性水平为0.05和0.01。小概率事件在一次抽样中不可能出现。区间估计的原理是样本分布理论。区间估计的原理是样本分布理论。在计算区间估计值解释估计的正确概率时,依据的是该样本统计量的分布规律及样本分布的标准误。样本分布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使标准误变小。一、参数估计的原理区间估
33、计的原理和方法置信区间和显著性水平 区间估计时, 某一概率下,总体参数所在的区间称为置信区间,区间的端点值称为临界值,这个概率称为置信度,以概率 表示, 又称显著性水平,表示该区间估计的不可靠程度。区间估计的原理和方法 1。之间正确的概率为在或者说之间,数被包含在任何一个平均的机会有,也就是说体参数这一间距之内将包含总的平均数那么所有平均数中有之间,落在的推理:所有平均数中有。的之间包含所有或者说之间,落在的有根据正态分布:。或标准误,写作称均数分布的标准差(简平均数的离散程度即平,样本平均数的平均数渐近正态分布,此时,分布或本平均数的分布为正态当总体方差已知时,样95%96. 196. 19
34、5%96. 195%96. 195%95%96. 196. 195%)XXXXXXXXXXSEXuSEXuuSEXSEuXXSEuSEuXnSESEuu第二节 总体平均数的估计一、总体平均数估计的计算步骤:利用抽样的方法抽取样本,计算出样本的平均值 和标准差S。计算样本平均数的标准误 :当总体方差已知时,样本平均数的标准误的计算为:当总体方差未知时,样本平均数的标准误的计算为:XXSEnSEX1nSSEnX一、总体平均数估计的计算步骤:确定显著性水平和置信水平根据样本平均数的抽样分布确定查何种分布表,确定理论值。确定置信区间:解释总体平均数的置信区间。XXXXXXXXSEtXSEtXSEtXS
35、EtXtSEZXSEZXSEZXSEZXZ2222222222,:,:,记为置信区间为时当理论值为记为置信区间为时当理论值为二、总体方差已知时,对总体平均数的估计二、总体方差已知时,对总体平均数的估计当总体分布为正态分布时,(无论样当总体分布为正态分布时,(无论样本容量本容量n的大小,从该总体抽取的样本的大小,从该总体抽取的样本分布均成正态分布。)对总体平均数的分布均成正态分布。)对总体平均数的估计可以依正态分布进行估计。估计可以依正态分布进行估计。例1 已知某市6岁正常男童体重的总体方差为6.55公斤,从该市随机抽取15 名6岁男童,其平均体重为20.4公斤,试求该市6 岁男童平均体重的95
36、%和99%的置信区间。例1的计算 解:95%的置信区间的显著性水平=0.05,因此,的95%的置信区间为:即:的99%的置信区间为:即:故该市6岁男童平均体重的95%的置信区间为19.11,21.69;99%的置信区间为18.7,22.1。66. 087. 356. 21555. 6nSEX96. 12Z66. 096. 14 .2066. 096. 14 .2069.2111.1966. 058. 24 .2066. 058. 24 .201 .227 .18二、总体方差已知时,对总体平均数的估计二、总体方差已知时,对总体平均数的估计当总体为非正态分布时(只有当样本容量当总体为非正态分布时(
37、只有当样本容量n30时时,此时样本抽样分布渐近正态分布。这此时样本抽样分布渐近正态分布。这时可依正态分布进行估计,否则不能对总体平时可依正态分布进行估计,否则不能对总体平均数进行估计。)均数进行估计。)例3 已知某区15 岁男生立定跳远的方差为 ,现从该区抽取58名15岁男生,测得该组男生立定跳远的平均数为198.4cm,试求该区15岁男生立定跳远平均成绩的95%和99%的置信区间。cm8 .436例3解:由题意知:由于样本容量(n=58)大于30 ,该样本的抽样分布为渐进正态分布。因此,的95%的置信区间为: 198.41.962.75198.41.962.75即 193.01203.79的
38、99%的置信区间为: 198.42.582.75198.42.582.75即 191.3205.5故该区15岁男生立定跳远的平均成绩有95%的可能落入193.01,203.79内,有99%的可能落入191.3,205.5内。75. 26 . 79 .20588 .436nSEX三、总体方差未知,对总体平均数的估计三、总体方差未知,对总体平均数的估计当总体分布为正态分布时(无论样本容量当总体分布为正态分布时(无论样本容量n的的大小,从该总体抽取的样本所形成的分布均服大小,从该总体抽取的样本所形成的分布均服从自由度为从自由度为n-1的的t分布,对总体平均数的估计分布,对总体平均数的估计可依可依t分布进行估计)分布进行估计)例4 从某市抽取20 名7 岁女童,经测量,这20 名女童的平均身高为116cm,标准差为5cm,试求该市7岁女童总平均身高的95%和99%的置信区间。例4解:由题意知,其总体方差未知,但其总体分布为正态分布,则此样本均数的分布服从t分布,可以依t分布对总平均身高进行估计。29.11971.11215. 1861. 211615. 1861. 2116:%9941.11859.11315. 1093. 211615. 1093. 2116:%95861. 2;093. 2:191201;15. 1195119201. 019205. 0即的置
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 解除劳动合同通知书简易范本
- 服务外包的合同范本
- 私人之间的保密协议
- 破碎机买卖合同3篇
- 个人租汽车给公司租赁合同
- 钢结构工程施工合同
- 河道采砂合同范本
- 2024年度股权转让及投资意向书2篇
- 2024年度合作协议:甲乙双方关于共同开展项目的具体条款2篇
- 《生物化学方法》课件
- 2024年高中语文会考试题及答案
- 石油化工班组安全生产标准化建设活动实施方案
- 沟通的艺术(湖南师范大学)【智慧树知到】章节答案
- 安徽泰格生物科技有限公司年生产1500吨肌酸及500吨胍基乙酸项目环境影响报告表
- 中石化公司HSE关键岗位人员学习考试题库
- 无损检测二级考试渗透检测
- 斐波那契数列与黄金分割讲义
- python程序设计教学教案
- 老舍《我的母亲》原文阅读
- 幼儿园大班语言教案《五粒豌豆》含反思
- 言语的第一思维找重点句
评论
0/150
提交评论