第六章 抽样分布及总体平均数的推断_第1页
第六章 抽样分布及总体平均数的推断_第2页
第六章 抽样分布及总体平均数的推断_第3页
第六章 抽样分布及总体平均数的推断_第4页
第六章 抽样分布及总体平均数的推断_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样分布及总体平均数的推断抽样分布;总体平均数的参数估计假设检验总体平均数显著性检验6.1抽样分布6.1.1抽样分布的含义总体分布:总体内个体数值的频率分布;样本分布:样本内个体数值的频数分布;抽样分布:某一种统计量的频率分布。135134129133131131131134125128135127127133130132132129124132122124127131137132133134124128135133131123115132134138124132128136127120125131136127124129129132138125131120121144128133128127130120121122127121125130140121126130122128127125127131师大附小二年级80个学生的身高师大附小二年级80个学生的身高总体分布:总体内个体数值的频率分布135 134 129 133 131 131 131 134124 132 122 124 127 131 137 132134 138 124 132 128 136 127 120131 120 121 144 128 133 128 127126 130 122 128 127 125 127 131135 127 127 133 130 132 132 129师大附小二年级中48个学生的身高容量=48平均数=129.5625标准差=4.8942师大附小二年级中48个学生的身高

样本分布:样本内个体数值的频数分布所抽取的各样本的平均数如下:129.825126.55128.575129.5128.52130.72129.55129.45129.68129.385129.95130.27128.57128.9125.65容量=50平均数=129.00标准差=1.34容量=50平平均均数=129.00标标准准差=1.34根据抽样平平均数频率率分布表制制作的多边边图上海市初中中一年级末末数学水平平的调查研研究,在该该研究中假假定上海市市共有初中中一年级学学生为150000人(N人),,如果对上上海所有初初中一年级级学生进行行统一的标标准化的数数学成就测测验,其测测验的平均均成绩为80分(μμ),,测验的标标准差为9分(σσ)。例1例2某一调查研研究者甲为为了节省调调查研究的的成本,现现从上海市市初中一年年级学生中中随机抽取取500人人(n人)进行统一一的标准化化的数学成成就测验,,试图通过过这500人的测验验结果来推推断全上海海初中一年年级学生的的数学水平平,其测验验的平均成成绩为82分(),测验验的标准差差为8分(σx)。1分析上述实实例区分总体和和样本区分参数与与统计量及及不同的表表达方式如果我们用用上海初一一年级150000个学生的成成绩做图,,则构成一一个总体分分布图:概率密度度或百分分比成绩如果我们们只用其其中抽取取的500个个学生生的成绩绩做图,,则构成成一个样样本分布布图:概率密度度或百分分比成绩2、抽样分析

假定该研究者第一次抽取500人做完调查研究后,又重新从上海初中一年级学生中(150000人)抽取500人(n2)进行调查研究,其平均数为:标准差为:σx2(抽取学生的过程中,前面抽到的学生在后面抽取中也可能抽到,但不重复测验)。

如果上述过程不断重复操作,则可以得到更多的样本平均数和标准差,如下表:如果我们们用k(k趋趋近于无无穷大)个样本本平均数数做频数数分布图图,则构构成一个个由样本本平均数数组成的的抽样分分布(平平均数抽抽样分布布)图::概率密度度或百分分比抽样的平平均成绩绩由这些抽样的平均数构成的平均数

由这些抽样平均数组成分布的标准差称为平均数的标准误用来表示。标准误(STANDARDERRORS):某某种统计计量的标标准差称称为该统统计量的的标准误误。抽样分布布是某一一种统计计量的概概率分布布。6.1.2平均数抽抽样分布布的几个个定理3、正态总体体中,平平均数的的抽样分分布呈正正态1、2、4、偏态总体体中,当当抽样容容量较大大时,平平均数的的抽样分分布也呈呈正态6.1.3样本平均均数与总总体平均均数的离离差统计计量平均数为:标准差为:离差统计计量是以以标准差差为单位位来来度度量某一一个个案案值与平平均数间间的差异异。Z分分数就是是一种离离差统计计量当总体标准准差已知知时,平均均数的离离差统计计量的计计算:当总体标准准差未知知时,平均均数的离离差统计计量的计计算:首先根据据样本标标准差(σx)来来估计总总体标准准差(σσ)其估计值值用S来来表示。。因此,平均数的标准误为:离差统计计量的表表达形式式为:练习1:某校二年年级学生生的英语语平均成成绩为78,从从中随机机抽取50人,,其平均均成绩为为82,,标准差差为12。试估估计该校校二年级级学生英英语成绩绩的标准准差,并并计算50人平平均成绩绩的离差差统计量量。关于T分布:关于Z分分布与T分布的的区别::当总体方方差已知知时,Z只随样样本平均均数而变变化;当总体方差未未知时,T不不仅随样本平平均数而变化化,而且还随随S而变化。。T分布的特点点:T分布的形态态随自由度的的变化呈一簇簇分布形态((即自由度不不同的T分布布形态也不同同);T分布的峰狭狭窄尖峭,尾尾长而翘得高高;自由度越小,,分布范围越越广;自由度度趋于无限大大,T分布接接近正态分布布;自由度df::指总体参数数估计量中变变量值自由变变化的个数。。6.2总总体平均数的的参数估计根据样本统计计量对相应总总体参数所作作的估计叫总总体参数估计计。总体参数数估计分为点点估计和区间间估计。6.2.1点点估计(1)点估计的定义义用某一样本统统计量的值来来估计相应总总体参数的值值叫总体参数数的点估计。。6.2总总体平均数的的参数估计(2)点估计的评价价标准:无偏性:用统计量估估计总体参数数一定会有误误差,不可能能恰恰相同。。因此,好的的估计量应该该是一个无偏偏估计量,即即用多个样本本的统计量作作为总体参数数的估计值,,其偏差的的的平均值为0。有效性:当总体参数数的无偏估计计不止一个统统计量时,无偏估计变变异性小者有有效性高,变变异大者有效效性低。6.2总总体平均数的的参数估计(2)点估计的评价价标准:一致性:当样本容量量无限增大时时,估计量的的值能越来越越接近它所估估计的总体参参数值,估计计值越来越精精确,逐渐趋趋近于真值。。充分性:一个容量为为的样本统计计量,是否充充分地反映了了全部个数据据所反映总体体的信息。6.2.2区区间估计计(1)区间估计的定定义区间估计是指指以样本统计计量的样本分分布为理论依依据,按一定定的概率要求求,由样本统统计量的值估估计总体参数数值的所在范范围。6.2.2区区间估计计(2)置信区间与显显著性水平置信区间是指指在某一置信信度时,总体体参数所在的的区域距离或或区域长度。。显著性水平是是指估计总体体参数落在某某一区间时,,可能犯错误误的概率,用用α表示。1-α为置信信度或置信水水平。6.2.2区区间估计计(2)区间估计的原原理区间估计的原原理是样本分分布理论。在在计算区间估估计值、解释释估计的正确确概率时,依依据是该样本本统计量的分分布规律及样样本分布的标标准误(SE)。下面以平均数数的区间估计计为例,说明明如何根据平平均数的样本本分布及平均均数分布的标标准误(SE),计算置置信区间和解解释成功估计计的概率。。6.2.2区区间估计计(2)区间估计的原原理当总体方差σσ2为已知时时,样本平均均数的分布为为正态分布或或渐近正态分分布,此时样样本平均数分分布的平均数数,,标准误误。。根据据正态分布,,可以说:有有95%的的落在在之间,之间,或者说说:之间包含所有有的的95%,即即6.2.2区区间估计计(2)区间估计的原原理但是,在实际际研究中,只只能得到一个个样本平均数数,我们可以以将这个样本本平均数看做做是无限多个个样本平均数数之中的一个个。于是将上上式经过移项项写成这意味着有95%的μ落落在之间,或者说,估计计μ落在之间的正确的概率为95%。6.2.2区区间估计计练习2某一个正态总总体,其平均均数为130,标准差为为10。以平均数为中中心,95%学生的成绩绩的分布范围围;其成绩在128到132间的人数的的比例;排名在班级前前5%的学生成绩的分分布范围。从总体中抽取取25人,计计算其平均成成绩,该平均均成绩在128到132间的概率有有多大;从总体中抽取取25人,计计算其平均成成绩,该平均均成绩以总体体平均数为中中心,95%概率下的分分布范围从总体中抽取取25人,计计算其平均成成绩,该平均均成绩由高到到低95%概概率下的分布布范围;从总体中抽取取25人,计计算其平均成成绩,最高5%的平均成成绩的范围。。从总体中抽取取25人,计计算其平均成成绩,该平均均成绩大于135的概率率是多少。练习3某小学10岁岁儿童身高的的标准差为6.25厘米米,现从该校校随机抽出27名10岁岁儿童,其平平均身高为134.2厘厘米,试估计计该校10岁岁儿童身高的的95%和99%置信区区间。6.2.3总体平均数的的估计(1)估计总体平均均数的步骤1根据实得样本本的数据,计计算样本平均均数与标准差差。2计算标准误。。(已知知)或(未知知)3确定置信区间间或显著性水水平。6.2.3总体平均数的的估计4根据样本平均均数的抽样分分布,确定查查何种统计表表。5计算置信区间间。(正态分布))或(t分布)6解释总体平均均数的置信区区间。6.2.3总体平均数的的估计(2)总体方差σ2已知时1当总体分布为为正态时当总体分布为为正态,总体体方差())已知时时,样本平均均数的的分布为正态态分布,这时时可用下式计计算其置信区区间:(其中))6.2.3总体平均数的的估计(2)总体方差σ2已知时2当总体分布为为非正态时总体分布非正正态,总体方方差())已知,这这时只有当样样本容量时时,,其样本平均均数的的分布为渐近近正态分布,,这时可用下下式计算其置置信区间:(其中))6.2.3总体平均数的的估计(2)总体方差σ2未知时1当总体分布为为正态时当总体分布为为正态,总体体方差())未知时时,样本平均均数的的分布为t分分布,这时可可用下式计算算其置信区间间:(其中))6.2.3总体平均数的的估计(2)总体方差σσ2未知时2当总体分布布为非正态时总体分布非非正态,总总体方差(())未知,这这时只有当当样本容量量时时,其其样本平均均数的的分布为为渐近t分分布,这时时可用下式式计算其置置信区间::(其中))练习5从某次考试试中随机抽抽取102名学生的的成绩,其其平均成绩绩为26,,标准差为为1.5。。试估计总总体平均成成绩95%和99%的置信区区间。练习4从某小学三三年级学生生中随机抽抽取12名名学生,其其平均成绩绩为29.917,,标准差为为3.926。试估估计该校三三年级学生生总体平均均成绩95%和99%的置信信区间。6.3假设检验6.3.1假设检检验的原理理假设是根据据已知理论论与事实对对研究对象象所做的假假定性说明明,统计学学中的假设设一般专指指用统计学学术语对总总体参数所所做的假定定性说明。。在进行任何何一项研究究时,都需需要根据已已有的理论论和经验对对研究结果果作出一种种预想的希希望证实的的假设,这这种假设叫叫科学假设设,用统计计术语表示示时叫研究究假设(备备择假设)),记作H1。6.3假设检验6.3.1假设检检验的原理理在统计学中中不能对H1的真真实性直接接检验,需需要建立与与之对立的的假设,称称做虚无假假设(零假假设,无差差假设,原原假设),,记作H0。假设检验的的问题,就就是要判断断虚无假设设H0是否否正确,决决定接受还还是拒绝虚虚无假设H0,若若拒绝虚无无假设H0,则接接受备择假假设H1。。6.3假设检验6.3.1假设检检验的原理理假设检验是是从零假设设出发,视视其被拒绝绝的机会,,如果根据据样本信息息,不得不不否定零假假设的真实实性时,就就不得不承承认备择假假设的真实实性,这时时,就要拒拒绝零假设设而接受备备择假设;;如果根据据样本的信信息不能否否定零假设设的真实性性时,就要要保留零假假设而拒绝绝备择假设设。6.3假设设检检验验6.3.1假假设设检检验验的的原原理理假设设检检验验的的基基本本思思想想是是概概率率性性质质的的反反证证法法。。为为了了检检验验虚虚无无假假设设,,首首先先假假定定虚虚无无假假设设为为真真。。在在虚虚无无假假设设为为真真的的前前提提下下,,如如果果导导致致违违反反逻逻辑辑或或违违反反人人们们常常识识和和经经验验的的不不合合理理现现象象出出现现,,则则表表明明““虚虚无无假假设设为为真真””的的假假定定是是不不正正确确的的,,也也就就不不难难接接受受虚虚无无假假设设。。若若没没有有导导致致不不合合理理的的现现象象出出现现,,那那就就认认为为““虚虚无无假假设设为为真真””的的假假定定是是正正确确的的,,也也就就是是接接受受了了虚虚无无假假设设。。6.3假设设检检验验6.3.1假假设设检检验验的的原原理理这种种“反反证证法法””思思想想不不同同于于数数学学中中的的反反证证法法,,后后者者是是在在假假设设某某一一条条件件下下导导致致逻逻辑辑上上的的矛矛盾盾从从而而否否定定原原来来的的假假设设。。假假设设检检验验中中““不不合合理理现现象象””是是指指小小概概率率事事件件在在一一次次试试验验中中发发生生了了,,它它是是基基于于人人们们在在实实践践中中广广泛泛采采用用的的小小概概率率事事件件原原理理。(小概概率事事件原原理是是指““小概概率事事件在在一次次试验验中几几乎不不可能能发生生”。。通常常情况况下,,将概概率不不超过过0.05或0.01的的事件件当做做“小小概率率事件件”。。)6.3假设检检验6.3假设检检验6.3.2单单侧检检验与与双侧侧检验验只强调调差异异而不不强调调方向向性的的检验验叫双双侧检检验;;强调调某一一方向向的检检验叫叫单侧侧检验验。6.3假设检检验6.3.2单单侧检检验与与双侧侧检验验某市全全体7岁男男童体体重平平均数数为21.61千克克,标标准差差为2.21千千克,,某小小学70个个7岁岁男童童体重重的平平均数数为22.9,,问该该校7岁男男童体体重与与该市市是否否一样样。某区某某年高高考化化学平平均分分数为为72.4,标标准差差为12.6,,该区区实验验学校校28名学学生此此次考考试平平均分分数为为74.7,问问实验验学校校此次次考试试成绩绩是否否高于于全区区平均均水平平?6.3假设检检验6.3.2单单侧检检验与与双侧侧检验验双侧检检验单侧检检验6.3假设检检验6.3.3假假设检检验的的步骤骤1根据问问题要要求,,提出出虚无无假设设和备备择假假设。。2选择适适当的的检验验统计计量并并计算算其值值。3规定显显著性性水平平。4选择检检验的的方式式(单单侧还还是双双侧))。5做出统统计决决策。。假设检检验这这种反反证法法与一一般的的数学学反证证法有有什么么不同同?思考题题(1))数学学反证证法最最终推推翻假假设的的依据据一定定是出出现了了百分分之百百的谬谬误,,因此此推翻翻假设设的决决策无无论是是决策策逻辑辑还是是从决决策内内容看看都是是百分分之百百正确确的。。而假假设检检验的的反证证法最最终推推翻零零假设设的依依据是是一个个小概概率事事件,,从决决策逻逻辑角角度看看是百百分之之百正正确的的,但但其决决策的的内容容却是是有可可能出出错的的。(2))数学学中使使用反反证法法,其其最终终结果果一定定是推推翻原原假设设,而而假设设检验验这种种反证证法的的最终终结果果却有有可能能无充充分理理由推推翻零零假设设。答:6.3假设检检验6.3.4假假设检检验中中的两两类错错误统计学学中将将这类类拒绝绝H0时所所犯的的错误误称做做αα错错误,即假设是是真而而被拒拒绝所犯的的错误误,其大大小与与假设设检验验的显显著性性水平平相等等。接受H0时时所犯犯的错错误为为β错错误,即假假设是是伪而而被接接受。。例A韦氏智智力测测验的的总体体平均均数为为100,,标准准差为为15。现现从某某实验验学校校抽取取64人,,其平平均智智商为为103,,问该该校的的智力力水平平与总总体水水平是是否有有显著著差异异(αα=.05)。。=1001.961.60=103例A假假设检检验的的示意意图α/2=.025α/2=.025例B从现从从某实实验学学校抽抽取64人人,其其平均均智商商为103。问问该校校学生生的智智力水水平是是否是是来自自于平平均智智商为为105,,标准准差为为15的总总体(α=.05)。。=105-1.96-1.06=103例B假假设检检验的的示意意图α/2=.025α/2=.025μ1=105μ0=1001.60=103例A假假设检检验中中所犯犯错误误1.96α/2=.025α/2=.025ββ=.24μ0=100μ1=105-1.06=103例B假假设检检验中中所犯犯错误误α/2=.025α/2=.025β-1.96β=.246.3假设检检验6.3.4假假设检检验中中的两两类错错误两类错错误的的关系系:(1))αα+ββ不不一定定等于于1;;(2))αα与与β不不可可能同同时减减小或或增大大;(3))1-ββ反反映着着正确确辨认认真实实差异异的能能力。。6.3假设检检验6.3.4假假设检检验中中的两两类错错误6.3假设检检验6.3.4假假设检检验中中的两两类错错误控制αα错错误::可以以由研研究者者通过过选择择适当当的显显著性性水平平加以以主动动控制制。控制ββ错误误的概概率有有以下下两种种方法法:①①利利用已已知的的实际际总体体参数数值与与假设设参数数值之之间大大小关关系,,合理理安排排拒绝绝区域域的位位置;;②增增大大样本本的容容量。。样本容容量的的扩大大引起起的变变化是是什么么?检验功功效(POWER)1、什什么是是检验验功效效Power=1-β功效::正确确拒绝绝虚无假假设的概率率2、影影响功功效的的因素素Power=1-β检验的的形式式样本的的容量量鉴别力力(EFFECTSIZE,,d值)d3、依依据功功效的的要求求,确确定样样本的的大小小例A中中,如如果要要求功功效为为.80,,其样样本应应为多多少??μ1=105μ0=1001.96α/2=.025α/2=.025βN=71.916.4总体平均均数显著著性检验验6.4.1平平均数显显著性检检验的概概念平均数的的显著性性检验是是指根据据样本平平均数与与假设总总体平均均数的差差异检验验样本所所在总体体的平均均数与假假设总体体的平均均数的差差异。6.4总体平均均数显著著性检验验6.4.1平平均数显显著性检检验的概概念例3全区统一一考试物物理平均均分为50分,,标准差差为10分。某某校一个个班41人的平平均成绩绩为52.5,,问该班班成绩与与全区成成绩差异异是否显显著?6.4总体平均均数显著著性检验验6.4.1平平均数显显著性检检验的方方法1总体正态分布、总总体方差差已知的条件下下平均数数的显著著性检验验2总体正态分布、总总体方差差未知条件下平平均数的的显著性性检验练习6有人从受受过良好好教育早早期儿童童中随机机抽取70人是是行韦氏氏智力测测验(该该测验的的总体平平均数为为100,标准准差为15),,其结果果为103.3。能否否认为受受过良好好早期教教育的儿儿童智力力高于一一般水平平?练习7某一种食食品的标标准重量量为1000克克,但在在包装过过程中有有误差,,其标准准差为50克。。工商部部门为检检验其重重量是否否合格,,从该产产品中抽抽出50袋样品品,平均均重量为为986克。问问该产品品在重量量上是否否合格??练习8某心理学学家变认认为一般般汽车司司机的视视反应平平均时间间是175毫秒秒,有人人随机抽抽取36名汽车车司机作作为研究究样本进进行了测测定,结结果平均均值为180毫毫秒,标标准差为为25毫毫秒。能能否根据据测试结结果否定定该心理理学家的的结论。。练习9医学上测测定,正正常人的的血色素素应该是是每100毫升升13克克,某学学校进行行抽查,,37名名学生血血色素平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论