6第六章 抽样分布及总体平均数的推断_第1页
6第六章 抽样分布及总体平均数的推断_第2页
6第六章 抽样分布及总体平均数的推断_第3页
6第六章 抽样分布及总体平均数的推断_第4页
6第六章 抽样分布及总体平均数的推断_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 抽样分布及总体平均数的推断抽样分布;总体平均数的参数估计假设检验总体平均数显著性检验6.1 抽样分布6.1.1抽样分布的含义总体分布:总体内个体数值的频率分布;样本分布:样本内个体数值的频数分布;抽样分布:某一种统计量的频率分布。135 134 129 133 131 131 131 134 125 128 135 127 127 133 130 132 132 129 124 132 122 124 127 131 137 132 133 134 124 128 135 133 131 123 115 132 134 138 124 132 128 136 127 120 125 1

2、31 136 127 124 129 129 132 138 125 131 120 121 144 128 133 128 127 130 120 121 122 127 121 125 130 140 121 126 130 122 128 127 125 127 131师大附小二年级80个学生的身高师大附小二年级80个学生的身高总体分布:总体内个体数值的频率分布1351341291331311311311341241321221241271311371321341381241321281361271201311201211441281331281271261301221281271251

3、27131135127127133130132132129师大附小二年级中48个学生的身高容量=48 平均数=129.5625 标准差=4.8942师大附小二年级中48个学生的身高 样本分布:样本内个体数值的频数分布所抽取的各样本的平均数如下:129.825 126.55 128.575 129.5 128.52 130.72 129.55 129.45 129.68 129.385 129.95 130.27 128.57 128.9 125.65 容量=50 平均数=129.00 标准差=1.34容量=50 平均数=129.00 标准差=1.34根据抽样平均数频率分布表制作的多边图 上海市

4、初中一年级末数学水平的调查研究,在该研究中假定上海市共有初中一年级学生为150000人( N 人),如果对上海所有初中一年级学生进行统一的标准化的数学成就测验,其测验的平均成绩为80分( ),测验的标准差为9分( )。例1例2 某一调查研究者甲为了节省调查研究的成本,现从上海市初中一年级学生中随机抽取500人(n人)进行统一的标准化的数学成就测验,试图通过这500人的测验结果来推断全上海初中一年级学生的数学水平,其测验的平均成绩为82分( ),测验的标准差为8分(x)。1 分析上述实例区分总体和样本区分参数与统计量及不同的表达方式 如果我们用上海初一年级150000个学生的成绩做图,则构成一个

5、总体分布图:概率密度或百分比成绩 如果我们只用其中抽取的500个个学生的成绩做图,则构成一个样本分布图:概率密度或百分比成绩2、抽样分析 假定该研究者第一次抽取500人做完调查研究后,又重新从上海初中一年级学生中(150000人)抽取500人(n2)进行调查研究,其平均数为: 标准差为:x2 (抽取学生的过程中,前面抽到的学生在后面抽取中也可能抽到,但不重复测验) 。 如果上述过程不断重复操作,则可以得到更多的样本平均数和标准差,如下表: 如果我们用k (k趋近于无穷大)个样本平均数做频数分布图,则构成一个由样本平均数组成的抽样分布(平均数抽样分布)图:概率密度或百分比抽样的平均成绩由这些抽样

6、的平均数构成的平均数 由这些抽样平均数组成分布的标准差称为平均数的标准误用 来表示。 标准误(STANDARD ERRORS):某种统计量的标准差称为该统计量的标准误。 抽样分布是某一种统计量的概率分布。 6.1.2平均数抽样分布的几个定理3、正态总体中,平均数的抽样分布呈正态1、2、4、偏态总体中,当抽样容量较大时,平均数的抽样分布也呈正态6.1.3 样本平均数与总体平均数的离差统计量平均数为:标准差为:离差统计量是以标准差为单位来来度量某一个个案值与平均数间的差异。Z分数就是一种离差统计量当总体标准差已知时,平均数的离差统计量的计算:当总体标准差未知时,平均数的离差统计量的计算: 首先根据

7、样本标准差( x )来估计总体标准差() 其估计值用S来表示。因此,平均数的标准误为:离差统计量的表达形式为:练习1: 某校二年级学生的英语平均成绩为78,从中随机抽取50人,其平均成绩为82,标准差为12。试估计该校二年级学生英语成绩的标准差,并计算50人平均成绩的离差统计量。关于T分布:关于Z分布与T分布的区别:当总体方差已知时,Z只随样本平均数而变化;当总体方差未知时,T不仅随样本平均数而变化,而且还随S而变化。T分布的特点:T分布的形态随自由度的变化呈一簇分布形态(即自由度不同的T分布形态也不同);T分布的峰狭窄尖峭,尾长而翘得高;自由度越小,分布范围越广;自由度趋于无限大,T分布接近

8、正态分布;自由度df:指总体参数估计量中变量值自由变化的个数。6.2 总体平均数的参数估计 根据样本统计量对相应总体参数所作的估计叫总体参数估计。总体参数估计分为点估计和区间估计。6.2.1 点估计(1)点估计的定义 用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。6.2 总体平均数的参数估计(2)点估计的评价标准:无偏性:用统计量估计总体参数一定会有误差,不可能恰恰相同。因此,好的估计量应该是一个无偏估计量,即用多个样本的统计量作为总体参数的估计值,其偏差的的平均值为0。 有效性:当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。6.2 总体平

9、均数的参数估计(2)点估计的评价标准:一致性:当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,估计值越来越精确,逐渐趋近于真值。充分性:一个容量为的样本统计量,是否充分地反映了全部个数据所反映总体的信息。 6.2.2 区间估计(1)区间估计的定义 区间估计是指以样本统计量的样本分布为理论依据,按一定的概率要求,由样本统计量的值估计总体参数值的所在范围。6.2.2 区间估计(2)置信区间与显著性水平 置信区间是指在某一置信度时,总体参数所在的区域距离或区域长度。 显著性水平是指估计总体参数落在某一区间时,可能犯错误的概率,用表示。1为置信度或置信水平。6.2.2 区间估计(2)

10、区间估计的原理 区间估计的原理是样本分布理论。在计算区间估计值、解释估计的正确概率时,依据是该样本统计量的分布规律及样本分布的标准误(SE)。 下面以平均数的区间估计为例,说明如何根据平均数的样本分布及平均数分布的标准误(SE),计算置信区间和解释成功估计的概率。 。 6.2.2 区间估计(2)区间估计的原理 当总体方差2为已知时,样本平均数的分布为正态分布或渐近正态分布,此时样本平均数分布的平均数 ,标准误 。根据正态分布,可以说:有95% 的 落在 之间, 之间,或者说: 之间包含所有的 的95% ,即 6.2.2 区间估计(2)区间估计的原理 但是,在实际研究中,只能得到一个样本平均数,

11、我们可以将这个样本平均数看做是无限多个样本平均数之中的一个。于是将上式经过移项写成 这意味着有95%的落在 之间,或者说,估计 落在 之间的正确的概率为95% 。 6.2.2 区间估计练习2某一个正态总体,其平均数为130,标准差为10。以平均数为中心,95%学生的成绩的分布范围;其成绩在128到132间的人数的比例;排名在班级前5%的学生成绩的分布范围。从总体中抽取25人,计算其平均成绩,该平均成绩在128到132间的概率有多大;从总体中抽取25人,计算其平均成绩,该平均成绩以总体平均数为中心,95%概率下的分布范围从总体中抽取25人,计算其平均成绩,该平均成绩由高到低95%概率下的分布范围

12、;从总体中抽取25人,计算其平均成绩,最高5%的平均成绩的范围。从总体中抽取25人,计算其平均成绩,该平均成绩大于135的概率是多少。练习3 某小学10岁儿童身高的标准差为6.25厘米,现从该校随机抽出27名10岁儿童,其平均身高为134.2厘米,试估计该校10岁儿童身高的95%和99%置信区间。6.2.3 总体平均数的估计(1)估计总体平均数的步骤1 根据实得样本的数据,计算样本平均数与标准差。2 计算标准误。 ( 已知)或 ( 未知)3 确定置信区间或显著性水平。 6.2.3 总体平均数的估计4 根据样本平均数的抽样分布,确定查何种统计表。5 计算置信区间。 (正态分布)或 (分布)6 解

13、释总体平均数的置信区间。 6.2.3 总体平均数的估计(2)总体方差2 已知时1 当总体分布为正态时 当总体分布为正态,总体方差( )已知时,样本平均数 的分布为正态分布,这时可用下式计算其置信区间: (其中 ) 6.2.3 总体平均数的估计(2)总体方差2 已知时2 当总体分布为非正态时 总体分布非正态,总体方差( )已知,这时只有当样本容量 时,其样本平均数 的分布为渐近正态分布,这时可用下式计算其置信区间: ( 其中 ) 6.2.3 总体平均数的估计(2)总体方差2 未知时1 当总体分布为正态时 当总体分布为正态,总体方差( )未知时,样本平均数 的分布为分布,这时可用下式计算其置信区间

14、: (其中 ) 6.2.3 总体平均数的估计(2)总体方差2 未知时2 当总体分布为非正态时 总体分布非正态,总体方差( )未知,这时只有当样本容量 时,其样本平均数 的分布为渐近分布,这时可用下式计算其置信区间: (其中 ) 练习5 从某次考试中随机抽取102名学生的成绩,其平均成绩为26,标准差为1.5。试估计总体平均成绩95%和99%的置信区间。练习4 从某小学三年级学生中随机抽取12名学生,其平均成绩为29.917,标准差为3.926。试估计该校三年级学生总体平均成绩95%和99%的置信区间。6.3 假设检验6.3.1 假设检验的原理 假设是根据已知理论与事实对研究对象所做的假定性说明

15、,统计学中的假设一般专指用统计学术语对总体参数所做的假定性说明。 在进行任何一项研究时,都需要根据已有的理论和经验对研究结果作出一种预想的希望证实的假设,这种假设叫科学假设,用统计术语表示时叫研究假设(备择假设),记作H1 。 6.3 假设检验6.3.1 假设检验的原理 在统计学中不能对H1 的真实性直接检验,需要建立与之对立的假设,称做虚无假设(零假设,无差假设,原假设),记作H0 。 假设检验的问题,就是要判断虚无假设H0是否正确,决定接受还是拒绝虚无假设H0 ,若拒绝虚无假设H0 ,则接受备择假设H1 。 6.3 假设检验6.3.1 假设检验的原理 假设检验是从零假设出发,视其被拒绝的机

16、会,如果根据样本信息,不得不否定零假设的真实性时,就不得不承认备择假设的真实性,这时,就要拒绝零假设而接受备择假设;如果根据样本的信息不能否定零假设的真实性时,就要保留零假设而拒绝备择假设。 6.3 假设检验6.3.1 假设检验的原理 假设检验的基本思想是概率性质的反证法。为了检验虚无假设,首先假定虚无假设为真。在虚无假设为真的前提下,如果导致违反逻辑或违反人们常识和经验的不合理现象出现,则表明“虚无假设为真”的假定是不正确的,也就不难接受虚无假设。若没有导致不合理的现象出现,那就认为“虚无假设为真”的假定是正确的,也就是接受了虚无假设。 6.3 假设检验6.3.1 假设检验的原理 这种“反证

17、法”思想不同于数学中的反证法,后者是在假设某一条件下导致逻辑上的矛盾从而否定原来的假设。假设检验中“不合理现象”是指小概率事件在一次试验中发生了,它是基于人们在实践中广泛采用的小概率事件原理。 (小概率事件原理是指“小概率事件在一次试验中几乎不可能发生”。通常情况下,将概率不超过0.05或0.01的事件当做“小概率事件”。) 6.3 假设检验6.3 假设检验6.3.2 单侧检验与双侧检验 只强调差异而不强调方向性的检验叫双侧检验;强调某一方向的检验叫单侧检验。 6.3 假设检验6.3.2 单侧检验与双侧检验 某市全体7岁男童体重平均数为21.61千克,标准差为2.21千克,某小学70个7岁男童

18、体重的平均数为22.9,问该校7岁男童体重与该市是否一样。 某区某年高考化学平均分数为72.4,标准差为12.6,该区实验学校28名学生此次考试平均分数为74.7,问实验学校此次考试成绩是否高于全区平均水平? 6.3 假设检验6.3.2 单侧检验与双侧检验双侧检验单侧检验6.3 假设检验6.3.3 假设检验的步骤1 根据问题要求,提出虚无假设和备择假设。 2 选择适当的检验统计量并计算其值。3 规定显著性水平。 4 选择检验的方式(单侧还是双侧)。5 做出统计决策。 假设检验这种反证法与一般的数学反证法有什么不同?思考题 (1)数学反证法最终推翻假设的依据一定是出现了百分之百的谬误,因此推翻假

19、设的决策无论是决策逻辑还是从决策内容看都是百分之百正确的。而假设检验的反证法最终推翻零假设的依据是一个小概率事件,从决策逻辑角度看是百分之百正确的,但其决策的内容却是有可能出错的。 (2)数学中使用反证法,其最终结果一定是推翻原假设,而假设检验这种反证法的最终结果却有可能无充分理由推翻零假设。答:6.3 假设检验6.3.4 假设检验中的两类错误 统计学中将这类拒绝H0时所犯的错误称做 错误,即假设是真而被拒绝所犯的错误,其大小与假设检验的显著性水平相等。 接受H0时所犯的错误为错误,即假设是伪而被接受。 例A 韦氏智力测验的总体平均数为100,标准差为15。现从某实验学校抽取64人,其平均智商

20、为103,问该校的智力水平与总体水平是否有显著差异(=.05)。=1001.961.60=103例A假设检验的示意图 /2=.025 /2=.025例B 从现从某实验学校抽取64人,其平均智商为103。问该校学生的智力水平是否是来自于平均智商为105,标准差为15的总体(=.05) 。=105-1.96-1.06=103例B假设检验的示意图 /2=.025 /2=.0251 =1050 =1001.60=103例A假设检验中所犯错误1.96/2=.025/2=.025=.240 =1001 =105-1.06=103例B假设检验中所犯错误/2=.025/2=.025-1.96=.246.3 假

21、设检验6.3.4 假设检验中的两类错误两类错误的关系: (1) 不一定等于1; (2) 与 不可能同时减小或增大; (3)1 - 反映着正确辨认真实差异的能力。 6.3 假设检验6.3.4 假设检验中的两类错误6.3 假设检验6.3.4 假设检验中的两类错误 控制 错误:可以由研究者通过选择适当的显著性水平加以主动控制。 控制错误的概率有以下两种方法: 利用已知的实际总体参数值与假设参数值之间大小关系,合理安排拒绝区域的位置; 增大样本的容量。样本容量的扩大引起的变化是什么? 检验功效 ( POWER )1、什么是检验功效Power=1-功效:正确拒绝虚无假设的概率2、影响功效的因素Power

22、=1- 检验的形式样本的容量鉴别力(EFFECT SIZE , d值)d3、依据功效的要求,确定样本的大小例A中,如果要求功效为.80,其样本应为多少?1 =1050 =1001.96/2=.025/2=.025N=71.916.4 总体平均数显著性检验6.4.1 平均数显著性检验的概念 平均数的显著性检验是指根据样本平均数与假设总体平均数的差异检验样本所在总体的平均数与假设总体的平均数的差异。 6.4 总体平均数显著性检验6.4.1 平均数显著性检验的概念例3 全区统一考试物理平均分为50分,标准差为10分。某校一个班41人的平均成绩为52.5,问该班成绩与全区成绩差异是否显著? 6.4 总

23、体平均数显著性检验6.4.1 平均数显著性检验的方法1 总体正态分布、总体方差已知的条件下平均数的显著性检验 2 总体正态分布、总体方差未知条件下平均数的显著性检验 练习6 有人从受过良好教育早期儿童中随机抽取70人是行韦氏智力测验(该测验的总体平均数为100,标准差为15),其结果为103.3。能否认为受过良好早期教育的儿童智力高于一般水平?练习7 某一种食品的标准重量为1000克,但在包装过程中有误差,其标准差为50克。工商部门为检验其重量是否合格,从该产品中抽出50袋样品,平均重量为986克。问该产品在重量上是否合格?练习8 某心理学家变认为一般汽车司机的视反应平均时间是175毫秒,有人

24、随机抽取36名汽车司机作为研究样本进行了测定,结果平均值为180毫秒,标准差为25毫秒。能否根据测试结果否定该心理学家的结论。练习9 医学上测定,正常人的血色素应该是每100毫升13克,某学校进行抽查,37名学生血色素平均值为12.1克,标准差为1.5,问该学校学生的血色素是否显著低于正常值。6.4 总体平均数显著性检验6.4.1 平均数显著性检验的方法3 总体非正态分布条件下平均数的显著性检验 当 n30 时,尽管总体分布非正态,对于平均数的显著性检验仍可用Z 检验。 (0 已知) 或 ( 0 未知) 6.4 总体平均数显著性检验6.4.2 平均数显著性检验的方法3 总体非正态分布条件下平均数的显著性检验 当 n30 时,若总体分布非正态,对于平均数的显著性检验不符合近似 Z 检验的条件,严格讲此时也不符合t 检验的条件。 6.4.3 差异显著性的判断规则 有大于或等于99%的把握(即有很大把握)说两个总体有差异。(拒绝 接受 )差异非常显著P0.01有大于或等于95%的把握(即有把握)说两个总体有差异。 ( 拒绝 接受 )差异显著0.010.05判断统计意义P值练习10某人做100个5选1的选题,假如规定做对95%的题目才算了解有关知识,则至少应该做对多少

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论