第五章 检验假设_第1页
第五章 检验假设_第2页
第五章 检验假设_第3页
第五章 检验假设_第4页
第五章 检验假设_第5页
已阅读5页,还剩118页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、samplepopulationinferentialstatisticsprobability第五章第五章 推论统计推论统计推推 论论 统统 计计参数估计参数估计假设检验假设检验参数检验参数检验非参数检验非参数检验样本与总体平均数差异样本与总体平均数差异两样本平均数差异两样本平均数差异多样本平均数差异多样本平均数差异(方差分析方差分析)方差齐性检验方差齐性检验相关系数检验相关系数检验主要内容主要内容第一节第一节 参数估计参数估计第二节第二节 假设检验的基本原理假设检验的基本原理第三节第三节 样本平均数与总体平均数差异的假设检验样本平均数与总体平均数差异的假设检验第四节第四节 两样本平均数差异

2、的假设检验两样本平均数差异的假设检验第五节第五节 方差分析方差分析例例1 1:从某市随机抽取小学三年级学生:从某市随机抽取小学三年级学生6060名,测得名,测得平均体重为平均体重为28kg28kg,标准差,标准差3.5kg3.5kg。试问该市小学三。试问该市小学三年级学生的平均体重大约是多少?年级学生的平均体重大约是多少?例例2 2:某教师用韦氏成人智力量表测:某教师用韦氏成人智力量表测100100名高三学生,名高三学生,M=115M=115。试估计该校高三学生智商平均数大约为多。试估计该校高三学生智商平均数大约为多少?少?第一节第一节 参数估计参数估计参数估计:用样本统计量估计总体参数的理论

3、和方法。参数估计:用样本统计量估计总体参数的理论和方法。点估计点估计 (point estimation)区间估计区间估计 (interval estimation) 例例3 3:从某市某年参加高三语文毕业会考的:从某市某年参加高三语文毕业会考的1100011000名名考生中随机抽取考生中随机抽取550550名,算出他们的语文成绩:名,算出他们的语文成绩:M=62M=62分、分、s=6s=6。主要特点:没有考虑误差的影响,也没有指出估计主要特点:没有考虑误差的影响,也没有指出估计的可靠程度。的可靠程度。一、点估计一、点估计二、区间估计二、区间估计区间估计:是在一定概率保证下指出总体参数的区间估

4、计:是在一定概率保证下指出总体参数的可能范围。可能范围。所给出的概率保证称为所给出的概率保证称为),),给出的可能范围叫给出的可能范围叫常用的置信度为常用的置信度为0.95、0.99知知 识识 回回 顾顾总体正态、方差已知时样本平均数的抽样分布服总体正态、方差已知时样本平均数的抽样分布服从从分布?如何确定一个样本平均数在抽样分布分布?如何确定一个样本平均数在抽样分布中的位置?中的位置?总体正态、方差未知时样本平均数的抽样分布服总体正态、方差未知时样本平均数的抽样分布服从从分布?如何确定一个样本平均数在抽样分布分布?如何确定一个样本平均数在抽样分布中的位置?中的位置?总体非正态、方差未知、总体非

5、正态、方差未知、n30n30时样本平均数的抽样时样本平均数的抽样分布服从分布服从分布?如何确定一个样本平均数在抽分布?如何确定一个样本平均数在抽样分布中的位置?样分布中的位置?三、总体平均数的区间估计三、总体平均数的区间估计基本原理:平均数的抽样分布理论基本原理:平均数的抽样分布理论以平均数的抽样分布呈正态为例以平均数的抽样分布呈正态为例 nXXZX/95. 0)96. 196. 1(95. 0)96. 1/96. 1(nXnPnXP95. 0)96. 196. 1(nXnXP95. 0)96. 196. 1(95. 0)96. 1/96. 1(nXnPnXP总体平均数总体平均数 出现在出现在

6、 之间的概率为之间的概率为0.95,或者说,总体平均数有或者说,总体平均数有95%的可能性出现在的可能性出现在 之间,而不在这个范围内的可能性为之间,而不在这个范围内的可能性为5%(可能犯错(可能犯错误的概率:误的概率: ,1- =置信度置信度 )。)。置信下限:置信下限: 置信上限:置信上限: nX96. 1nX96. 1nX96. 1nX96. 195. 0)96. 196. 1(nXnXP 99. 0)58. 258. 2(nXnXP1)(2/2/nZXnZXP(一)总体正态且方差已知时的区间估计(一)总体正态且方差已知时的区间估计1)(2/2/nZXnZXPP205v解:由于解:由于已

7、知,故已知,故95. 0)96. 196. 1(nXnXP95. 0)1007. 796. 1781007. 796. 178(P1)(2/2/nZXnZXP所以当置信度为所以当置信度为0.95时,时, 的置信区间为的置信区间为73.6282.38。练习题练习题 已知某校的一次外语考试中,全体考生成绩的已知某校的一次外语考试中,全体考生成绩的总体方差总体方差2=2=100100,从中抽取从中抽取5 5名考生的成绩为名考生的成绩为6565、8383、9494、7070、8888,试求全体考生的平均成绩的,试求全体考生的平均成绩的99%99%的置信区间。的置信区间。95. 0)38.8262.73

8、(P(二)总体正态标且准差(二)总体正态标且准差未知时的区间估计未知时的区间估计1)11()(2/)(2/nStXnStXPdfdfP207 应用举例应用举例解:由于解:由于未知,且样本容量未知,且样本容量n30时时1)(2/2/nSZXnSZXPP222 思考与练习题思考与练习题5-7一、假设检验的意义一、假设检验的意义例例4 4:随机抽取:随机抽取1010名女生和名女生和1010名男生测得心理健康名男生测得心理健康水平得分分别如下:水平得分分别如下:男生:男生:1111,1111,9 9,1212,1010,1313,1313,8 8,1010,1313女生:女生: 8 8,1111,12

9、12,1010,9 9, 8 8 ,8 8,9 9,1010,7 7经计算得男生心理健康水平的平均数为经计算得男生心理健康水平的平均数为1111,标准,标准差为差为1.761.76;女生平均数为;女生平均数为9.29.2,标准差为,标准差为1.5491.549。 第二节第二节 假设检验的基本原理假设检验的基本原理能否仅凭这两个平均数的差值能否仅凭这两个平均数的差值11-9.2=1.811-9.2=1.8,立即得,立即得出男生与女生心理健康水平存在差异的结论呢?出男生与女生心理健康水平存在差异的结论呢?导致前面男生与女生心理健康水平存在差异的原因导致前面男生与女生心理健康水平存在差异的原因可能有

10、两种,一是女生与男生两总体心理健康水平确可能有两种,一是女生与男生两总体心理健康水平确实存在本质不同,另一可能是抽样误差导致的。实存在本质不同,另一可能是抽样误差导致的。对两个样本进行比较时对两个样本进行比较时 ,必须判断样本间差异是抽,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。这正是假设检样误差造成的,还是本质不同引起的。这正是假设检验要解决的问题。验要解决的问题。 二、假设的提出二、假设的提出虚无假设(无差假设、零假设)虚无假设(无差假设、零假设)(null hyphothesis)一般用一般用H0表示。表示。备择假设(对立假设)(备择假设(对立假设)(alternative

11、 hyphothesis)一般用一般用H1表示。表示。三、假设检验的基本原理三、假设检验的基本原理采用概率论中的采用概率论中的“小概率事件实际不可能性原理小概率事件实际不可能性原理”进行进行反证。即首先假定虚无假设成立,然后根据样本信息计算反证。即首先假定虚无假设成立,然后根据样本信息计算虚无假设成立的概率的大小,如果成立的概率小于虚无假设成立的概率的大小,如果成立的概率小于0.05(0.01),则拒绝虚无假设,接受备择假设,反之,则接),则拒绝虚无假设,接受备择假设,反之,则接受虚无假设。受虚无假设。用来确定拒绝或接受虚无假设的概率标准用来确定拒绝或接受虚无假设的概率标准 叫叫 显显 著性著

12、性 水水 平(平(significance level),),记作记作。在统计学学常取在统计学学常取=0.05或或=0.01。四、假设检验的几种形式四、假设检验的几种形式双侧(尾)检验:只强调差异而不强调方向。双侧(尾)检验:只强调差异而不强调方向。 H0: 1= 0 H1: 1 0 单侧(尾)检验:强调差异的方向单侧(尾)检验:强调差异的方向左侧(尾)检验左侧(尾)检验 H0: 1= 0 H1: 1 0 P265 思考与练习题思考与练习题8-10 判断检验形式判断检验形式 双侧检验显著的单侧检验一定显著,单侧检验显著双侧检验显著的单侧检验一定显著,单侧检验显著的双侧检验不一定显著。的双侧检验

13、不一定显著。应根据研究目的恰当选择假设检验的形式。应根据研究目的恰当选择假设检验的形式。五、假设检验的步骤五、假设检验的步骤提出假设提出假设计算检验统计量(计算检验统计量(Z或或t值)值)确定显著性水平(检验形式)确定显著性水平(检验形式)统计决断统计决断六、假设检验中的错误六、假设检验中的错误因为显著性检验是根据因为显著性检验是根据 “ “小概率事件实际不可能性原小概率事件实际不可能性原理理”来拒绝或接受虚无假设的,来拒绝或接受虚无假设的, 所以不论是接受还是拒所以不论是接受还是拒绝虚无假设,都没有绝虚无假设,都没有100%100%的把握。也就是说,在检验虚的把握。也就是说,在检验虚无假设时

14、可能犯两类错误。无假设时可能犯两类错误。 接受接受H0 拒绝拒绝H0 (弃真)弃真)H0是对的是对的 正确(正确(1) 错误(错误() H0是错的是错的 错误(错误() 正确(正确(1) (纳伪)(纳伪) (检验统计力)(检验统计力)同时控制两类错误的方法是增加样本容量同时控制两类错误的方法是增加样本容量 0 11第三节第三节 样本平均数与总体平均数差异假设检验样本平均数与总体平均数差异假设检验 (一个总体平均数的假设检验)(一个总体平均数的假设检验)总体正态、标准差总体正态、标准差已知已知总体正态、标准差总体正态、标准差未知且为小样本未知且为小样本总体非正态、标准差总体非正态、标准差未知且为

15、大样本未知且为大样本例例1 1:某小学采用一种实验教材,使用一年以后,随机抽取:某小学采用一种实验教材,使用一年以后,随机抽取1010名学生进行测试,得到平均成绩名学生进行测试,得到平均成绩8282分,而过去使用旧教材分,而过去使用旧教材的全体学生的平均成绩为的全体学生的平均成绩为7777分,标准差为分,标准差为5 5分,问实验教材分,问实验教材与旧教材的效果有无显著差异?与旧教材的效果有无显著差异?例例2:2:某市所有高校本科生国家英语四级考试的平均成绩为某市所有高校本科生国家英语四级考试的平均成绩为72.572.5分,分布为非正态。某高校随机抽取分,分布为非正态。某高校随机抽取5050名考

16、生的成绩名考生的成绩, ,计算得到平均分为计算得到平均分为78.478.4分分, ,标准差为标准差为14.614.6分分. .该校历年的平均该校历年的平均成绩高于全市的平均成绩成绩高于全市的平均成绩, ,问该校今年的英语四级考试平均问该校今年的英语四级考试平均成绩是否显著高于全市的平均成绩成绩是否显著高于全市的平均成绩? ?例例3:3:某地区教育系统对其员工进行年度考核某地区教育系统对其员工进行年度考核, ,得出员工考核得出员工考核的平均分为的平均分为85,85,该地区某学校随机抽取了该地区某学校随机抽取了1010名员工的考核得名员工的考核得分为分为9595、9393、9090、8989、86

17、86、8282、7979、7575、7272、7070。该校员工。该校员工的考核的平均得分与全地区是否一致?的考核的平均得分与全地区是否一致?总体正态、标准差总体正态、标准差已知已知v解:解:1、提出假设、提出假设 H0: 1= 0 H1: 1 0 (H0: 1 =77 H1: 1 77)v 2、计算检验统计量的值计算检验统计量的值v 3、确定检验形式:双尾检验确定检验形式:双尾检验v 4、统计决断、统计决断 因为因为Z=3. 162.58,所以,所以,p0.01。因而拒绝虚无因而拒绝虚无假设,接受备择假设。其结论为:假设,接受备择假设。其结论为:该该实验教材与旧教实验教材与旧教材的效果材的效

18、果存在存在极其极其显著差异。显著差异。 16. 3 10577-82NXXZX Z-3-2-10123- 2 . 5 8+ 2 . 5 8 图 7 - 5 在 . 0 1 水 平 上 双 尾 检 验接受域接受域拒绝域拒绝域拒绝域拒绝域2 D G ra p h 8Z-3-2-10123- 1 . 9 6+ 1 . 9 6 图 7 - 4 在 . 0 5 水 平 上 双 尾 检 验 Z Z 与临界值的比较与临界值的比较P P值值检验结果检验结果Z Z1.961.96P P 0.050.05不显著不显著1.961.96 Z Z2.582.580.01P 0.01P 0.05 0.05 显著显著* *

19、Z Z 2.582.58P P 0.010.01极其显著极其显著* * *双侧双侧Z Z检验统计决断规则检验统计决断规则课堂练习题课堂练习题已知中学生的平均智商是已知中学生的平均智商是100100,标准差是标准差是1515。某某个中学的学生都服了一片个中学的学生都服了一片“IQIQ药片药片”。然后从该。然后从该校随机抽取了校随机抽取了2525名学生,对他们的智商进行测验,名学生,对他们的智商进行测验,结果他们的平均智商是结果他们的平均智商是105105。问,该。问,该“智商药片智商药片”有无作用?有无作用?总体正态标准差总体正态标准差未知且为小样本未知且为小样本v解:解:1、提出假设、提出假设

20、 H0: 1= 0 H1: 1 0 (H0: 1 =85 H1: 1 85)v 2、计算检验统计量的值计算检验统计量的值v 3、确定检验形式:双尾检验确定检验形式:双尾检验v 4、统计决断、统计决断 因为因为t t =0.68 0.05。因而接受因而接受虚无假设,拒绝备择假设。其结论为:该虚无假设,拒绝备择假设。其结论为:该该校员工考该校员工考核的平均得分与全地区间无核的平均得分与全地区间无显著差异。显著差异。 68. 0 1-108.419685-83.11nSXXtX t t 与临界值的比较与临界值的比较P P值值检验结果检验结果 t ttt(df)0.05(df)0.05P P 0.05

21、0.05不显著不显著t t(df)0.05(df)0.05 t t t t(df)0.01(df)0.01 0.01P 0.01 0 (H0: 1 72.5 H1: 1 72.5 )v 2、计算检验统计量的值计算检验统计量的值v 3、确定检验形式:单尾检验确定检验形式:单尾检验v 4、统计决断、统计决断 因为因为Z=2. 862.33,所以,所以,p0.01。因而拒绝虚无因而拒绝虚无假设,接受备择假设。其结论为:假设,接受备择假设。其结论为:该校今年的英语四该校今年的英语四级考试平均成绩极其显著高于全市的平均成绩。级考试平均成绩极其显著高于全市的平均成绩。 86. 2 5014.672.5-7

22、8.4nSXXZX Z Z 与临界值的比与临界值的比较较P P值值检验结果检验结果Z Z1.651.65P P 0.050.05不显著不显著1.651.65 Z Z2.332.33 0.01P 0.01 0.05。因而接受因而接受虚无假设,拒绝备择假设,即该地区六岁儿童男虚无假设,拒绝备择假设,即该地区六岁儿童男女身高差异不显著。女身高差异不显著。 )()(Z222121212221212121nnXXnnXXXX Z22212121nnXX总体正态、标准差已知时检验统计量的值总体正态、标准差已知时检验统计量的值课堂练习题课堂练习题在某次全国高校教学评估中,评估者在甲校随机在某次全国高校教学评

23、估中,评估者在甲校随机抽取了抽取了153153名学生,并进行大学生思想道德修养课名学生,并进行大学生思想道德修养课的测试,获得平均分为的测试,获得平均分为77.4177.41分,在乙校随机抽取分,在乙校随机抽取了了686686名考生,得到平均分为名考生,得到平均分为75.9575.95分,已知甲校分,已知甲校学生思想道德修养课得分的总标准差为学生思想道德修养课得分的总标准差为5.775.77分,分,乙校学生思想道德修养课得分的的总标准差为乙校学生思想道德修养课得分的的总标准差为5.175.17分,问甲乙两校思想道德修养课的教学效果分,问甲乙两校思想道德修养课的教学效果在该次评估中能否被评为同一

24、个等级?在该次评估中能否被评为同一个等级?P241总体正态、标准差未知且为大样本时总体正态、标准差未知且为大样本时检验统计量的值:检验统计量的值: Z22212121nSnSXX解:解:1、提出假设、提出假设 H0: 1= 2 H1: 1 2 2、计算检验统计量的值计算检验统计量的值 2.24 5215601873-80 Z2222212121nSnSXX 3、确定检验形式:双尾检验确定检验形式:双尾检验 4、统计决断、统计决断因为因为Z=2.24 1.96 ,所以,所以,p 0.05。因而拒绝虚无因而拒绝虚无假设,接受备择假设,即实验组与控制组的平均结果假设,接受备择假设,即实验组与控制组的

25、平均结果差异显著。差异显著。 总体总体正态正态标准差未知、小样本且样本方差齐性时标准差未知、小样本且样本方差齐性时检验统计量的值:检验统计量的值: )2n(df )(2t2121212122221121nnnnnnnSnSnXX个体的性别化倾向对其个性与行为具有重要影响。心理学个体的性别化倾向对其个性与行为具有重要影响。心理学家们将个体分为男性化、女性化与中性化三种类型。许多研家们将个体分为男性化、女性化与中性化三种类型。许多研究发现具有中性化的性别角色观念与行为方式的个体较其他究发现具有中性化的性别角色观念与行为方式的个体较其他两类个体能更好地应对压力。现有一项研究分别对近期经历两类个体能更

26、好地应对压力。现有一项研究分别对近期经历了一系列消极事件的具有传统性别倾向的个体和中性化个体了一系列消极事件的具有传统性别倾向的个体和中性化个体进行了抑郁测验,分别获得了进行了抑郁测验,分别获得了10个测验分数,统计分析后发个测验分数,统计分析后发现,中性化个体的现,中性化个体的M=63, SS=700, 男性化与女性化个体的男性化与女性化个体的M=71, SS=740, 问该研究能否验证中性化的个体较其他两类问该研究能否验证中性化的个体较其他两类个体能更好地应对压力的结论?个体能更好地应对压力的结论?课堂练习题课堂练习题P242P242ss 22max小大F方差齐性检方差齐性检验验总体标准差

27、未知、小样本且样本方差不齐性时总体标准差未知、小样本且样本方差不齐性时柯克兰柯克兰柯克斯检验柯克斯检验P242(了解)(了解)三、两相关样本平均数差异的假设检验三、两相关样本平均数差异的假设检验 P240总体正态、标准差已知时总体正态、标准差已知时检验统计量的值:检验统计量的值: 2Z21222121nrXX总体正态、标准差未知且为小样本时总体正态、标准差未知且为小样本时检验统计量的值:检验统计量的值:) 1(df 12t21222121nnSrSSSXX例:某学校领导想了解校内考评的效果,从全校例:某学校领导想了解校内考评的效果,从全校员工随机抽取了员工随机抽取了1010名员工的学期和学年考

28、核得分。名员工的学期和学年考核得分。结果发现他们在学期考核的平均得分为结果发现他们在学期考核的平均得分为79.579.5,标准,标准差为差为9.039.03,学年考核得分为,学年考核得分为83.183.1,标准差为,标准差为8.888.88,两次考核的相关系数为两次考核的相关系数为0.970.97,问校内员工学期与学,问校内员工学期与学年考核平均得分是否存在显著差异?年考核平均得分是否存在显著差异?总体正态、标准差未知且为大样本时总体正态、标准差未知且为大样本时检验统计量的值:检验统计量的值: 2Z21222121nSrSSSXX先计算两样本每对数据之差先计算两样本每对数据之差d ,而后求这些

29、差数平,而后求这些差数平均数均数 在总体平均数在总体平均数 为为0的抽样分布的抽样分布 中出现的中出现的位置位置 dd1nSddtdddP245P245当相关系数当相关系数r未知时:未知时:) 1(1ndfnSdtdnSdZd课堂练习题课堂练习题 一个一个n=10n=10的配对样本,实验组和对照组分别被的配对样本,实验组和对照组分别被施以两种教学方法,后期测验结果如下表所示,施以两种教学方法,后期测验结果如下表所示,试比较两种教学方法效果是否有显著差异?试比较两种教学方法效果是否有显著差异?配对配对12345678910实验组实验组 86 83 85 7874 9675959078对照组对照组

30、 83 83 85 8792 8688748597第五节第五节 假设检验的分类与两类错误假设检验的分类与两类错误一、一、假设检验的分类假设检验的分类v参数检验:利用样本信息对总体参数进行的假设检验。其参数检验:利用样本信息对总体参数进行的假设检验。其前提条件是总体呈正态分布、两个或多个总体方差齐性,前提条件是总体呈正态分布、两个或多个总体方差齐性,特别适用于等距或等比性质的资料。特别适用于等距或等比性质的资料。 常用的常用的Z检验、检验、t检验、检验、F检验均属于参数检验。检验均属于参数检验。v非参数检验:不对总体参数进行假设检验,对总体分布形非参数检验:不对总体参数进行假设检验,对总体分布形

31、态及方差是否齐性也无严格要求,特别适用于顺序和名义态及方差是否齐性也无严格要求,特别适用于顺序和名义性质的资料。它主要包括秩和检验、中位数检验、符号检性质的资料。它主要包括秩和检验、中位数检验、符号检验、符号等级检验、克验、符号等级检验、克瓦氏单向方差分析。瓦氏单向方差分析。v非参数检验比参数检验应用范围广,但其灵敏性和精确度非参数检验比参数检验应用范围广,但其灵敏性和精确度不如参数检验。不如参数检验。平平均均数数假假设设检检验验样本与总体平样本与总体平均数差异检验均数差异检验两样本平均数两样本平均数差异检验差异检验 已知已知 未知小样本未知小样本 未知大样本未知大样本独立样本独立样本相关样本

32、相关样本 已知已知 未知小样本未知小样本 未知大样本未知大样本方差齐性方差齐性方差不齐性方差不齐性r r已知已知r r未知未知 已知已知 未知小样本未知小样本 未知大样本未知大样本小样本小样本大样本大样本自学内容:自学内容:P247、P263思考练习题思考练习题名词解释名词解释:推论统计、非参检验、推论统计、非参检验、显著性水平、显著性水平、I型错误、型错误、II型错误型错误简述假设检验的基本原理简述假设检验的基本原理举例说明平均数显著性检验与平均数差异显著性检验的举例说明平均数显著性检验与平均数差异显著性检验的区别与联系。区别与联系。有人给你两组数据,让你帮助进行差异显著性检验,请有人给你两

33、组数据,让你帮助进行差异显著性检验,请写出你对解决上述问题的思考程序。写出你对解决上述问题的思考程序。一位组织管理心理学研究者对员工性别和工作满意度的关一位组织管理心理学研究者对员工性别和工作满意度的关系十分感兴趣,他想要知道在同一个企业文化环境和新酬标系十分感兴趣,他想要知道在同一个企业文化环境和新酬标准当中,男性员工和女性员工对工作的满意度是否有所不同?准当中,男性员工和女性员工对工作的满意度是否有所不同?他选用了一份工作满意度问卷,对一家企业中的他选用了一份工作满意度问卷,对一家企业中的1818名员工进名员工进行了测量,男女各半,所得结果如下:行了测量,男女各半,所得结果如下: 男性员工

34、得分:男性员工得分:6767、7373、7474、7070、7070、7575、7373、6868、6969 女性员工得分:女性员工得分:6969、6363、6767、6464、6161、6666、6060、6363、63 63 一位心理学家宣称依赖性强的孩子在某项创造力测验一位心理学家宣称依赖性强的孩子在某项创造力测验上的得分为上的得分为6262,一位社会工作者认为依赖性强的孩子,一位社会工作者认为依赖性强的孩子的创造力测验得分还要低。他选取了的创造力测验得分还要低。他选取了2424个依赖性强的个依赖性强的孩子进行一个创造力测验,结果样本平均数为孩子进行一个创造力测验,结果样本平均数为545

35、4,样,样本离差平方和为本离差平方和为54005400。问是否应该否定此心理学家的。问是否应该否定此心理学家的看法?看法? 根据上一题进行区间估计,看依赖性强的孩子在某项根据上一题进行区间估计,看依赖性强的孩子在某项创造力测验上的平均分应该在什么区间(创造力测验上的平均分应该在什么区间( =0.05=0.05)?)?某学校某班进行物理教学改革的实验,班级学生数为某学校某班进行物理教学改革的实验,班级学生数为3232人,并在实验前后进行两次物理考试,对所获得的人,并在实验前后进行两次物理考试,对所获得的数据处理后,得到如下结果:实验前这数据处理后,得到如下结果:实验前这3232名学生的物名学生的

36、物理考试平均分数为理考试平均分数为4444分,标准差为分,标准差为13.913.9,实验后这,实验后这3232名学生的物理考试平均分为名学生的物理考试平均分为46.646.6分,标准差为分,标准差为1414,两,两次测验的相关系数为次测验的相关系数为0.880.88。问:进行物理教学改革实。问:进行物理教学改革实验后,该班的物理成绩有没有显著变化?验后,该班的物理成绩有没有显著变化?张老师是一名刚参加工作的青年物理教师,在某中学张老师是一名刚参加工作的青年物理教师,在某中学负责讲授高中一年级(负责讲授高中一年级(5 5)班的物理课,期末全校物理)班的物理课,期末全校物理统一考试,高一统一考试,

37、高一5 5个班的物理平均分为个班的物理平均分为5050分,标准差为分,标准差为1010分,其中(分,其中(5 5)班有)班有4141名同学,物理平均分为名同学,物理平均分为47.547.5分,分,根据考试结果:根据考试结果:5047.55047.5,学校领导认为张老师的教学,学校领导认为张老师的教学效果低于学校的平均水平,而张老师不同意学校的看效果低于学校的平均水平,而张老师不同意学校的看法,问题:怎样科学评价张老师的教学效果?法,问题:怎样科学评价张老师的教学效果?两种学习方法下的学习效果的比较两种学习方法下的学习效果的比较AB0 04 41 13 33 36 61 13 30 04 41X

38、4X三种学习方法下的学习效果的比较三种学习方法下的学习效果的比较ABC 0 04 41 11 13 32 23 36 62 21 13 30 00 04 40 01X4X1X2Xt如果对三个样本平均数两两进行比较,就需要比较如果对三个样本平均数两两进行比较,就需要比较3 3次,这样一方面较为烦琐,另一方面会大大降低检验次,这样一方面较为烦琐,另一方面会大大降低检验结果的可靠性。因为每一次检验都会存在误差,假定结果的可靠性。因为每一次检验都会存在误差,假定每一次检验正确概率为每一次检验正确概率为0.950.95,则,则3 3次检验的正确概率降次检验的正确概率降低为低为0.950.953=3=0.

39、8570.857,犯错误的概率为,犯错误的概率为1-0.857=0.1431-0.857=0.143。因此因此, ,我们通常不采用我们通常不采用Z Z 检验或检验或t t检验的方法,而采用检验的方法,而采用另外一种更为综合的检验方法。另外一种更为综合的检验方法。第六节第六节 方差分析(方差分析(Analysis of Variance: ANOVAAnalysis of Variance: ANOVA)一、一、定义:定义:是是同时同时对对多个多个样本的总体平均数进行样本的总体平均数进行显著性检验的方法。显著性检验的方法。 由英国统计学家由英国统计学家R.A.FisherR.A.Fisher于于

40、19231923年提出。年提出。变异(变异(variancevariance)组间变异组间变异组内变异(个体差异组内变异(个体差异+ +随机误差)随机误差)如果组间变异越大,组内变异越小,就越能说明三种学习方法效如果组间变异越大,组内变异越小,就越能说明三种学习方法效用的不同。用的不同。三种学习方法下的学习效果的比较三种学习方法下的学习效果的比较ABC 0 04 41 11 13 32 23 36 62 21 13 30 00 04 40 01X4X1X2Xt二、基本原理二、基本原理将研究数据的总变异分解为组间变异和组内变异,并通将研究数据的总变异分解为组间变异和组内变异,并通过组间变异与组内

41、变异的比值的大小来推断多个样本平均过组间变异与组内变异的比值的大小来推断多个样本平均数差异的显著性。比值越大,则各组平均数的差异就越明数差异的显著性。比值越大,则各组平均数的差异就越明显。显。由于我们常用方差表示数据的变异程度,所以,同时对由于我们常用方差表示数据的变异程度,所以,同时对多个样本平均数差异进行显著性检验的统计量是多个样本平均数差异进行显著性检验的统计量是F F值。如果值。如果计算出的计算出的F F值大于等于所需要的值大于等于所需要的F F的临界值,就拒绝虚无假的临界值,就拒绝虚无假设,接受备择假设。设,接受备择假设。 三、方差分析中的几个概念三、方差分析中的几个概念因素因素:实

42、验的自变量。:实验的自变量。单因素、二因素、多因素单因素、二因素、多因素水平水平:某一因素的不同情况。:某一因素的不同情况。处理处理:由因素与水平构成的各种组合情况。:由因素与水平构成的各种组合情况。2 2 2 22 2 3 3教材教材A教材教材B教法教法A7090教法教法B9070方差分析中的几个概念方差分析中的几个概念例如例如: :为了比较三种教学方法是否有显著差异,为了比较三种教学方法是否有显著差异,将将2727名学生分成三组,每组名学生分成三组,每组9 9人,对每组学生人,对每组学生分别施以分别施以A A、B B、C C三种不同的教法。三种不同的教法。完全随机设计的方差分析完全随机设计

43、的方差分析(多独立样本)(多独立样本)随机区组设计的方差分析随机区组设计的方差分析(多相关样本)(多相关样本)区组区组:相关样本中的每组被试:相关样本中的每组被试处处 理理12k区组区组1X11X12X1k2X21X22X2knXn1Xn2Xnk单因变量方差分析 ANOVAOne-Way ANOVA(单因素)Two-Way ANOVA (二因素)多因变量方差分析MANOVA 从从5所幼儿园(模范园、一级园、二级所幼儿园(模范园、一级园、二级园、三级园、四级园)大班各随机抽取园、三级园、四级园)大班各随机抽取3名儿童,进行数推理测验,结果如下,名儿童,进行数推理测验,结果如下,问问5所幼儿园测验

44、成绩有无显著性差异?所幼儿园测验成绩有无显著性差异? 序号序号 A B C D E1 76 78 86 83 732 73 81 84 82 743 70 81 85 87 78四、方差分析中的符号四、方差分析中的符号nK=处理条件或组数nn或nj =每一个组的被试数nN=总被试数所有组数据求和或各组数据求和或总平均分各组的平均分或各组的每一个原始得分或kjniniTjijXXXXXXXXX111方差分析的符号方差分析的符号三种学习方法下的学习效果的比较三种学习方法下的学习效果的比较ABC 0 04 41 11 13 32 23 36 62 21 13 30 00 04 40 01X4X1X2

45、Xt五、五、F F值的计算值的计算 (一)单因素完全随机设计(一)单因素完全随机设计 ttXXXXXX nitnitXXXXXX 2121)(nitnitXXXXXX 211211)(kjnitkjnitXXXXXX kjnitkjnikjnittkjnitkjnitXXXXXXXXXXXXXXXXXX11221111222112112)(kjnitkjnikjnitXXXXXX112211211)(总离差平方和总离差平方和 = = 组内离差平方和组内离差平方和 + + 组间离差平方和组间离差平方和SSSST T = SS= SSW W +SS+SSB B组内方差无偏估计量组间方差无偏估计量组

46、内变异组间变异FdfSSnXXSn1221WWWBBBMSdfSSMSdfSS组内方差无偏估计量组间方差无偏估计量WBWWBBMSMSdfSSdfSSFnkXnXXXSSkjnikjnikjniTB211121211kjnikjnikjniWnXXXXSS1211122111 kdfBkNnkdfw) 1(1NdfdfdfWBTSSSST T= SS= SSB B + SS + SSW WnkXXXXSSkjnikjnikjniTT211112211三种学习方法下的学习效果的比较三种学习方法下的学习效果的比较ABC 0 04 41 11 13 32 23 36 62 21 13 30 00 0

47、4 40 01X4X1X2Xt方差分析的步骤方差分析的步骤1. 提出假设提出假设 单因素:单因素: H0: 1= 2 = 3 H1:至少两个平均数间存在显著差异至少两个平均数间存在显著差异 2. 计算检验统计量的值:计算检验统计量的值:F3. 统计决断统计决断4. 列出方差分析表列出方差分析表 变异来源变异来源平方和平方和自由度自由度均均 方方F 值值组间组间组内组内总变异总变异单因素完全随机设计的方差分析表单因素完全随机设计的方差分析表P305例题:我们要对例题:我们要对3 3所学校的英语教学质量进行调查,所学校的英语教学质量进行调查,每所学校抽取每所学校抽取4 4名同学进行英语统考,不同学

48、校的统名同学进行英语统考,不同学校的统考成绩如下表所示,问考成绩如下表所示,问3 3所学校教学质量是否存在显所学校教学质量是否存在显著差异?著差异?ABC2 210109 93 37 711113 39 910104 46 61010(二)单因素随机区组设计(二)单因素随机区组设计总变异SST组间变异SSB组内变异SSW个体差异SSR(区组)随机误差SSE处处 理理12k1X11X12X1k2X21X22X2k nXn1Xn2Xnk区区组组EBMSMSF ERBWBTdfdfdfdfdfdfERBWBTSSSSSSSSSSSSWBMSMSF nkXnXSSkjnikjniB211121kjni

49、kjniWnXXSS121112nkRkRRRSSnjkinjkinjkiTR211121112RWESSSSSS1 kdfBkNnkdfw) 1(1 ndfRRWEdfdfdfP287例:被试例:被试A、B、C、D进行问题解决的练习,对被试分别测进行问题解决的练习,对被试分别测量了练习量了练习1次、次、2次、次、3次后的成绩得分,试分析练习次数对次后的成绩得分,试分析练习次数对问题解决成绩有无显著的影响。问题解决成绩有无显著的影响。 被试被试练习次数练习次数1次次2次次3次次A336B222C114D246 变异来源变异来源平方和平方和自由度自由度均均 方方F 值值组间组间14277区组区组

50、误差误差12636414总变异总变异3211单因素随机区组设计的方差分析表单因素随机区组设计的方差分析表P295A A1 1A A2 2A A2 2-A-A1 1平均平均B B1 14704704724722 2471471B B2 24804805125123232496496B B2 2-B-B1 1101040402525平均平均4754754924921717n主效应主效应( (main effect)main effect)(三)二因素完全随机设计(三)二因素完全随机设计A A1 1A A2 2A A2 2-A-A1 1平均平均B B1 14704704724722 2471471B

51、 B2 24804805125123232496496B B2 2-B-B1 1101040402525平均平均4754754924921717n简单效应简单效应( (simple effect)simple effect) A A1 1A A2 2A A2 2-A-A1 1平均平均B B1 14704704724722 2471471B B2 24804805125123232496496B B2 2-B-B1 1101040402525平均平均4754754924921717交互作用交互作用 ( (interaction effect)interaction effect)变异来源变异来源

52、平方和平方和自由度自由度均均 方方F 值值A因素因素SSAdfAMSAFA=MSA/MSWB因素因素SSBdfBMSBFB=MSB/MSW交互作用交互作用SSABdfABMSAB FAB=MSAB/MSW组内组内(误误 差差)SSWdfWMSW总变异总变异SSTdfT总平方和与总自由度的分解总平方和与总自由度的分解SST=SSA+SSB+SSAB+SSW dfT=dfA+dfB+dfAB+dfW P392P392 变异来源变异来源平方和平方和自由度自由度均均 方方F 值值组间组间ABA B组内组内总变异总变异二因素完全随机设计的方差分析表二因素完全随机设计的方差分析表完全随机设计的二因素方差分

53、析简单效应分析完全随机设计的二因素方差分析简单效应分析交互作用显著表明某一因素不同水平均值的差异在交互作用显著表明某一因素不同水平均值的差异在另一个因素的各个水平上有不同的表现。另一个因素的各个水平上有不同的表现。在在A1水平上,水平上,B1与与B2均值差异的均值差异的F检验检验在在A2水平上,水平上,B1与与B2均值差异的均值差异的F检检或者或者在在B1水平上,水平上,A1与与A2均值差异的均值差异的F检验检验在在B2水平上,水平上,A1与与A2均值差异的均值差异的F检检 简单效应的检验和独立的单因素方差分析过程是有简单效应的检验和独立的单因素方差分析过程是有区别的,处理内的变异以及自由度将

54、仍然采用包含区别的,处理内的变异以及自由度将仍然采用包含二因素方差分析中所有处理方式的结果,而不是根二因素方差分析中所有处理方式的结果,而不是根据所选取的处理组进行重新计算。据所选取的处理组进行重新计算。若交互作用显著,若交互作用显著, 不需要对主效应进行分析;若交不需要对主效应进行分析;若交互作用不显著,则需要对主效应进行分析。互作用不显著,则需要对主效应进行分析。二因素方差分析假设的提出二因素方差分析假设的提出 A因素因素: H0:Ua1=ua2 H1:Ua1ua2 B因素因素: H0:Ub1=ub2 H1:Ub1ub2A、B因素交互作用:因素交互作用: H0: A因素与因素与B因素交互作

55、用不显著因素交互作用不显著 H1: A因素与因素与B因素交互作用显著因素交互作用显著 六、事后检验(六、事后检验(post hoc testpost hoc test) 事后多重比较事后多重比较 ( (multiple comparisons)multiple comparisons) 为什么要进行事后检验?为什么要进行事后检验? F值显著或极显著,表明各试验处理组的平均数中至少有值显著或极显著,表明各试验处理组的平均数中至少有一对平均数存在显著差异。但究竟是一对还是多对,如果是一对平均数存在显著差异。但究竟是一对还是多对,如果是一对的话,又是哪一对平均数间存在差异,方差分析并没有一对的话,又是哪一对平均数间存在差异,方差分析并没有回答,因而,有必要进行两两处理平均数间的比较,即事后回答,因而,有必

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论