考研学习笔记 《现代心理与教育统计学》(第4版)笔记和课后习题(含考研真题)详解-242-482_第1页
考研学习笔记 《现代心理与教育统计学》(第4版)笔记和课后习题(含考研真题)详解-242-482_第2页
考研学习笔记 《现代心理与教育统计学》(第4版)笔记和课后习题(含考研真题)详解-242-482_第3页
考研学习笔记 《现代心理与教育统计学》(第4版)笔记和课后习题(含考研真题)详解-242-482_第4页
考研学习笔记 《现代心理与教育统计学》(第4版)笔记和课后习题(含考研真题)详解-242-482_第5页
已阅读5页,还剩428页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

b.当总体方差未知时,用样本的无偏估计量即方差s²,计算如果计算的是样本的有偏估计方差,则确定α=0.05或0.01的横坐标值。一般当总体方差已知时,查正态表;当样本方差未知时,查t值表(当n>30时,也可查正态表作近似计算)确定z:与。b.如果查t值表,置信区间则写作:4.某测验共6道题,50名被试在该测验的各题得分的方差是,0.75,0.81,0.79,0.83,0.85,0.77。被试总分的方差是16.00。(1)求该测验α系数(2)某被试的总分是65,估计其真分数95%的置信区间。[统考2017研]答:(1)已知α系数的计算公式为(2)已知α=0.84,也就是,E=实3,被试总分方差为16,则S=4;95%的置信区间为[65-1.96SE,65+1.96SE],代入数据得[61.864,68.136]。8.1复习笔记本章重点ü假设检验的一般原理ü平均数的显著性检验ü平均数差异显著性检验ü方差、标准差差异的检验ü各类相关系数的检验ü比率的显著性检验等假设检验方法与步骤。在统计学中,通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异,这种推论过程称作假设检验(hypothesistesting)。假设检验是推论统计中最重要的内容,它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设。假设检验包括参数检验和非参数检验。若进行假设检验时总体的分布形式已知,需要对总体的未知参数进行假设检验,称其为参数假设检验(parametrictest);若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称之为非参数假设检验(non-parametrictest)。一、假设检验的原理(一)假设与假设检验1.假设是科学研究中广泛应用的方法,它是根据已知理论与事实对研究对象所做的假定性说明。统计学中的假设一般专指用统计学术语对总体参数所做的假定性说明。2.在进行任何一项研究时,都需要根据已有的理论和经验事先对研究结果做出一种预想的希望证实的假设。这种假设称为科学假设,用统计术语表示时称为研究假设,记3.在统计学中不能对A的真实性直接检验,需要建立与之对立的假设,称作虚无假设(nullhypothesis),或称为无差假设、零假设、原假设,记为H。。在假设检验中H总是作为直接被检验的假设,而R与H对立,二者择一,因而A₁有时又称为对立假设或备择假设(alternativehypotheses),它的意思是一旦有充分理由否定虚无假设Ho,则H₁这个假设备你选择。假设检验的问题,就是要判断虚无假设H₀是否正确,决定接受还是拒绝(reject)虚无假设H₀。若拒绝虚无假设Ho,则接受备择假设H₁。运用统计方法若证明H₀为真,则H₁为假;反之H₀为假,则H₁为真。虚无假设与备择假设互相排斥并且只有一个正确。因而虚无假设是统计推论的出发点。虚无假设常常是根据历史资料,或根据周密考虑后确定的,若没有充分的依据,虚无假设是不会被轻易否定。著名统计学家费舍曾指出:“可以说,每一实验的存在,仅仅是为了给事实一个反驳虚无假设的机会。”(二)假设检验中的小概率原理1.假设检验的基本思想是概率性质的反证法。为了检验虚无假设,首先假定虚无假设为真。在虚无假设为真的前提下,如果导致违反逻辑或违背人们常识和经验的不合理现象出现,则表明“虚无假设为真”的假定是不正确的,也就不能接受虚无假设。若没有导致不合理现象出现,那就认为“虚无假设为真”的假定是正确的,也就是说要接受2.假设检验中的“反证法”思想不同于纯数学中的反证法,后者是在假设某一条件下导致逻辑上的矛盾从而否定原来的假设条件。假设检验中的“不合理现象”是指小概率事件在一次试验中发生了,它是基于人们在实践中广泛采用的小概率事件原理,该原理认为“小概率事件在一次试验中几乎是不可能发生的”。假设推断的依据就是小概率事件原理。通常情况下,将概率不超过0.05的事件当作“小概率事件”,有时也定为概率不超过0.01或者0.001。(三)假设检验中的两类错误1.I型错误与Ⅱ型错误总体的真实情况往往是未知的,根据样本推断总体,有可能犯两类错误:(1)虚无假设H₀本来是正确的,但拒绝了H₀,这类错误称为弃真错误,即I型错误(typeIerror),又称。错误。(2)虚无假设H₀本来不正确但却接受了H₀,这类错误称为取伪错误,即Ⅱ型错误(typeⅡerror),又称错误。假设检验的各种可能结果如表8-1所示。表8-1假设检验的各种可能结果正确概率1-α弃真概率a(I型错误)取伪错误β(第二类错误)(3)一个好的检验应该在样本容量n一定的情况下,使犯这两类错误的概率α和8都尽可能小,但a不能定得过低,否则会使e大为增加。在实际问题中,一般总是控制犯I型错误的概率α,使H₀成立时犯I型错误的概率不超过。。在这种原则下的统计假设检验问题称为显著性检验(significancetest),将犯I型错误的概率。称为假设检验的显由此看来,无论是拒绝还是接受H₀,都有犯错误的可能,但只要把犯错误的概率规定在统计学上所允许的范围之内,所做的统计判断或结论即成立。(4)经过检验,如果所得差异超过了统计学规定的某一误差限度,则表明这个差异已不属于抽样误差,而是总体上确有差异,这种情况称为差异显著(significantdifference),或者说差异具有统计学意义。反之,若所得差异未达到规定限度,说明该差异主要来源于抽样误差,这时称之为差异不显著。具体而言,若样本统计值与相应总体已知参数差异显著,意味着该样本已基本不属于已知总体;若两个样本统计值的差异显著,则意味各自代表的两个总体的参数之间确实存在差异。需要注意的是假(5)I类错误的症结可能在于样本数据自身的误导性,即样本中包含的某些极端数据与总体有很大差异;也可能是由于研究者所采用的决策标准过于宽松。在大多数研究情境中,犯I类错误的结果是十分严重的。(6)Ⅱ类错误常常是由于实验设计不够灵敏,样本数据的变异性过大,或是处理效应本身比较小。虽然处理对样本产生了作用,但是样本均值并没有落在临界区域内,样本不能够有效地与原先的总体加以区分,也就不能拒绝虚无假设。与I类错误不同的是,Ⅱ类错误无法由一个准确的概率值来衡量,它的概率依赖于许多因素,需要用函2.两类错误的关系(1)α+8不一定等于1a与是在两个前提下的概率。α是拒绝H₀时犯错误的概率(这时前提是“H₀为真”);B是接受H₀时犯错误的概率(这时“H₀为假”是前提),所以α+8不一定等于1。(2)在其他条件不变的情况下,a与不可能同时减小或增大。样本容量增大,a和其他条件不变的情况下,会变小。(3)统计检验力统计检验力,又称假设检验的效力,是指该检验能够正确地拒绝一个错误的虚无假设的概率,因此效力可以表示为1-β。换句话说,效力也反映了假设检验能够正确侦察到真实的处理效应的能力。检验的效力越高,侦察能力越强。影响统计检验力的因素:①处理效应大小,处理效应越明显,越容易被侦查到,假设检验的效力也就越大。②显著性标准,显著性标准越高,假设检验的效力也就越大。③检验的方向性,单侧检验侦察处理效应的能力高于双侧检验。④样本容量,样本容量越大,标准误越小,样本均值分布越集中,统计效力越高。(四)单侧检验与双侧检验1.双侧检验当只关心和么是否有差异,而不关心到底A与么哪个更大,即只强调差异而不强调方向性的检验称为双侧检验(two-sidedtest或者two-tailedtest)。通常所做的假设为:μ<Ao-Za120%/√n拒绝域为和这时在么两侧都需一个临界点,临界点以外的区域为A的拒绝区。如果显著性水平α定为0.05则两端拒绝区的面积比率各为0.025(见图8-1)。图8-1双侧检验示意图2.单侧检验当不仅关心A和4是否有差异,而且关心到底A与哪个更大,即不仅强调差异性而且强调方向性的检验称为单侧检验(one-sidedtest,或者one-tailed通常所做的假设为:μ>A+Zo₀/√n(右侧检验),或者μ<Ho-Zo₀/√n(左侧检验)图8-2单侧检验示意图3.单侧检验与双侧检验的区分(1)问题的提法不同。双侧检验的提法是:和已知常数么是否有显著性差异?单侧检验的提法是:A是否显著高于已知常数么或A是否显著地低于已知常数4?(2)建立假设的形式不同。双侧检验的原假设和备择假设为:::画,:熟。单侧检验的原假设和备择假设为::≤A,>,或≥m,:。(3)拒绝域不同。单侧检验的拒绝域为μ>A+Zo₀/√(右侧检验)或者μ<H-Zo₀/√n(左侧检验)(五)假设检验的步骤一个完整的假设检验过程和具体分析步骤,包括以下五个方面的内容:1.根据问题要求,提出虚无假设H和备择假设R。2.选择适当的检验统计量。3.规定显著性水平a。在假设检验中有可能会犯错误。如果虚无假设正确却把它当成错误的加以拒绝,犯这类错误的概率用。表示,α就是假设检验中的显著性水平。显著性水乎确定以后,拒绝域也随之而定,而且对于不同的假设形式,拒绝域是不同的。通常显著性水平为0.05,较严格也可以用0.01或者更小。4.计算检验统计量的值。根据样本资料计算出检验统计量的具体值。5.做出决策。根据显著性水平。和统计量的分布,查相应的统计表,查找接受域和拒绝域的临界值,用计算出的统计量的具体值与临界值相比较,做出接受虚无假设或拒绝虚无假设的决策。另外,在假设检验中需要注意的是,在处理调查或实验数据时,经常讨论的有关两个平均数、两个比率、两个方差、两个相关系数这些统计值之间的差异问题,一般分为两种情况:样本统计量与相应总体参数的差异;两个样本统计量之间的差异。二、平均数的显著性检验平均数的显著性检验是指对样本平均数与总体平均数之间差异进行的显著性检验。若检验的结果差异显著,表明样本平均数的总平均(即A)与总体平均数4有差异,或者说样本平均数与总体平均数么的差异已不能认为完全是抽样误差了,x可以认为来自另一个总体。这时,对于这个样本平均数x简称为“显著”。根据总体分布的形态及总体方差是否已知,其具体检验过程分为下面几种情况。(一)总体正态分布、总体方差已知当总体正态分布、总体方差已知时,样本平均数的分布为正态分布,需要检验的统计量为(公式8.1)其中(criticalratio)临界比率的意义与标准分数Z相似,这种检验方法被称为Z检验。(二)总体正态分布、总体方差未知总体正态分布、总体方差未知时,样本平均数的分布为t分布,因此称为t检验,计算标准误时,由于总体方差c未知,要用其无偏估计量:来代替,需要检验的统计量为其中(三)总体非正态分布在心理和教育领域中,大部分连续变量在总体上都可以看成正态分布,所以前面介绍Z检验、t检验时并没有对总体是否正态分布做严格检验。如果有理由认为某一变量的总体分布不是正态,原则上是不能进行Z检验或t检验的,应该进行非参数检验。有时也可以对原始数据进行对数转换或其他转换,使非正态数据转化为正态形式,然后再作Z检验或t检验。但是如果样本容量较大,也可以近似的应Z检验。中心极限定理指出:从平均数4、标准差o的总体(无论正态与否)中随机抽样,样本平均数x的分布将随着样本容量的增大而趋于正态分布,且一般认为当n≥30(也有认为n≥50)时,尽管总体分布非正态,对于平均数的显著性检验仍可以用Z检验。(当然,这时的Z检验是近似的、故以Z′表示)即:当总体标准差c未知时,由于样本容量较大,可以直接用样本标准差:代替上式中的(公式8.3)当总体非正态分布,n<30时,不符合近似Z检验的条件。严格讲此时也不符合t检验的条件,因为t检验一定要以总体正态分布为前提。所以不能一遇到小样本就进行t检验。这时的检验只能用非参数方法或对数据进行转换。不同条件下总体平均数的假设检验的计算方法,见表8-2:表8-2总体平均数的假设检验表已知条件自由度H₀的拒绝域总体方差已知;正态总体,或非总体方差未知;正态总体,或非三、平均数差异的显著性检验平均数差异的显著性检验,就是对两个样本平均数之间差异的检验。这种检验的目的在于由样本平均数之间的差异(X₁-R₂)来检验各自代表的两个总体之间的差异(A-A)。这时需要考虑的条件更复杂些,不但要考虑总体分布和总体方差,还需要注意两个总体方差是否一致、两个样本是否相关以及两个样本容量是否相同等一系列条件。不同条件下须用不同的公式,不能用错,这是在实际应用中特别要引起重视的问题。(一)两个总体都是正态分布、两个总体方差都已知再从第二个总体(,子)中抽取一个样本算出x,两个样本平均数之间的差异记为Dx=x₁-x₂。若两个总体都是正态分布,则Dx的分布仍为正态。设Dx的总体平均为“Dx,很容易证明”Dg=H1-H2。这时对两个样本平均数差异(R-R:)的显著性检验实际上就是对Dx与差异的检验。将Dx与前一节中的x相类比,则x₁-x₂之间差异显著性检验可以转化为对一个统计量D的显著性检验,二者在本质上没有区别。只是根据不同的具体条件,x样本分布的标准误公式有所不同。1.独立样本的平均数差异检验方差的一个重要性质是当两个变量相互独立时,其和(或差)的方差等于各自方差的因此x与独立时,(Y₁-R₂)的方差(这里实际上是标准误的平方)应等于各自分布的则(公式8.5a)(公式8.5b)2.相关样本的平均数差异检验相关样本,这里的意思是指两个样本的数据之间存在一一对应的关系,如同一组被试在前后两次实验或调查中的两个项目相同,这时前后两次结果则相互影响,而不独立,就可视它们为相关样本。此时,当两个变量之间相关系数为-时,两变量差的方差为:式中r即变量X与Y的相关系数。因此,同样可以得到:(公式8.6)不难看到,当r-时上式即公式8.5a,所有独立样本实际上是相关样本的特例。相关样本的Z检验仍然是:(二)两总体都是正态分布、两总体方差都未知当总体正态分布、总体方差未知时,要用t检验来检验差异。这里由于两个总体方差未知,都需要用样本方差来估计,因而这时进行t检验需要考虑的条件更多,不但应该区分独立样本与相关样本,还需要考虑两个未知的总体方差是否相等,以及两个样本容量是否相同等一些条件。1.独立样本的平均数差异检验(1)两个总体方差一致或相等(方差齐性),即o²+o²=o2此时,两个样本平均数差数分布的标准误:(公式8.7)由于。未知,需要用它的无偏估计量s²-1和s²-1,分别为各自总体方差的无偏估计,也都可以作为。的无偏估计。那么用哪一个更好呢,显然将两个合并起来共同估计。最好。为此应该求S-1与S-的加权平均:称为联合方差,它是。此时最好的估计值。由于因此这时(公式8.8)(公式8.9)(公式8.10)f=}(2)两个总体方差不齐性且未知时,平均数差异的检验问题是统计学中的一个著名问题,称为贝赫兰斯-费希尔(Behrens-Fisher)问题。此时,求两个样本的联合方差即失去意义。当用两个样本方差作为它们的无偏估计时,即(公式8.11)分布不再是t分布,也不是正态分布。需要采用下面两种近似的检验方法。①阿斯平-威尔士(Aspin-welch)检验统计检验量(公式8.12)统计检验量近似地服从自由度为a的:分布,从而可以根据给定的显著性水平a及自由度②柯克兰-柯克斯t检验(Cochran-Coxt-test)。(公式8.13)r的分布只是近似的:分布,因而不能将t分布表中-吗-3的临界值作为:的临界值。r的临界值要用下面的公式计算。(公式8.14)的自由度嗽=-对应的临界值;为:分布中在a水平下与样本2的自由度粥=m,-对应若实际得到的r>:。则认为两个平均数在a水平差异显著。计算临界值的公式也变为:这时计算r值的公式与前面方差齐性时计算:值的公式相同,而且计算临界值2的公式也分布、总体方差未知且不等时,只要-n.仍然可以近似的应用-条件下的:检验(只需将自由度从2n-2变为n-1)。这实际上表明,当两总体方差不一致时,安排=m可以起一定的校正作用,所以在研究中应充分重视取样时-的优越性。2.相关样本的平均数差异检验(1)相关系数未知用a表示每一对对应数据之差,即--M,其中x和x₂表示分别取自样本1和样本2的第i对数据。显然n个d值的平均为:(公式8.15)(公式8.16)当→时,d值的分布是正态,这时a可以看做从a值总体中抽取的一个样本平均数,因而a的样本分布也是正态,其总平均:H=M-H标准误(公式8.17a)(公式8.17b)在这种情况下对a的显著性检验实际上即对-的显著性检验。由于a是样本得到的方差,故用t检验。(2)相关系数已知(公式8.18)(公式8.19)相关样本的t检验一般不需要事先进行方差齐性检验。因为相关样本是成对数据,即两组数据存在对应关系,这样可以求出对应数据的差(a),把对(₁-X₂)的显著性检验转化为对a的显著性检验。因此,不需要²-前提假设的检验。而独立样本的数据并不成对,即使-n时两组数据也不存在对应关系,因而不可能有对应值的差(a),只能以两个样本方差共同对总体方差进行估计(即求联合方差),必须有f-的前提。(三)两个总体非正态分布当总体分布非正态时,可以取大样本(n>30或n>50)进行Z′检验。这种方法同样适用于两个总体非正态分布的平均数差异检验。就是说,当两个样本容量都大于30(或都大于50时)也可以用Z'检验。1.独立样本的平均数差异检验(公式8.20)(公式8.21)公式8.21是在总体方差未知时以样本方差代替各自的总体方差。2.相关样本的平均数差异检验(公式8.22)(公式8.23)(四)平均数差异的显著性检验的小结对两个平均数差异的显著性检验,需要考虑总体分布、总体方差、样本是否相关等多种具体条件,选用不同的计算公式。另外,还需要考虑实验设计类型,查看实验产生的结果是否适合用两个平均数差异的显著性检验方法。因为,不同的实验目的和条件要求,不同的被试分组方式形成了不同的实验设计类型。不同的实验设计类型产生的研究数据,所用的统计分析方法也有所区别。在平均数之间的差异假设检验中,因为要检验的仅仅只是两组统计量,处理的数据基本上是双组实验设计(独立组、相关组、配对组、实验组、控制组、对照组,等等)产生的数据。在常见的双组实验设计类型中,像单组前测后测设计(只有一个实验组的前测与后测设计),双组设计中的后测设计(只有后测的实验组与控制组设计)、前测后测设计(有前测后测的实验组与控制组设计)、独立组设计(组间设计)、相关组设计(组内设计)、配对组设计,这类实验设计产生的数据,根据实验设计的具体情况,都可以选用前面讲述的Z检验或t检验方法去处理。表8-3是对平均数差异显著性检验的一个小结。表8-3平均数差异的显著性检验小结ZZ未知=₂t(df=n十n₂-2)非正态分布独立、n₂与n₂都大于30(或50)相关、n>30(或50)独立、n与n₂都大于30(或50)相关、n>30(或50)(一)样本方差与总体方差的差异检验当从正态分布的总体中随机抽取容量为的样本时,其样本方差与总体方差比值的分布(公式8.24)进行样本方差:与总体方差。的差异显著性检验,只需算出值,然后根据自由度-n-1分别从表中查到xi-a2)和L,定显著性水平为。,则当x²>xa2或x²<xia₃时与差异(二)两个样本方差之间的差异显著性检验1.独立样本(1)设总体一的方差为o²,总体二的方差为。若o²=c贝,、当、未知时,以各自的无偏估计值和代替,那么应该在1的附近波动。如果这个比值过大或过小则意味着c=c的假设应当推翻,即两个总体方差不等。由服从F分布,即(公式8.25)当Fo-a2)<F<Fa₂时,说明两方差差异不显著(显著性水平为α);当F<Fo或F>F时,两方差的差异显著。通常求F值时将较大的样本方差放在分子,较小的样本方差放在分母,即上式中s²理论上还是s²,但实际上当与n相差不大时,可以用s₂代替s²-1。这样算出的F值总要大于或等于1,尽管是双侧检验,但临界点只需右端一个即可。(2)在进行独立样本平均数差异的:检验时,有个前提条件?-,而与。均未知,因此在检验之前需要通过对样本方差的差异检验来证明。²是否成立,一般称此过程为方差齐性检验(testforhomogeneityofvariance)。(3)根据拇指原则:对于小样本(n<10),如果F值在4以上,即一个样本方差比另一个大4倍以上,就不满足方差齐性假设了。对于大一些的大样本,如果一个样本方差比另一个大2倍以上,即F大于2的时候,多半就会违反方差齐性的前提。2.相关样本两个样本相关时,对其方差的差异检验需要按(公式8.26)式中,与分别为两个样本方差;,为两个样本之间的相关系数;为样本容量。因此需要对标准差进行参数估计时,一般都转换成方差的参数估计。的比较;另一种情况是通过比较两个样本的差异(n-)推论各自的总体A和P是否有差异。(一)积差相关系数的显著性检验在实际研究中得到一个具体的相关系数值时,这个值可能说明两列变量之间在总体上是相关的(p=0),但这种相关也许是偶然情况,总体上可能并无相关(e-0)。所以需要对这个值进行显著性检验,这时仍然可以用t检验的方法。H₀:p=0H₁:p≠0(公式8.27)如果,则说明所得到的r值具有偶然性,从,值还不能断定总体具有相关关系,在实际应用中,通常是直接查积差相关系数显著性临界值表来断定,是否显著。2.p-0即检验相关系数是否为一已知常数人们常常说“相关系数r是显著的”(或“不显著”)这都是结果,这种情况在实际中用得较多。但是它只解决了两个总体是否有相关的问题,或者说由此只能说明,是否来自e-0的总体。有时在研究中还需要了解-是否来自e为某一特定值的总体,即当=时:的显著性检验。0时r的样本分布不是正态,这时需要将,与都转换成费舍z。,转换为布可以认为是正态,其平均数z,标准误蝎这样就可以进行Z检验了。(公式8.28)(二)其他类型相关系数的显著性检验除了积差相关以外,对于其他类型的相关系数也需要进行显著性检验。由于p=0条件下的相关系数显著性检验应用最多,因此,下面介绍的其他类型相关系数的显著性检验均针对于总体相关系数为零的情况。1.点二列相关系数对于点二列相关公式,进行差异性检验,若差异显著,表明显著;若差异不显著则也不显著。如果样本容量较大(n>50),也可以用下面的近似方法:,认为在0.05水平显著;,认为在0.01水平显著。2.二列相关系数。对于n的显著性检验可以用z检验:(公式8.29)3.多列相关:对所求得的多列相关系数,先乘以即(公式8.30)该式中各字母的意义与求的公式中相同,:为分类变量被分成不同类的数目。然后将按积差相关系数-的显著性检验方法进行检验。4.四格相关显著性检验公式为:(公式8.31)式中a为A因素A类项的比率,则为非A类项的比率,a-1-A。D₂为B因素B类项的将计算得到的z值与z进行比较,若z>z则表明相关显著。5.斯皮尔曼等级相关系数。计算出临界值后,直接查斯皮尔曼等级相关系数显著性临界值表进行比较决断。6.肯德尔w系数(1)当3≤N≤7时(注意N表示被评定者的数目)查肯德尔W系数显著性临界值表比较决断。(2)当N>7时,将所得W代入下式:x²=K(N-1)W(df=N-1)(公式8.32)查x分布表,若所算得r值显著,则表明W也显著。(三)相关系数差异的显著性检验在实践中经常遇到检验两个样本相关系数差异是否显著的问题。分为两种情况。1.和:分别由两组彼此独立的被试得到这时将和2分别进行费舍z的转换。由于z的分布近似正态,同样(z.-Z.)的分布仍为正态,其分布的标准误为:(公式8.33)进行Z检验:(公式8.34)2.两个样本相关系数由同一组被试算得A、Pa、A这时又分为两种情况:其一是检验A与a的差异,其二是检验A与p的差异。这时,应当首先算出三列变量的两两相关系数、和,然后用下式进行t检验(公式8.35)六、比率的显著性检验有关比率的显著性检验包括两方面,一是某样本之总体的比率与已知的总体比率差异是否显著的问题,二是两样本各自总体之间比率差异是否显著的问题。(一)比率的显著性检验比率的显著性检验是指样本比率与已知的总体比率p。之间有无差异,也就是说,某样本比率是在总体比率p。样本分布的置信区间之内,还是在置信区间之外的问题,可见,要对样本的总体进行推论,必须确知样本比率的分布及标准误。统计假设为::D-路;*蹑假设样本比率之总体与已知的p相等即二者属于同一总体。因此,样本亦属于p总体标准误(公式8.36)1.当碑>5时,可用正态概率计算临界值。(公式8.37)若z>z.(或z)为差异显著,拒绝n假设。若z<z。(或z)为差异不显著,接受H假设。2.当≤时,可直接查表,若落在p。的置信区间之内,则差异不显著,若落在置信区间之外,则可认为差异显著。(二)二比率差异的显著性检验二比率差异显著性是指二样本比率之各自总体a与p,比率之间差异显著性问题。通俗的说法是两样本的比率有无差异,但这种说法不够确切。1.独立样本比率差异显著性检验当两样本独立时,即两样本各自的比率没有关系,各自独立。因条件不同,标准误的计算公式不同,临界比率的计算也不相同。(1)若统计假设为:因事先假设二比率之总体相等,此时不管A与是p,否相等,计算标准误时应该用公式7.22,即:临界比率CR为:(公式8.38)(2)若统计假设为:H:A-D₁-p,(po为正负1之间任意数),B:A-R₂*Pa,因事先假设Ap₂,此时不管A与D₂是否相等,标准误的计算应该用公式7.19b,即第第一次实验临界比率CR为:(公式8.39)对CR的解释同前。当<3,<时,差异显著性检验应该用精确概率检验法。具体方法见第10章。2.相关样本比率差异的显著性检验当两样本相关时,同一组被试在前后两次实验中,观察的两个项目又相同,这样便可得到前后两个项目的结果,据这两结果所计算出来的两个样本比率,就称做相关样本相关样本比率差异显著性检验步骤如下:(1)将实验或调查结果整理成2×2四格表,将其中前后两次不一致项目的格内数字标以A或D。(3)应用下式求临界比率(需A÷-X≥10,即≥5): 或 或(4)若k<10,或D<5,不能用正态分布概率解释,这时应该用二项分布计算。(或。)以上的概率和(即的次至k次方的概率和)解释临界比率。若概率和小于0.025或0.005为差异显著,(双侧检验,单侧概率为小于0.05及0.01)否则为差异不显著。实验关系可用下面的四格表表示。BADCP₂=(B+D)/N2=(A+C)/A表8-4相关样本四格答:(1)假设检验的基本过程是②选择适当的检验统计量。③规定显著性水平a。④计算检验统计量的值。⑤做出决策。(2)从假设检验的过程看,“反证法”是统计推论的一个重要特点。假设检验是推论统计中最重要的内容,它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设检验的基本思想是概率性质的反证法。为了检验虚无假设,首先假定虚无假设为真。在虚无假设为真的前提下,如果导致违反逻辑或违背人们常识和经验的不合理现象出现,则表明“虚无假设为真”的假定是不正确的,也就不能接受虚无假设。若没有导致不合理现象出现,那就认为“虚无假设为真”的假定是正确的,也就是说要接受虚无假设。2.从a与两类错误的关系分析,为什么a与的和不一定答:a与是在两个前提下的概率。α是拒绝a时犯错误的概率(这时前提是“H为真”);0是接受H时犯错误的概率(这时“R。为假”是前提),所以α+β不一定等于1。图8-3a与的关系示意图如果H₀:M=A为真,关于x与A的差异就要在图8-3中左边的正态分布中讨论。对于某一显著性水平a,其临界点为x。(将两端各a/2放在同一端)。x右边表示a的拒绝区,面积比率为a;左边表示R的接受区,面积比率为1-α。在“H为真”的前提下随所犯错误(I型)的概率等于a。而又落到A的接受区时,由于前提仍是“H为真”,因此,这0.05和0.95均为“B为真”这一前提下的两个概率,一个指犯错误的可为真,这时需要在图8-3中右边的正态分布中讨论(:m-m),它与在“a为真”的前提答:错误,即Ⅱ型错误(typeIIerror),指虚无假设H₀本来不正确但却接受了Ho。(1)影响。错误的因素主要有3个,①显著性水平即。值,二者成负相关,即。增大时减小,但是二者之和不为1。②样本统计量。③样本容量,增大样本容量会减小B。(2)统计检验力又称假设检验的效力,是指假设检验能够正确侦察到真实的处理效应的能力,也指假设检验能够正确地拒绝一个错误的虚无假设的小,处理效应越明显,越容易被侦查到,假设检验的效力也就越大。②显著性水平a,c越大,假设检验的效力也就越大。③检验的方向性,单侧检验侦察处理效应的能力高于双侧检验。④样本容量,样本容量越大,标准误越小,样本均值分布越集中,统4.两个平均数差异的显著性检验比一个平均数显著性检验增多了哪些前提条件?答:平均数差异的显著性检验,就是对两个样本平均数之间目的在于由样本平均数之间的差异(x-X₂)来检验各自代表的两个总体之间的差异(A-从)。(1)需要考虑两个总体方差是否一致;(2)需要考虑两个样本容量是否相同;(3)需要考虑两总体的分布,是否都为正态分布;(4)由于可能存在相关问题等,需要考虑两样本是否独立;(5)使用的样本标准误由两个总体或样本的标准差经过数学变换组成。5.从某个人多次视反应时测量结果随机抽出40个数据,再从其听反应时的多次测量结果中随机抽取40个数据,进行视、听反应时差异检验时按相关样本还是按独立样配的被试进行的观察,另一种是对同一个(组)被试进行的多次观察。题目中列出的6.按上题方法收集数据,每个被试只收集视、听反应时数据各一个,如果共有40个被试测进行视、听反应时的差异检验时按相关样本还是的判断可以首先判断两个样本是否满足相关样本的两种情况,若7.根据不同条件下,不同统计量的假设检验方法,试概括出假设检验的基本过程。(1)根据问题要求,提出虚无假设H和备择假设B。(2)选择适当的检验统计量。(3)规定显著性水平α。在假设检验中有可能会犯错误。如果虚无假设正确却把它当著性水乎确定以后,拒绝域也随之而定,而且对于不同的假设形式,拒绝域是不同的。通常显著性水平为0.05,较严格也可以用0.01或者更小。(4)计算检验统计量的值。根据样本资料计算出检验统计量的具体值。(5)做出决策。根据显著性水平。和统计量的分布,查相应的统计表,查找接受域和拒绝域的临界值,用计算出的统计量的具体值与临界值相比较8.医学上测定,正常人的血色素应该是每100毫升13克,某学校进行抽查,37名学生血色素平均值x-121(克/100毫升),标准差:-15(克/100毫升),试问该校学生解:n>30,所以样本分布为近似正态分布。问题为是否显著低于则用单侧检验(左侧)。(1)提出假设:即该校学生的血色素不低于正常值;属:该校学生的血色素低于正常值。(2)选择检验的统计量并计算其值(3)确定显著性水平及临界值(4)作出统计决断因为3.6>2.33,所以拒绝H。即该校学生的血色素低于正常值。(5)报告结果根据假设检验的结果,该校学生的血色素低于正常值,p<0.01(单侧检验)。答:该校学生的血色素显著低于正常值。9.12名被试作为实验组,经过训练后测量深度知觉,结果误差的平均x=4cm,标准差s=2cm;另外12名被试作为控制组不加任何训练,测量结果x=6.5cm,s₂=2.5cm,问训练是否明显减小了深度知觉的误差?解:假设实验数据服从正态分布。因为实验数据不存在一一对应的关系,因此应该按照独立样本的平均数差异检验来进行(利用相关样本的判据来进行判断)。问题为是否减小了深度知觉的误差,则用单侧检验(左侧)。(1)由于两总体的方差未知,因此需要先进行方差齐性检验。②计算待检验的统计量③确定显著性水平及临界值④作出统计决断(2)两总体方差齐性,因此按照两总体方差齐性的独立样本平均数差异检验进行。本题中的-,因此应用公式8.10计算统计量。①提出假设:即训练没有减小深度知觉的误差;<即训练减小了深度知觉的误②选择检验的统计量并计算其值③确定显著性水平及临界值④作出统计决断因为,所以拒绝H。,即训练减小了深度知觉。⑤报告结果根据假设检验的结果,训练减小了深度知觉,t--259,a-22,p(单侧检验)。答:训练明显减小了深度知觉的误差。10.有24对被试按匹配组设计,分别进行集中识字和分散识字教学。假设除了教学分,试问两种识字教学效果有否显著差异(已知两组结果之间相关系数r=031)?解:假设实验数据服从正态分布。被试按照匹配组设计,因此为相关样本,且相关系数已知。问题为是否有显著差异则用双侧检验。(1)提出假设:-即两种识字教学效果没有显著差异;的即两种识字教学效果有显著差异。(2)选择检验的统计量并计算其值(3)确定显著性水平及临界值(4)作出统计决断因为,所以接受H。即两种识字教学效果没有显著差异。(5)报告结果答:两种识字教学效果没有显著差异。11.在一项双生子研究报告中,17对同卵双生子智商的相关系数为0.85,24对异卵双生子智商的相关系数是0.76,问这两个相关系数是否存在显著差异?解:两个相关系数由两组彼此独立的被试获得。问题为是否有显著差异,用双侧检验。(1)提出假设:即两个相关系数没有显著差异;廊即两个相关系数有显著差(2)选择检验的统计量并计算其值(3)确定显著性水平及临界值(4)作出统计决断因为,所以接受H即两个相关系数没有显著差异。(5)报告结果根据假设检验的结果,两个相关系数没有显著差异,Z-0.754,p>0.05(双侧检验)。答:两个相关系数没有显著差异。12.一个样本中有18个被试,随机分成两组,要求他们学习20个某种不熟悉的外语词汇。给两组被试视觉呈现这些词的方式不一样,但所有的被试在测试前都有时间研究这些词。每个被试的错误个数记录如下。第一组的两个学生未参加测试。请检验两种呈现方式下平均错误数是否相同。方式A:3411682方式B:158791468解:假设实验数据正态分布。被试随机分组因此是独立样本平均数差异检验。问题为平均错误数是否相同因此是双侧检验。(1)对原始数据进行描述统计方式A:=7,x₁-3.571,=2.441(2)由于两总体的方差未知,因此需要先进行方差齐性检验。①提出假设:两总体方差齐性②选择检验的统计量并计算其值③确定显著性水平及临界值④作出统计决断(3)两总体方差齐性,因此按照两总体方差齐性的独立样本平均数差异检验进行。②选择检验的统计量并计算其值③确定显著性水平及临界值④作出统计决断因为e,所以接受H即两种呈现方式下平均错误数相同。⑤报告结果根据假设检验的结果,两种呈现方式下平均错误数相同,t--1.314,a-14,p<0.05(双侧检答:两种呈现方式下平均错误数相同。8.3考研真题和强化习题详解1.研究者筛取了28对夫妻,验证双方承受压力的差异,正确的验证方法是()。[统考2017研]B.配对t检验,单侧假设检验C.配对t检验,双侧假设检验D.独立t检脸,单侧假设检验【答案】C2.统计功效是()。[统考2017研]3.为检验某样本来自的总体比例是否小于0.4,检验假设为H₀:π≥0.4,H₁:π<0.4,统计功效是0.8,下列说法正确的是()。[统考2015研]A.I型错误的概率是0.8B.Ⅱ型错误的概率是0.8C.H₀不为真时,没有拒绝H₀的概率是0.2D.H₀为真时,没有拒绝H₁的概率是0.24.单尾Z检验中,α确定为0.01时,其统计决策的临界值为()。[统考20145.研究人员要检验20对分开抚养的同卵双生子在15周岁时智力测验分数差异,最恰当的检验方式是()。[统考2013年研]A.两相关样本的t检验B.两独立样本的t检验D.X₂检验6.在某心理学实验中,甲组31名被试成绩的方差为36,乙组25名被试成绩的方差确的方法是()。[统考2011年研]B.F检验C.t检验D.Z检验实验处理,结果未发现处理显著的改变实验结果,下列哪一种说法是正确的?()B.本次实验中发生了Ⅱ类错误C.需要多次重复实验,严格设定统计决策的标准,以减少I类错误发生的机会D.需要改进实验设计,提高统计效力,以减少Ⅱ类错误发生的机会【答案】D8.以下关于假设检验的命题,哪一个是正确的?()A.如果H₀在α=0.05的单侧检验中被接受,那么Ho在α=0.05的双侧检验中一定会被B.如果t的观测值大于t的临界值,一定可以拒绝H₀C.如果H₀在α=0.05的水平上被拒绝,那么H₀在α=0.01的水平上一定会被拒绝D.在某一次实验中,如果实验者甲用α=0.05的标准,实验者乙用α=0.01的标准。实验者甲犯Ⅱ类错误的概率一定会大于实验者乙9.假设检验中的第二类错误是()。A.原假设为真而被接受B.原假设为真而被拒绝C.原假设为假而被接受D.原假设为假而被拒绝10.实际工作中,两均数作差别的统计检验时要求数据近似正态分布,以及()。A.两样本均数相差不太大B.两组例数不能相差太多C.两样本方差相近D.两组数据标准误相近11.在假设检验中,α取值越大,称此假设检验的显著性水平()。B.越低D.越不明显【答案】B12.假设检验中两类错误的关系是()。D.α+β不一定等于1【答案】D13.单侧检验与双侧检验的区别不包括()。A.问题的提法不同B.建立假设的形式不同C.结论不同D.否定域不同14.在统计假设检验中,同时减少α和β错误的最好办法是()。A.控制α水平,使其尽量小B.控制β值,使其尽量小C.适当加大样本容量D.完全随机取样15.统计假设检验的理论依据是抽样分布理论()。A.抽样分布理论B.概率理论C.方差分析理论D.回归理论16.某地区六年级小学生计算能力测试的平均成绩为85分,从某校随机抽取的28名学生的测验成绩为=87.5,S=10,问该校学生计算能力成绩与全地区是否有显著性差A.差异显著B.该校学生计算能力高于全区C.差异不显著D.该校学生计算能力低于全区17.已知X和Y的相关系数r₁是0.38,在0.05的水平上显著,A与B的相关系数r₂是0.18,在0.05的水平上不显著,那么()。[北大2002年研]A.r₁与r₂在0.05水平上差异显著B.r₁与r₂在统计上肯定有显著差异C.无法推知r₁与r₂在统计上差异是否显著D.r₁与r₂在统计上不存在显著差异18.在心理实验中,有时安排同一组被试在不同的条件下做实验A.相关的B.不相关的D.一半相关,一半不相关19.两个N=20的不相关样本的平均数之差D=2.55,其自由度为()。20.在大样本平均数差异的显著性检验中,当Z>=2.58时,说明()。【答案】D21.教育与心理统计中,假设检验的两类假设称为()。A.虚无假设和备择假设B.真假设和假假设C.I型假设和Ⅱ型假设D.α假设和β假设22.统计推论的出发点是()。A.虚无假设B.对立假设C.备择假设D.假设检验23.假设检验的第一类错误是()。24.下列哪些方法对提高统计效力没有帮助()。A.增加样本容量B.将α水平从0.05变为0.01C.使用单尾检验D.以上方法均可提高统计效力B.H₀是虚假的,并且被拒绝了C.H₀是真实的,并且被接受了D.H₀是真实的,但是被拒绝了1.在假设检验中,H₁又可以称作()。A.虚无假设B.备择假设C.对立假设D.无差假设2.统计学中将拒绝H₀时所犯的错误称为()。类错误类错误型错误型错误3.以下关于假设检验的命题,()是正确的?A.如果H₀在a=0.05的单侧检验中被接受,那么H₀在a=0.05的双侧检验中一定会被接受。B.如果t的观测值大于t的临界值,一定可以拒绝H₀。C.如果H₀在a=0.01的水平上被拒绝,那么H₀在a=0.05的水平上一定会被拒绝。D.在某一次实验中,如果实验者甲用a=0.05的标准,实验者乙用a=0.01的标准。4.假设检验中两类错误的关系是()。A.仅α+β=1B.α+β不一定等于15.单侧检验与双侧检验的区别包括()。A.问题的提法不同B.建立假设的形式不同C.结论不同D.否定域不同1.统计检验力[浙大2000研]答:统计检验力,又称假设检验的效力,是指假设检验能够应的能力,也指假设检验能够正确地拒绝一个错误的虚无假大小,处理效应越明显,越容易被侦查到,假设检验的效力也就越大。②显著性水平a,c越大,假设检验的效力也就越大。③检验的方向性,单侧检验侦察处理效应的能2.检验的显著性水平[南开大学2004研]答:检验的显著性水平是指在假设检验中,虚无假设正确时作为检验的显著性水平。也就是说每当实验结果发生的概率小于或等于0.05的时候,1.简述统计假设检验中两类错误的定义及其关系。[统考2009研]答:(1)统计检验中两类错误即α错误和β错误。(2)α错误和β错误相互之间的关系①α+β不一定等于1。因为a与β是在两个前提下的概率。α是拒绝H₀时犯错误的概率(这时前提是“H₀为真”);β是接受Ho时犯错误的概率(这时“H₀为假”是前提),③统计检验力。1-β反映着正确辨认真实差异的能力。统计学中称(1-β)为统计检验力。假如真实差异很小时,某个检验仍能以较大的2.在进行差异的显著性检验时,若将相关样本误作独立样本处理,对差异的显著性有何影响,为什么?[北师大2003研]答:(1)在进行差异的显著性检验时,首先需要考虑样本是否服从正态分布,如果服从正态分布,还需要考虑总体方差是否已知,然后看样本误作独立样本处理,则忽视了样本数据之间的一致性,导致错误地运用计算公式,(2)因为相关样本与独立样本不同,会运用不同的计算方法计算显著性。相关样本与①如果是独立样本,其和(或差)的方差等于各自方差的和,即在进行差异的显著性检验中采用以下公式:②相关样本之间存在着一一的对应关系。如果是相关样本前后两次结果则相互影响,而不独立。当两个变量之间相关系数为r时,两变量差的方差为:在进行差异的显著性检验中采用以下公式:由计算公式可以看出,独立样本和相关样本在进行差异的显著行检验时,使用了不同计算公式,相关样本的标准误可能会比独立样本的标准误小,使得计算出的Z值大,从而更容易达到显著性水平,所以如果将相关样本误作独立样本处理,会使本来可能有显著差异变成无显著差异。3.有人说:“t检验适用于样本容量小于30的情况。Z检验适用于大样本检验”,谈谈你对此的看法。[北师大2004研]答:我认为这种说法是正确的。t检验、Z检验都是均值检验的方法,都有各自适用的(1)t检验是比较两组均数差别最常用的方法。当样本容量小于30时,样本的差异平均数与差数的总体平均数的离差统计量呈t分布,这时应该采用t检验。理论上,即使样本量很小时,也可以进行t检验。只要每组中变量呈正态分布,两组方差不会明显不同。当n>30时,t分布趋向于正态,这时如果样本容量接近30还可以采用t检验,但也可以用z检验近似处理。(2)Z检验法适用于大样本(样本容量大于30)的两平均数之间差异显著性检验的(3)在平均数的显著性检验中,分两种情况,其一是关于样本平均数与总体平均数差异的显著性检验,在总体服从正态分布,总体方差已知的情况下,用Z检验;总体方差未知的情况下,用t检验。其二是平均数差异的显著性检验,在两个总体都服从正态分布,总体方差均已知的情况下,用Z检验(相关样本和独立样本所用统计量不同);在两个总体都服从正态分布,但是总体方差未知时,用t检验(所用检验统计量方法与两个总体是否独立以及方差是否相等有关)。所以,有时t检验与Z检验没有绝对界限。4.选择统计检验程序的方法时要考虑哪些条件,才能正确应用统计检验方法分析问题。[北师大2004研]答:选择统计检验程序的方法时需考虑以下条件:(1)看总体分布是否已知。如果已知,看是不是正态分布。如果已知样本分布为常态分布就可以选择参数检验法,如果总体分布未知就用非参数检验法。(2)在参数检验中,如果总体分布为正态,总体方差已知,两样本独立或相关都可以采用Z检验;如果总体方差未知,根据样本方差,采取不同的t检验。如果总体分布非正态,总体方差已知,根据样本独立或相关采取z检验;如果总体方差未知,根据独立和相关采取不同的z.检验。(3)根据题目考虑用单侧还是双侧检验。(4)在非参数检验中,按照两个样本相关和不相关、精度与容量等,可以采用符号检验、秩和检验等方法。5.独立样本和相关样本之间的差别是什么?[中山大学2004研]在显著性检验中,相关样本的t检验一般不需要事先进行方差齐性检验。因为相关样据均值差的显著性检验转化为对d的显著性检验。而独立样本的数据不是成对的,即差d,只能以两个样本方差共同对总体方差进行估计(即求联合方差),必须以两组验组间差异,即通过比较自变量(性质变量)的各水平在因变量上的差异对自变量的的差异,即其分析的自变量只能有两个水平;而方差分析则主要用1.随机从某总体选取10名被试,分别实施两次数学测验,两次测验的成绩见表8.5,问被试在两次测验的平均数是否有显著差异?试对结果进行解释(α=0.05,df=9,t表8-510名被试两次测验的成绩I23456789测验一解:(1)由于总体方差未知,两个是相关样本,所以采用t检验。①提出假设服:-即被试在两次测验的平均数没有显著差异。消即被试在两次测验的平均数有显著差异。②选择检验的统计量并计算其值其中=6,系=566,C=,n=10③确定显著性水平及临界值④作出统计决断因为,所以接受H即被试在两次测验的平均数没有显著差异。⑤报告结果根据假设检验的结果,被试在两次测验的平均数没有显著差异,:=1.11,s(双侧检验)。(2)根据假设检验的结果,被试在两次测验的平均数没有差异,既可能是因为两次测验测量的内容是相近的,也可能是因为样本抽样过小,测量内容之间的差异没有显示2.有容量分别为n₁=10和n₂=16的独立随机样本得到下述观测结果,(X、Y为观X12.312.512.813.013.5Y现已知变量X、Y的总体均呈正态分布。请问在0.05的显著性水平下,可否认为这两个总体属同一分布?[浙大2003研]提示:Fo.os(9,15)=2.59,Fo.os(10,16)=2.49,toos/2(24)=2.064,to.os/2(25)=2.060,to.o₅(24)=1.711,to.o解:(1)对原始数据进行描述统计X:n=10,名-12.8,=0.1(2)由于两总体的方差未知,因此需要先进行方差齐性检验。①提出假设即两总体方差齐性:即两总体方差不齐性②选择检验的统计量并计算其值③确定显著性水平及临界值④作出统计决断(3)两总体方差齐性因此按照两总体方差齐性的独立样本平均数差异检验进行。①提出假设:-即两个总体属于同一分布。即两个总体不属于同一分布。②选择检验的统计量并计算其值③确定显著性水平及临界值④作出统计决断因为,所以拒绝H,接受A,即两个总体不属于⑤报告结果根据假设检验的结果,两个总体不属于同一分布,t-3879,d=24,p<0.05(双侧检验)。答:两个总体不属于同一分布。ü方差分析的一般原理ü完全随机设计方差分析方法ü随机区组设计方差分析方法ü事后检验。方差分析又称作变异分析(analysisofvariance,ANOVA),它是斯内德克(GeorgewaddelSnedecor,1881~1974)为了探讨一个因变量与一个或多个自变量之间的关系,1946年根据费舍的早期工作发明的一种检验方法。其主要功能在于分析实验数据要影响。(一)方差分析的基本原理:综合的F检验方差分析主要处理多于两个以上的平均数之间的差异检验为此,设定虚无假设为:样本所归属的所有总体的平主要任务,如果综合虚无假设被拒绝,紧接着要确定究2.方差的可分解性(1)方差分析依据的基本原理就是方差(或变异)的可加性原则。确切地说,应该是方差的可分解性。作为一种统计方法,方差分析把实验数(2)平方和指观测数据与平均数离差的平方总和。就一般情况而言,任意一个数据X(4-)加上该组平均数与总平均数的差(Z-无)。即(公式9.1)式中表示各组的数据从1加到。的和,表示从第1组加到第K组之和。令(公式9.2)(公式9.3)(公式9.4)则SS,=SS₂+SSm(公式9.5)表示实验中产生的总变异;ss₂为组间平方和(sumofsquaresbetween表示由实验误差(包括个体差异)造成的变异。下标r表示全部(total),B代表组间(betweengroups),m代表组内(withingroup)。(3)总变异就被分解为组间变异和组内变异两部分。总变异的计算是把所有被试的数值作为一个整体考虑时得到的结果,是用所有被试的因变量的值计算得到的。在计算时,它不区分各个数值究竟来自于哪一种实验条件。组间变异主要指由于接受不同的实验处理而造成的各组之间的变异,可以用两个平均数之间的离差表示。两组平均数的差异越大,组间变异也就越大。组间变异可以看作是组间平均数差异大小的一个指标。组内变异则是区组内各被试因变量的差异范围决定的,主要指由实验误差或组内被试之间的差异造成的变异。由于被试分组是随机分派,个体差异及实验误差带有随机性质,因而组内变异与组间变异相互独立,可以分解。(4)在方差分析中,如果实验中各个组内部被试之间存在着不同程度的差异,即接受同样处理的被试在因变量上有量的差别,那么组内平方和就会比较大。如果各独立组每组的方差很大,组内平方和也会很大,组内平方和越大,表明实验误差越大。一般情况,组内平方和不会为0。因为,所有被试不可能在实验前都是相同的,而实验者也不可能绝对同等地处理它们。相反,如果组间平方和越大,组内平方和就会越小,各组平均数之间有显著差异的可能性也越大。样本平均数之间的变异和样本内部的变异相差越大,就说明总体处理中平均数之间的差别也越大。这样,从统计角度考虑,缩减样本内部的变异,使样本平均数真正的变异就能显示出来。这是所有实验研究在设计时的一个关键。(5)平方和除以自由度所得的样本方差可作为其总体方差的无偏估计。那么,方差分析中组间方差和组内方差就分别表示为:(公式9.6)(公式9.7)AS,表示组间方差,一般称作组间均方(meansquaresbetweengroups),有的书中把它用s,表示,指实验处理(treat)的均方,也就是组间均方;a为组间自由度;Asm表示组内方差或称组内均方(meansquareswithingroup),有的书中把它用Ms,表示,指误差的均方即组内均方;为组内自由度。在方差分析中,组间变异与组内变异的比较必须用各自的均方,不能直接比较各自的平方和。因为平方和的大小与项数(即k或)有关,应该将项数的影响去掉求其均方,因此必须除以各自的自由度。组间自由度-敏-Ldj-da+d(公式9.8)检验两个方差之间的差异用F检验,因此比较Ms₂与Sπ也要用F检验。在讨论方差齐性检验时,指出利用r检验比较两个样本方差的差异要用双侧检验。在方差分析中关心的是组间均方是否显著大于组内均方,如果组间均方小于组内均方,就无需检验其是否小到显著性水平。因而总是将组间均方放在分子位置,进行单侧检验,即(公式9.9)F为组间变异与组内变异比较得出的一个比率数,如果F<1,说明数据的总变异中由分组不同所造成的变异只占很小的比例,大部分由实验误差和个体差异所致,也就是说不同的实验处理之间差异不大,或者说实验处理基本上无效;如果F-1,同样说明实验处理之间的差异不够大;当F>1而且落入F分布的临界区域,表明数据的总变异基本上由不同的实验处理所造成,或者说不同的实验处理之间存在着显著差异。(二)方差分析的基本过程与步骤在实际应用方差分析时,为了方便,一般直接从原始数据求平方和,这时平方和的公(公式9.10)(公式9.11)方差分析的基本步骤如下:1.求平方和(公式9.12)平方和的计算方法有三种:一种是用“平方和”定义公式,即公式9.2,9.3,9.4。一种是用原始数据公式,即公式9.10,9.11,9.12;另一种是利用样本统计量进行计(1)总平方和总平方和是所有观测值与总平均数的离差的平方总和。(2)组间平方和组间平方和是几个组的平均数与总平均数的离差的平方总和。(3)组内平方和组内平方和是各被试的数值与组平均数之间的离差的平方总和。2.计算自由度3.计算均方组间均方As:是用组间平方和除以组间自由度,组内均方ASm是用组内平方和除以组内自4.计算F值如果计算得到的组间均方比组内均方大,这就表示组间平均数之间有差异。但二者差异是否达到显著性水平呢?这还需要计算F值并作检验。假如拒绝虚无假设的值(p-value)定为p-005,如果计算的值小于所确定的显著性水平的临界值,表明F值出现的机率小于0.05,就可拒绝虚无假设,可以说不同组的平均数之间在统计上至少有一对有显著差异。假如实验控制适当,也可以提出自变量对因变量作用显著的结论。参考各组的平均数,进一步做事后检验,可以确定究竟是哪一对平均数之间有显著差异,得出更深层次的结论。如果计算的F值大于P为0.05的临界值,就不能拒绝虚无假设,只能说不同组的平均数之间没有显著差异。除了确定显著性水平外,在查F表时,还必须明确是用单侧检验,还是双侧检验。另外,P值也可定为0.01。6.陈列方差分析表上面几个步骤的计算结果,可以归纳成一个方差分析表。一般在实验报告中的结果部分,也不需要写出统计检验的过程,只需列出方差分析表,简明扼要,一目了然。不同的实验设计,方差分析表组成要素基本一致,主要包括变异来源、平方和、自由度、均方、F值和p值。因实验设计不同,变异来源也不同,相应的自由度和均方值、F值、p值也会发生变化。表9-1方差分析表示例组内自由度P(三)方差分析的基本假定运用F检验进行的方差分析是对所有组间平均数差异进行的整体检验。进行方差分析时有一定的条件限制,数据必须满足以下几个基本假定条件,否则由它得出的结论将方差分析同z检验及:检验一样,也要求样本必须来自正态分布的总体。在心理与教育研究领域中,大多数变量是可以假定其总体服从正态分布,一般进行方差分析时并不需要去检验总体分布的正态性。当有证据表明总体分布不是正态时,可以将数据做正态转化,或采用非参数检验方法。2.变异的相互独立性总变异可以分解成几个不同来源的部分,这几个部分变异的来源在意义上必须明确,而且彼此要相互独立。这一点一般都可以满足。3.各实验处理内的方差要一致各实验处理内的方差彼此应无显著差异,这是方差分析中最重要的基本假定。在方差分析中用ASm作为总体组内方差的估计值,求组内均方AS时,相当于将各个处理中的样本方差合成,它必须满足的一个前提条件就是:各实验处理内的方差彼此无显著差异。这一假定若不能满足,原则上是不能进行方差分析的。(四)方差分析中的方差齐性检验在进行方差分析时,各实验组内部的方差彼此无显著差异,这是最为重要的一个假定。为了满足这一假定条件,往往在做方差分析前首先要对各组内方差做齐性检验。这与t检验中方差齐性检验的目的意义相同,只是在具体方法上由于要比较的样本方差多于两个而有所不同。这种方法简便易行。具体实施的步骤是,先找出要比较的几个组内方差中的最大值与最小值,代入下式:(公式9.13)查临界值表,当算出的小于表中相应的临界值,就可认为几个要比较的样本方差两两之间均无显著差异。(五)与方差分析有关的实验设计问题不同的实验设计,所需方差分析的具体方法存在着区别。1.方差分析与t检验的关系如果用方差分析去检验一个双组设计的平均数差异,将会得到与t检验同样的结果,得到一个完全相同的结论,在这个意义上,可以将方差分析看成t检验的延伸与扩展。但是,t检验处理的是两个样本组之间的差异显著性问题,检验的数据来自两种不同的实验处理,它仅适用于只有两组样本的实验设计。在心理学研究中,这种实验设计只是最简单的一种。大多数实验都包含两种以上的实验处理,比较的对象都超过了两个实验组,需要同时比较两个以上的样本平均数。这种同时对所有平均数差异的显著性进行检验只能使用方差分析。2.组间设计、组内设计与混合设计用方差分析方法处理的实验数据,大多属于方差分析实验设计类型产生的结果。在方差分析型实验设计中,有多个样本组共同参与实验,接受一个变量或多个变量的多种水平的实验处理。简单讲,这类实验设计中的被试组超过二组以上,是一种多组设计。这种设计最常见的类型有组间设计、组内设计与混合设计。(1)组间设计通常把被试分成若干个组,每组分别接受一种实验处理,有几种实验处理,被试也就相应地被分为几组,即不同的被试接受自变量不同水平的实验处理。由于被试是随机取样并随机分组安排到不同的实验处理中,因此,它又称完全随机设计。完全随机分组后,各实验组的被试之间相互独立,因而这种设计又被称为“独立组”设计,或被试间设计。从理论上讲,在这类设计中,各个组别在接受实验处理前各方面相同,若实验结果中组与组之间有显著差异,就说明差异是由不同的实验处理造成的。这是完全随机设计的主要特点。当对这类设计中各实验组和控制组的数据进行方差分析时,统计结果差异显著,就表明实验处理是有效的。在心理与教育科学研究中,由于某些实验中被试不可能先后接受两种实验处理,如教学方法实验,被试接受一种方法后再接受另一种教学方法,但教学内容是重复的,即使效果有差异,显然也不能说明问题。因此在这类实验中,被试的分组一般采用完全随机方式,也可以用配对组方式。但是,在这类设计中,实验误差既包括实验本身的误差,又包括被试个别差异引起的误差,无法分离,因而它的效率受到一定限制。(2)组内设计又称被试内设计,是指每个被试都要接受所有自变量水平的实验处理。由于接受每种实验处理后都要进行测量,因此,它又称为“重复测量设计”。组内设计中,当用被试样本组代替单个被试时,又称为“随机区组设计”。此时,每个被试组都要接受所有实验处理,但组中的每个被试只随机地接受一种实验处理。通常,把这样的被试组称为区组。同一区组内应尽量同质,即在各个方面都相似或相同。这种设计将被试的个别差异从被试(组)内差异中分离出来,提高了实验处理的效率。(3)混合设计一般涉及两个以上的自变量,其中每个自变量的实验设计各不相同。如一个用组间设计,一个用组内设计,实际上是同时进行几个实验。二、完全随机设计的方差分析完全随机设计(completerandomalizeddesign)的方差分析,就是对单因素组间设计的方差分析(one-waybetween-subjectsanalysisofvariance)。在这种实验研究设计中,各种处理的分类仅以单个实验变量为基础,因而,把它称为单因素方差分析或单向方差分析。这种实验设计安排被试的一般格式如下:(一)各实验处理组样本容量相同各实验处理组样本容量相同时,对于每一种实验处理而言,它们被重复进行的次数是计算步骤1.提出问题(所有k个总体平均数是相同的,即不存在处理效应。)至少有一对成立(至少有两个总体平均数是不同的,即处理效应不全为0。)2.计算平方和3.计算自由度4.计算均方5.计算F比值,进行F检验,做出决断6.列出方差分析表计算得到的方差分析表中,会给出与F值相对应的具体的值。一般在F值的右上角用*表示在0.05水平上有显著差异,用**表示在0.01水平上有显著差异,用***表示在0.001水平上有显著差异。这样,方差分析表中就不用列出值这一列,但要在表的下(二)各实验处理组样本容量不同算组间平方和时,要注意公式中的n各组不相同,即把公式9.11中的,用表示,表示总数据个数的用n表示,得到下面的公式:(三)利用样本统计量进行方差分析有时欲分析的资料只有各组的x、及等样本特征值,没有原始数据,在这种情况下要进行方差分析,关键在于对方差分析的思想和基本概念的理解,只要对平方和、均方等概念真正理解,进行方差分析比用原始数据进行方差分析还要简单,计算公式依据平方和的定义公式。三、随机区组设计的方差分析(一)随机区组设计的方差分析,就是重复测量设计的方差分析(repeatedmeasuresanalysisofVariance),或称为组内设计的方差分析。随机区组设计(randomizedblockdesign)指在实验中将实验对象按一定的标准划分为。个区组(block),使得区组内的实验对象的个别差异尽可能小,即保证区组内的同质性.并使每个区组均接受所有x个处理。且各个区组内每个处理仅有一个观测。其顺序是随机决定的。(二)随机区组设计根据被试特点把被试划分为几个区组,再根据实验变量的水平数在每一个区组内划分为若干个小区,同一区组随机接受不同的处理。这类实验设计的每一区组内被试的人数分配大致有三种情况:(1)一个被试作为一个区组,这时不同的被试(区组)均需接受全部x个实验处理。每人接受k种实验处理的顺序不同所产生的误差,应该用一定的方法加以平衡。(2)每一区组内被试的人数是实验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论