




已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
以下问题及解答均来自互联网,只为帮助统计学习者,如涉及版权,请告知1. 统计学习效果的问题由于在学习上个体差异比较大,“学了很多遍”这样的问题只是学习的表现结果,而分析造成这种结果的原因,大体可从以下两个方面来看:1、对学习效果常见的看法有两种:一是在课程内的学习效果;二是解决实际问题的效果。我们对第一种学习效果的评价和衡量一般都是通过课程末尾的考试成绩来判定的,可是这个成绩是由试卷的难度、教学目标、教学方式和学生学习水平共同决定的。我们一般对自己学习效果的判定仅仅是成绩的高低,高分者就认为自己学会了,低分者就认为没学会。这种习惯性认识是在长期应试学习过程中逐渐习得的,一般人都不会对这个问题产生任何疑问。这一点即使在很多老师身上也是难以动摇的观念,这样造成的结果就是学生和教师都在感觉上认同考试分数高了就是学会了。但只要我们对决定学习考试成绩的因素做一个全面、缜密的思考就会认识到,“高分即学会”观念在很多情况下是不正确的。第二种学习效果是以实际问题的解决成功与否为检验标准的,教育的最初和最终的目的就是教会学生在社会上的谋生能力,而我们现在的很多科目的教学,由于受到学科分类、学科本身的应用性、教学资源安排等方面的限制,很少学科能做到这一点。统计就是一门比较争论性的学科,教应用统计的教师大体有两种背景,一个是统计专业的数学背景,另一个是各应用领域老师的背景,这两种老师各有各的长处。在一般情况下(不代表全部),应用领域老师的应用性会体现得更明显,即跟专业领域的知识结合也更紧密。但这并不意味着应用领域的统计老师的教学效果就一定经得起实践的检验。统计,尤其是应用统计,到底需要教多少统计原理和推导,在这两种类型的教师身上就存在巨大的差异。这两种取向的定位和选择,就决定了教学是实际问题导向,还是原理推导导向。当然,这两个取向也就是一个维度的两个端点,每个教师都会在这两个端点间寻求一个合适的平衡点来讲授自己的课程。如果能够在教学风格和学习风格间匹配良好,教学效果自然也就不错。总之,看待学习效果的两个看法都会产生学会或学不会的感觉,但是这两种看法的根源和指向是不同的。一般情况下,大多数正在学习的学生属于第一种看法,而对于有实际需要的学习者来说就属于后一种。2、学习者的动机有两种:任务性学习动机、成长性学习动机任务性动机的学习者更多地关注分数、别人的看法、达到未来目标的必要性等方面,它的快乐来自于别人的称赞和肯定;在统计学习上,这类学习者更多地指向考试是否能够通过或取得好成绩,所以在问问题时,更多地会问考试的题型有哪些?某个概念要不要掌握?等。这类学习者最终的学习水平一般不会超出老师的要求,如果老师的要求低,他就不会突破老师给他的范畴,也就很难青出于蓝而胜于蓝了。成长性动机的学习者更多地关心自己能力和人格的成长、不断地体验学习进步带来的快乐,他不会关注别人对他的评价。在统计学习上,这类学习者更多地关注统计概念的渊源;统计概念所揭示的随机现象的规律;统计知识如何运用到日常生活中。他们一般会问这类的问题:我的理解您看看对不对?,我有一种新的思路,我想听听您的意见。,“这些概念之间到底有什么内在的联系呢?”这类的学习者只要继续不断努力,就一定能够青出于蓝。虽然,以上两种角度的分析不可能全部涵盖所有的统计学习不良的原因,但还是希望能够对正在学习的人有个自我反省的思路,也就不妄2. 自由度是什么?怎样确定?答:(定义)构成样本统计量的独立的样本观测值的数目或自由变动的样本观测值的数目。用df表示。自由度的设定是出于这样一个理由:在总体平均数未知时,用样本平均数去计算离差(常用小s)会受到一个限制要计算标准差(小s)就必须先知道样本平均数,而样本平均数和n都知道的情况下,数据的总和就是一个常数了。所以,“最后一个”样本数据就不可以变了,因为它要是变,总和就变了,而这是不允许的。至于有的自由度是n2什么的,都是同样道理。在计算作为估计量的统计量时,引进一个统计量就会失去一个自由度。通俗点说,一个班上有50个人,我们知道他们语文成绩平均分为80,现在只需要知道49个人的成绩就能推断出剩下那个人的成绩。你可以随便报出49个人的成绩,但是最后一个人的你不能瞎说,因为平均分已经固定下来了,自由度少一个了。简单点就好比你有一百块,这是固定的,已知的,假设你打算买五件东西,那么前四件你可以随便买你想买的东西,只要还有钱的话,比如说你可以吃KFC可以买笔,可以买衣服,这些花去的钱数目不等,当你只剩2块钱时,或许你最多只能买一瓶可乐了,当然也可以买一个肉松蛋卷,但无论怎么花,你都只有两块钱,而这在你花去98块那时就已经定下来了。3. 统计学意义(P值)答:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,P值为结果可信程度的一个递减指标,P值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。P值是将观察结果认为有效即具有总体代表性的犯错概率。如P=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的P值通常被认为是可接受错误的边界水平。4. 如何判定结果具有真实的显著性答:在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生P值的结果0.05被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果0.05P0.01被认为是具有统计学意义,而0.01P0.001被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。5. 所有的检验统计都是正态分布的吗?答:并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、F检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。6. 统计推断中如何使用正态分布每对男女都是从男女白细胞数均数一样的总体中抽取到的。尽管大多数样本的差异都接近0,但多次实验后,总有一对样本可能从男女白细胞数差异远大于0的总体中抽取到的。这种情况出现的频率有多少?如果样本足够大,重复实验的结果服从于正态分布(此原则将在下文解释说明),知道了正态曲线的形状,我们就可以准确地计算出偏离假设总体均数为0的各个标准差由于偶然所得结果的概率。如果计算的概率很低,满足统计学显著性接受标准,那么我们只能认为:结果比无效假设更接近于总体中的情形,(无效假设是作为估计经验性结果的技术性推论准则)。注意整个推断都是在这些重复实验结果(统计学上称为样本分布)的分布形状为正态的设想下进行的。7. 如何知道违反了正态假设呢尽管许多理论可以用数学来证明,但还有一些没有理论依据,仅仅凭经验,即所谓的Monte-Carlo实验,实验中,电脑根据事先设计的规则产生大量的样本,并采用各种各样的检验对这些样本进行分析。这样,当数据不满足所用检验的理论假设时,可以从经验上估计产生错误或偏移的类型和大小。具体地说,Monte-Carlo实验广泛应用于判断基于正态假设基础上的检验对总体中分析变量违反正态假设的敏感性。该实验的基本结论是:这种违反正态假设所得的结果比原先想的要小,这个结论使我们比较振奋不用过多考虑正态性假设,从而大大增加了那些依赖分布形式的统计检验方法在各研究领域的普及。8. 为什么“正态分布”很重要正态分布很重要,因为在大多数情况下正态方程与上文介绍的方程近似。许多统计检验方法要求的资料分布都是正态分布的,或遵循某种由正态分布中演绎出的形式。在这个意义上,正态分布是有关现实基本本质并被实践证实了的基本真理,它可与自然科学中基本法则相媲美。正态分布的准确形状(特征性的“钟形”)只要2个参数就可确定,均数与标准差。正态分布的特征属性提示了68%的观察对象落在均数标准差之内。在均数1.96倍标准差内含有95%的观察值。换句话说,在正态分布中的,观察对象值在均数2倍标准差之外的频数低于5%。如果你掌握了STATISTICA,使用交互式概率计算器,就可知道正态分布中各值的确切概率;例如,如果你键入Z值为4时,STATISTICA计算的对应概率为0.0001以下,因为在标准正态分布中几乎所有的观察值(即99.99%以上)落在4个标准差范围内。下边的动画显示了其他的Z值对应的尾部区域范围。9. “统计学显著性水平”的计算假定我们已经计算出两变量的关联,下一个问题就是“关联显著性有多大?”。两变量中可解释的变异为40%是否就可认为关联具有显著性了呢?回答是不确定的,具体地说,是否具有显著性取决于样本量的大小。上面提及,大样本中小关联也具有显著性,而小样本中即使是大关联也不能认为可信(具有显著性)。因此,判断统计学显著性水平,需要一个基于样本量大小上能够表达变量间关联强度与可信性关系的方程。所需的方程要确切地告诉我们在样本量一定的条件下,假设总体中变量关联不存在,我们得到给定关联强度的可能性。换句话说,方程要给出显著性水平(P),并且要告诉我们拒绝接受总体中变量不存在关联的可能性。这个备择假设(总体不存在关联)常常称为无效假设。如果概率方程呈线性,随着样本的变化斜率发生变化,这中情况是理想化。方程总是很复杂,并不总是相同的;不过,大多情况下,我们知道其形状,并可据此判定大小一定的样本中结论的显著性水平。大部分方程都与正态方程有关。10. 统计检验共同的“基本格式”因为大多数统计检验的最终目的是估计变量间的关联,所以大多数统计检验都遵循上面所解释的基本格式。统计学上,就是研究变量组间差异与变量总变异的比率。例如,上例表示性别解释的那一部分变异与白细胞数总变异的比率,这比率通常称为可解释变异与总变异之比。统计学上,可解释变异一词并不需要我们从概念上理解它。它通常仅用来表示所研究变量的共同变异,即某一变量中可由另一变量特定值所解释的那部分变异,反之亦然。11. 如何测量变量间的关联强度统计学家发展了许多测量变量关联强度大小的方法;一定条件下,某种方法的选择依赖于所含变量的多少,所使用的量表及关联的本质等等,但大多都遵守一条基本原则:都试图通过与这些特定变量间最大可能关联比较来估计实际关联强度的大小。从统计学上讲,估计关联的常用方法是观察变量值的差异,然后计算所研究的两个或多个变量含有共同差异时解释总差异的比例。通俗地说,就是将变量中共同部分比成如果变量完全相关时应潜在相同的部分。让我们看一个简单的例子。样本中男性WCC的平均值为100,女性为102。可以认为,每个个体与总体平均数(101)的差异中,包含了由于对象性别差异的成分。这个成分的大小为1。这个值一定程度上,代表了性别与WCC间的关联。但这个值的说服力还是相当弱的。因为,在给定了WCC的总体差异情况下,它还不能说明该成分的相对大小。考虑2个特殊例子:a.如果全部男子WCC值都为100,而女性都为102,那么所有与样本总均值的差异均可用性别来解释。可认认为样本中性别与WCC完全相关,即观察对象间100%的观察变异都可用性别来解释。b.如果WCC值在0-1000的范围中波动。男女WCC平均值相同的差异(为2)所能解释的总变异就很小了,几乎可被忽略。例如,增加一个观察对象可能改变差异甚至将差异方向颠倒过来。因此,一个好的测量变量间的关联的方法必须考虑样本中个体的总变异并估计有多大的变异可被所讨论的关联来解释。12. 无关联能成为显著性结果吗?变量间的小关联需要大样本证明其显著性。例如,推测证明硬币仅有0.000001%的不对称需要进行多少次投掷!因此最小样本量随着作用结果大小的减弱而增加。当作用大小接近于0,最终证明其作用的必需样本量趋近于无穷大。也就是说,如果两变量间几乎无关联,那么样本量大小几乎等于总体,假设总体为无限大。统计学显著性是如果我们测量整个总体,能够得到类似结果的概率。因此,根据定义,在测量总体之后以最高的可能性水平检验任何结果都可能具有显著性,其中也包括无关联的结果。13. 为什么只有大样本中小关联才有显著性上段的例子提示,如果所研究变量间的关联(即在总体中)的确很小,除非调查样本相当大,没有其他方法识别这种关联。即使样本的确具有“很好的代表性”,样本很小,统计学上也不具统计学显著性水平。类似地,如果研究关联的确非常大(即在总体中),小样本中也可能具有高度统计学意义。看下面的一个例子。如果硬币轻微不对称,抛的时候,产生头面的次数较尾面次数多(例如60%对40%),投掷10次不足以让人相信硬币是不对称的。即使所得的结果(6次头面4次尾面)很能代表硬币的不均衡性。但是,是不是10次的投掷什么也不能证明呢?不是的,如果研究的作用相当大,10投掷就足够了。如果硬币很不对称,无论怎么投掷结果都是头面。这样的硬币投10次,并且每次都是头面,大部分的人就认为硬币确有“不妥”。换句话说,该现象可认为是在一无限投掷硬币的理论总体中头面比尾面多的有力证据。如果关联足够大,小样本就可证明其显著性。14. 标准差与标准误的区别近年来,在一些医学刊物上频繁地出现标准差和标准误的错误应用现象,由于滥用、乱用这些统计学知识,极大地影响了所刊文稿的科学价值和学术价值。与此同时,还有数不清的人在不遗余力地模仿,其危害之大、遗害之远是不言而喻的。为使医学科研有所遵循,也为各类刊物真正起到相互交流的作用,达到共同提高的目的,本文仅就标准差和标准误的区别谈点认识,以求抛砖引玉,与同仁共勉。1 标准差标准差(S 或SD),是用来反映变异程度,当两组观察值在单位相同、均数相近的情况下,标准差越大,说明观察值间的变异程度越大。即观察值围绕均数的分布较离散,均数的代表性较差。反之,标准差越小,表明观察值间的变异较小,观察值围绕均数的分布较密集,均数的代表性较好。在医学研究中,对于标准差的大小,原则上应该控制在均值的12%以内,如果标准差过大,将直接影响研究的准确性。数理统计表明,在标准正态分布曲线下的面积是有规律性的,根据这一规律,人们经常用均数加减标准差来计算样本观察值数量的理论分布,并以此来鉴定样本的代表性。即:x 110s 表示68127%的观察值在此范围之内;x 1196s 表示95%的观察值在此范围内; x 2158s 表示99%的观察值在此范围内。如果取得的样本资料的实际分布与理论分布非常接近,证明该样本具有代表性。反之,则需要重新修正抽样方法或样本含量。x 1196s 是确定正常值的方法,经常在工作中被采用,也称为95%正常值范围。2 标准误标准误(Sx 或SE ),是样本均数的抽样误差。在实际工作中,我们无法直接了解研究对象的总体情况,经常采用随机抽样的方法,取得所需要的指标,即样本指标。样本指标与总体指标之间存在的差别,称为抽样误差,其大小通常用均数的标准误来表示。数理统计证明,标准误的大小与标准差成正比,而与样本含量(n)的平分根成反比,即:Sx = S/n 这就是标准误的计算方法。抽样研究的目的之一,是用样本指标来估计总体指标。例如:用样本均数来估计总体均数。由于两者间存在抽样误差,且不同的样本可能得到不同的估计值,因此,常用“区间估计”的方法,来估计总体均数的范围。即: X 1196 Sx 表示总体均数的95 %可信区间; X 2158 Sx 表示总体均数的99 %可信区间。95 %可信区间指的是:在X 1196 Sx 范围中,包括总体均数的可能性为95 % ,也就是说,在100 次抽样估计中,可能有95 次正确(包括总体均数) ,有5 次错误(不包括总体均数) 。99 %可信区间也是这个道理,只是包括的范围更大。在实际工作中,由于抽取的样本较小,不呈标准正态分布( u 分布) ,而遵从t 分布,所以常用t 值代替1196 或2158。可在t 值表上查出不同自由度( n ) 下、不同界值时的t 值。可见到自由度越小, t 值越大,当自由度逐渐增大时, t 值也逐渐接近1196 或2158 ,当n = 时, t 值就完全被其代替了。所以,我们常用X t 0105 Sx 表示总体均数的95 %可信区间,用x t 0101 Sx 表示总体均数的99 %可信区间。综上所述,标准差与标准误尽管都是反映变异程度的指标,但这是两个不同的统计学概念。标准差描述的是样本中各观察值间的变异程度,而标准误表示每个样本均数间的变异程度,描述样本均数的抽样误差,即样本均数与总体均数的接近程度,也可以称为样本均数的标准差。二者不可混淆。由此可见,在众多的医刊上出现的x s 的表示方法是错误的。原因就是混淆了二者的概念。当两样本均数进行比较时,正确的用法应该是x t0105( n) Sx 。15. X方检验中自由度问题答:在正态分布检验中,这里的M为N、平均数和标准差。因为我们在做正态检验时,要使用到平均数和标准差以确定该正态分布形态,此外,要计算出各个区间的理论次数,我们还需要使用到N。所以在正态分布检验中,自由度为K3。在总体分布的配合度检验中,自由度为K1。在交叉表的独立性检验和同质性检验中,自由度为(r1)(c1)。16. 卡方检验的结果,值是越大越好,还是越小越好?答:与其它检验一样,所计算出的统计量越大,在分布中越接近分布的尾端,所对应的概率值越小。如果试验设计合理、数据正确,显著或不显著都是客观反映。没有什么好与不好。17. 在比较两组数据的率是否相同时,二项分布和卡方检验有什么不同?答:卡方分布主要用于多组多类的比较,是检验研究对象总数与某一类别组的观察频数和期望频数之间是否存在显著差异,要求每格中频数不小于5,如果小于5则合并相邻组。二项分布则没有这个要求。如果分类中只有两类还是采用二项检验为好。如果是2*2表格可以用fisher精确检验,在小样本下效果更好。18. t检验和u检验简而言之,t检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。一、样本均数与总体均数比较的t检验样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数与已知的某一总体均数0(常为理论值或标准值)有无差别。如根据大量调查,已知健康成年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为74.2次/分,标准差为6.0次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性。上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,为此,可用t检验进行判断,检验过程如下:1.建立假设H0:=0=72次/分,H0:0,检验水准为单侧0.05。2.计算统计量进行样本均数与总体均数比较的t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术平方根的商。3.确定概率,作出判断以自由度v(样本含量n减1)查t界值表,0.025P0或d0,即差值的总体均数不为“0”,检验水准为0.05。2.计算统计量进行配对设计t检验时t值为差值均数与0之差的绝对值除以差值标准误的商,其中差值标准误为差值标准差除以样本含量算术平方根的商。3.确定概率,作出判断以自由度v(对子数减1)查t界值表,若P=0.05,则还不能拒绝H0。三、成组设计两样本均数比较的t检验成组设计两样本均数比较的t检验又称成组比较或完全随机设计的t检验,其目的是推断两个样本分别代表的总体均数是否相等。其检验过程与上述两种t检验也没有大的差别,只是假设的表达和t值的计算公式不同。两样本均数比较的t检验,其假设一般为:H0:1=2,即两样本来自的总体均数相等,H1:12或12,即两样本来自的总体均数不相等,检验水准为0.05。计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误。应注意的是当样本含量n较大时(如大于100时)可用u检验代替t检验,此时u值的计算公式较t值的计算公式要简单的多。四、t检验的应用条件和注意事项两个小样本均数比较的t检验有以下应用条件:(1)两样本来自的总体均符合正态分布,(2)两样本来自的总体方差齐。故在进行两小样本均数比较的t检验之前,要用方差齐性检验来推断两样本代表的总体方差是否相等,方差齐性检验的方法使用F检验,其原理是看较大样本方差与较小样本方差的商是否接近“1”。若接近“1”,则可认为两样本代表的总体方差齐。判断两样本来自的总体是否符合正态分布,可用正态性检验的方法。若两样本来自的总体方差不齐,也不符合正态分布,对符合对数正态分布的资料可用其几何均数进行t检验,对其他资料可用t检验或秩和检验进行分析。19. 假设检验假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。20. 假设检验的基本思想假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P0.01或P0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。 21. 2、假设检验的基本步骤 第一步:提出检验假设(又称无效假设)和备择假设。H0:样本与总体或样本与样本间的差异是由抽样误差引起的。H1:样本与总体或样本与样本间存在本质差异。预先设定的检验水准为0.05。第二步:选定统计方法,计算出统计量的大小。根据资料的类型和特点,可分别选用t检验,u检验,秩和检验和卡方检验等。第三步:根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P值小于预先设定的检验水准,则H0成立的可能性小,即拒绝H0,若P值不小于预先设定的检验水准,则H0成立的可能性还不小,还不能拒绝H0。P值的大小一般可通过查阅相应的界值表得到。22. 3、进行假设检验应注意的问题 (1)做假设检验之前,应注意资料本身是否有可比性。(2)当差别有统计学意义时应注意这样的差别在实际应用中有无意义。(3)根据资料类型和特点选用正确的假设检验方法。(4)根据专业及经验确定是选用单侧检验还是双侧检验。(5)当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。(6)判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。(7)报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。23. 问:t检验和方差分析有何区别答:t检验适用于两个变量均数间的差异检验,多于两个变量间的均数比较要用方差分析。用于比较均值的t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即正态性和方差齐性。t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因,不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法;t检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况:不考虑t检验的应用前提,对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。24. 问:假设检验的内涵及步骤答:在假设检验中,由于随机性我们可能在决策上犯两类错误,一类是假设正确,但我们拒绝了假设,这类错误是“弃真”错误,被称为第一类错误;一类是假设不正确,但我们没拒绝假设,这类错误是“取伪”错误,被称为第二类错误。一般来说,在样本确定的情况下,任何决策无法同时避免两类错误的发生,即在避免第一类错误发生机率的同时,会增大第二类错误发生的机率;或者在避免第二类错误发生机率的同时,会增大第一类错误发生的机率。人们往往根据需要选择对那类错误进行控制,以减少发生这类错误的机率。大多数情况下,人们会控制第一类错误发生的概率。发生第一类错误的概率被称作显著性水平,一般用表示,在进行假设检验时,是通过事先给定显著性水平的值而来控制第一类错误发生的概率。在这个前提下,假设检验按下列步骤进行:1、确定假设;2、进行抽样,得到一定的数据;3、根据假设条件下,构造检验统计量,并根据抽样得到的数据计算检验统计量在这次抽样中的具体值;4、依据所构造的检验统计量的抽样分布,和给定的显著性水平,确定拒绝域及其临界值;5、比较这次抽样中检验统计量的值与临界值的大小,如果检验统计量的值在拒绝域内,则拒绝假设;到这一步,假设检验已经基本完成,但是由于检验是利用事先给定显著性水平的方法来控制犯错概率的,所以对于两个数据比较相近的假设检验,我们无法知道那一个假设更容易犯错,即我们通过这种方法只能知道根据这次抽样而犯第一类错误的最大概率(即给定的显著性水平),而无法知道具体在多大概率水平上犯错。计算P值有效的解决了这个问题,P值其实就是按照抽样分布计算的一个概率值,这个值是根据检验统计量计算出来的。通过直接比较P值与给定的显著性水平的大小就可以知道是否拒绝假设,显然这就代替了比较检验统计量的值与临界值的大小的方法。而且通过这种方法,我们还可以知道在p值小于的情况下犯第一类错误的实际概率是多少,p0.03,那么假设不被拒绝,在这种情况下,第一类错误并不会发生。25. 问:配对样本的T检验和相关样本检验有何差别?答:配对样本有同源配对(如动物实验中双胞胎)、条件配对(如相同的环境)、自身配对(如医学实验中个体的用药前后)等。在SPSS中,参数检验中的均值检验有以下几种选择,One-Samples T Test过程:进行样本均值与已知总体均值之间的差异显著性检验。Independent-Samples T Test过程:进行检验两个不相关的样本是否来自具有相同均值的总体,即独立样本T检验。Paired-Samples T Test过程:进行检验两个相关的样本是否来自具有相同均值的总体,即配对T检验。One-Way ANOVA过程:用于检验几个(三个或三个以上)不相关的组是否来自相同均值的总体,即一元方差分析,也称单因素方差分析,还可进行随后的两两比较。26. 问:如何比较两组数据之间的差异性答:从四个方面来回答,1.设计类型是完全随机设计两组数据比较,不知道数据是否是连续性变量?2.比较方法:如果数据是连续性数据,且两组数据分别服从正态分布&方差齐(方差齐性检验),则可以采用t检验,如果不服从以上条件可以采用秩和检验。3.想知道两组数据是否有明显差异?不知道这个明显差异是什么意思?是问差别有无统计学意义(即差别的概率有多大)还是两总体均数差值在哪个范围波动?如果是前者则可以用第2步可以得到P值,如果是后者,则是用均数差值的置信区间来完成的。当然两者的结果在SPSS中均可以得到。4.对以上结果SPSS的实现是:(1)t检验,analysecompare meansindependent-samples T Test (2)秩和检验,analysenoparametric Test2 independent samples27. 方差分析的假设 1.误差是随机、独立、正态的;随机是数理统计的基础,这肯定是必须的。满足正态分布的要求是因为平方和计算,F检验都建立在这个基础之上。误差项相互独立的要求是因为要保证误差的大小与它来自样本无关。一些统计书上说由于大数定理的客观存在,所以我们一般可以不去检验正态性,你不是信他的鬼话!数学只是工具,工具有工具的用法,违反了假设乱用统计检验,就像你拿刑具严刑逼供,叫熊承认自己是熊猫(这是一个笑话:从前有个美国富翁想知道熊猫是什么样子,于是第一个人去森林找,没有找到;接着有个美国警察去找,他也没有找到,他很恼火,于是他把森林一把火烧了;结果跑出来一只熊,正巧有个美国的FBI也来找熊猫,他俩把熊绑起来,痛打一顿,结果熊实在受不了严刑,于是说:“不要打了,不要打了,我是熊猫。”)统计软件就是刑具,统计方法可以是严刑逼供的方法,而研究者可以是那俩个警察和FBI。2.各样本的方差与其样本均值不相关;有些时候分布的样本均值与其方差之间存在某些相关。其原因常常就是齐次性没有满足(当然还有其他原因,这要根据具体情况看,比如理论就是这样的,那么我们就要采用非参数检验了,应该注意的是百分比数据常常是这样的,均值和方差是相关的,所以需要进行数据变换,心理测量常用的是转为标准正态分布或者对数变换,不过有更先进的这就是属于等值测量的内容了,最近写书看见过这东西,在Lisrel软件中有这东西,可惜我还不会,郁闷。)3.方差齐性性齐次性是指各样本的总体方差是相等的,即样本都来自2的同一总体。不过我们常是用样本估计总体,这个估计值是不太可能相等的,所以需要用各样本误差的加权平均来估计总体方差,而各样本方差的估计量是来自同一总体的。方差齐次性被违反常常是得到方差大的总体是显著的,方差小的就不显著了。这是错误的!4.效应满足线性可加性(additivity)呵呵我在书中可是详细的写了这个的,费了我好大功夫,一般的统计书查不到,中统的那本样本均数排序-计算q值-查q界值表判断结果。2.多个实验组与一个对照组均数间两两比较多个实验组与一个对照组均数间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q界值。33. 整个方差分析的基本步骤如下:(1)建立检验假设;H0:多个样本总体均数相等。H1:多个样本总体均数不相等或不全等。检验水准为0.05。(2)计算检验统计量F值;(3)确定P值并作出推断结果。 34. 多个样本均数的两两比较 经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。1.多个样本均数间两两比较多个样本均数间两两比较常用q检验的方法,即Newman-kueuls法,其基本步骤为:建立检验假设-样本均数排序-计算q值-查q界值表判断结果。2.多个实验组与一个对照组均数间两两比较多个实验组与一个对照组均数间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q界值表。35. F检验的几个问题,一般如何解决?1、怎么确定P值是0.05还是0.01?2、当FF0.01(dfb,dfw)时,P是0.01还是0.01还是0.01是存在显著差异?(书上P299与P310正好相反?3、在进行F检验的时候怎么确定是单侧还是双侧?1、一般都用0.05。承认存在显著差异犯错(也可以说是漏报)的代价较高时会采用0.01。这样会降低承认存在显著差异的概率。2、FF0.01(dfb,dfw)时,P0.01,存在显著差异.3、确定单测还是双测检验要根据具体的问题。当检测变量可能向两端溢处时,用双测。当只向一端溢处时,就用单测。好像书上有讲的。36. 方差齐性与多重比较方差分析的一个前提是方差齐性,可是看过了心理学报的相关文章,我所看到每一篇文章在进行方差分析的时候都没有进行齐性检验。这样做是否合在百岛上得到tongji的回答后,肯定了方差齐性已经不是方差分析必要条件的认识,但是在道理上还是不太清晰。而且也不断地从各个领域讲方差分析的章节中获得方差齐性检验的必要性,大多建议对不齐方差的变量通过box-cox变换(公认最佳变换)转化为方差齐性的变量再计算。 查找了一些书籍,得到如下系统认识,还望各位批评指正: 1、方差齐性的假定是在最小二乘估计的框架下谈的,大多数讲方差分析的教科书也都是在这个范畴(框架)内谈的,所以好像基本都同意方差分析必须要方差齐性。心理教育类的统计书更是如此,主要原因是心理教育类的研究方法总是滞后于其他自然科学;2、在广义最小二乘估计框架下,并不要求处理间方差齐性。而在spss等统计软件中已经是在广义最小二乘估计解决方差分析计算问题。所以,很多人即使对这个问题没有认识,也不影响他使用方差分析的正确性。不过,在选择多重比较方法的时候,就还需要有所取舍。在spss中陈列多重比较方法分为两个大类:一种是方差齐性下用的lsd等方法,另一类就是方差不齐时候用的方法。我对第二类目前总是苦于找不到相应的文献,tongji老师也没有给我指引文献的出处。这类文献我也询问过广州spss办事处和medstatstar,但都没有得到指引,所以也就停留在spss的help的介绍水平。如有任何线索指引,本人到是感激不尽!我想讲几点。其一是说心理学报上的,很多研究者不给出方差齐不齐性的问题,可能有这样一个默认的传统,那就是齐性了就不讲了。而不齐性呢?反正我做到现在还没有碰到不齐性的方差分析。其二就是不齐性时的计算问题。在平均数差异性检验时给出了一个总体方差不等时的计算公式,可能对探讨方差分析时的齐性检验有帮助(详见张厚粲的心理与教育统计学P242)。我很希望诸位当中的谁能依此而推导出一条适合方差分析不齐性时的计算公式,可谓一巨贡啊!方差分析有三个假定的前提条件:总体呈正态分布;变异的可加性;各处理内的方差一致。照它的假定,如果不符合这三个条件的话,那就不能做方差分析了。这个当中可能很多搞研究的人就会把自己的研究假设成是符合前提的了,也就是说他们不考虑这些前提了,你们是这样认为吗?顺便谈点个人的主观意见,既然是主观,可能就会有错误。可能就很少会出现不齐性的问题,不然不会引起学术界的讨论的?一般而言,如果在进行实验过程中,我们坚持科学的程序,那么就不会出现分析时的不齐性问题,随便胡掐一下,见笑了!最后问一个问题,方差分析有显著性差异时,我们就要进行具体的平均数比较,书上讲的比较多的是进行Q检验法,这种方法是否是最好的检验具体的平均数比较的方法,有人也提出LSD其实就是T检验法,那么从理论上说,它就比Q检验法差了,是否是这样的呢?还有DUNCAN是依据什么原理的呢?一般而言,你们是用什么方法进行这种检验的?在我所接触过的心理学界的研究者中,也有少数人注意过这个问题,但是都没有明确的认识,不知道是不是我接触的不够广,水平不够高。依我所见范畴,确实有很多的研究者即使意识到齐和不齐的问题,也就当作看不见混了过去。如果是这样默认三个前提,怎么也说不过去的吧。另外,我想说应该把哪些书做依据的问题。张厚粲、孟庆茂、冯伯麟老师的书确实有其独到的地方,但由于成书年代较早(80年代初),也没有经过修订。不符合统计最新发展的特点日益明显,也急需有修订版本或有替代的书。但可惜目前在心理和教育学界并没有出现这样一本书,所以如果我们求证一个问题也应该找那些最新出版的书作为依据。现实状况是,这个问题我求证了3年以上,但是看的大多数中文书及少数英文书(工程统计、医学统计、管理统计等大类),对待这个问题普遍都是避重就轻,最多谈不齐时候的非参数处理方法或建议进行方差齐性变换。直到翻阅最新的一些专门阐述线性模型和方差分析的书籍时,才从只言片语中获得上贴的认识,所以我也希望大家能提供进一步的线索,让我不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 早期教育泌尿生殖系统
- 2025年一建机电工程管理与实务考试机电工程技术前沿案例分析题库
- 2025年一建《机电工程管理与实务》考试模拟冲刺题库-机电工程预算编制与成本控制技巧
- 2025中介版租赁合同样本
- 2025上海市合同能源管理项目财政奖励政策
- 2025二手车买卖合同(版)
- 2025年三明货运从业资格证试题及答案
- 2025年四川年货运从业资格证考试新规
- 蛋糕预拌粉配方比例表
- 2025年驻马店货运从业资格证考试
- 春夏季疾病预防
- 二年级课间安全
- 法律、法规、规章、规范性文件和标准的区别
- 《哮喘的规范化治疗》课件
- 2025年四川省绵阳市住房公积金服务中心招聘5人历年高频重点提升(共500题)附带答案详解
- 短视频运营(初级)营销师-巨量认证考试题库(附答案)
- 社区儿童托管服务收费方案
- 初中生心理健康课件
- 2025届河北省衡水市衡水中学高考仿真模拟英语试卷含解析
- 4.1 时代的主题 课件-2024-2025学年高中政治统编版选择性必修一当代国际政治与经济
- 北京工业大学《软件工程(双语)》2023-2024学年期末试卷
评论
0/150
提交评论