




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章不同群体的差异比较第一节假设检验概述主要内容掌握假设检验的概念、基本思想和步骤;熟悉假设检验的分类;假设检验的两类错误和注意事项;正态性检验的原理和方法;了解假设检验的思维方法和数据转换的方法。7.1.1假设检验的概念、基本思想和步骤1、假设检验的原因由于个体差异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、X4、、、,不同。 因此,X1、X2不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。(2)分别所代表的总体均数不同。2、假设检验的目的判断是由于何种原因造成的不同,以做出决策。3.假设检验的思想方法假设检验是用小概率事件原理做逻辑判断的一种思想方法:通过统计学的计算分析,在某个假设(H0)条件下,发生事件A的可能性不到0.05,而在实际的研究中,一次抽样就发生了事件A,那么研究者就认为所做假设(H0)不成立。4.假设检验思想的剖析
假设检验的基本思想类似于逻辑论证的反证法。它的程序是在检验一个假设是否成立时,先假定这个假设成立,如果由此导出一个不合理的现象(出理了小概率事件),就拒绝这个假设;如果没有导出不合理的现象(未出理小概率事件),则不能拒绝原来假设。数学中逻辑论的反证法是由假设推导出与公理、定理或已知条件相矛盾的结论。从而推翻假设。统计中的假设检验则是由假设推出一个概率事件(并不是绝对矛盾)而拒绝假设。从这里也看拒绝假设还是一个犯错误的概率。只是这个概率很小而已。5.假设检验的一般步骤一、建立假设二、确定检验水准三、选择统计分析方法及计算统计量四、求p值五、做统计结论一、建立假设假设有两种:1.检验假设或无效假设,记做H0(假设比较的样本来自相同的总体,它们的差别仅是由于抽样误差引起)2.备择假设,记做H1,即假设比较的样本的差别不是抽样误差引起的,而是来自不同的总体。如:
H0:
H1:二、确定检验水准检验水准,用希腊字母α表示。显著性水平(
)就是我们用来区分大概率事件和小概率事件的标准,是人为规定的。当某事件发生的概率小于
时,则认为该事件为小概率事件,是不太可能发生的事件。通常
取0.05或0.01。α为犯第一类错误的概率,第一类错误即为拒绝了实际上成立的H0。
三、选择统计方法和计算统计量根据资料的类型选择选择不同的统计方法,并计算不同的统计量。如两个样本均数的假设检验,样本均数与总体均数的假设检验选用t检验法,计算t值多个均数的假设检验,选用方差分析,计算F值四、求p值意义:如果总体状况和H0一致,样本信息支持H0的概率。具体来说:如果H0成立,抽得现有样本差别的概率P,亦就是现有样本差别是由于抽样原因引起的概率P。将计算得到的u值或t值与查表得到u
或t,ν,比较,得到P值的大小。如果|u|>u
或|t|>u
,则P<
;如果|u|<u
或|t|<u
,则P>
。五、推断结果(1)如果p>
,认为在检验假设H0成立的条件下,得到等于或大于现有统计量u值或t值的可能性大于
,不属于小概率事件,则不拒绝H0,差别无统计学意义,结论是不认为两总体均数不相等。
(2)如果p<
,我们认为在检验假设H0成立的条件下,得到等于或大于现有统计量u值或t值的可能性小于
,可判断为小概率事件,则拒绝H0,接受H1,差别有统计意义,结论是两总体均数不相等,或者某一总体均数大于(或小于)另一总体均数。假设检验的结果α为0.05或0.01作为检验水准是人为的,可根据需要选择。接受检验假设拒绝检验假设正确理解结论的概率性(都隐含着犯错误的可能性):(1)接受H0,拒绝H1,并非H1绝对不成立,只是H1成立的机会较小;(2)拒绝H0,接受H1,也并非绝对H0绝对不成立,也只是成立的概率较小。7.1.2假设检验的两类错误不拒绝H0拒绝H0
推断结论和两类错误实际情况
检验结果H0真
第类错误
结论正确(1—)
H0不真
结论正确(1—)第Ⅱ类错误
型错误:拒绝了实际上成立的H0,这类“弃真”错误称为
型错误,其概率大小用表示。Ⅱ
型错误:“接受”了实际上不成立的H0
,这类“存伪”错误称为Ⅱ
型错误,其概率大小用表示通常情况下Ⅱ型错误未知对于一般的假设检验:
定为0.05(或0.01),
的大小取决于H1。通常情况下,比较总体间有无差异并不知道,即H1不明确,
值的大小无法确定,也就是说,对于一般的假设检验,我们并不知道犯Ⅱ型错误的概率
有多大。
当样本容量n一定时,越小,越大;越大,越小。在实际工作中,往往通过去控制。I型错误与II型错误示意图(以单侧u检验为例)
与
间的关系减少(增加)I型错误(),将会增加(减少)II型错误(),增大n同时降低
与
ab检验效能(powerofatest)1–
称为假设检验功效,也称把握度。意义:两总体确有差别,被检出有差别的能力如:1–=0.90,则意味着当H0不成立时,理论上在每100次抽样中,在检验水准上平均有90次能拒绝H0
假设检验的注意事项一、事先进行严密的统计学设计基本原则:对照、随机、重复、均衡。没有对照就没有鉴别。随机:就是总体中的同质单位,都有同等机会被抽到,随机可以保证样本对总体有代表性,避免主管偏向性。重复:就是适当的样本含量,样本含量过少不能发现规律性,过多造成浪费,样本含量根据实验或抽样调查要求,可查表或按公式计算求得。均衡:亦就是除处理因素外,其他因素都应保持基本相同。单侧检验和双侧检验两者是研究者根据分析目的和专业知识等信息采用的两种不同检验形式。如:要了解新研制的某中药对肝炎的治疗效果。如果试验组是在西药治疗的基础上加新研制的中药,中西药的疗效不会低于西药组,就可以用单侧检验,双侧检验特别适用于对预试验结果进行分析。在同一检验水准下,单侧检验比双侧检验的界值小,单侧拒绝域比双侧的拒绝域大,比双侧检验更易得出拒绝H0,从而得出差别有统计学意义。灵活确定
水准一般取=0.05对于组间方差齐性检验或资料的正态性检验,研究者期望得到阴性结果,为了减少假阴性结果二类错误,由于一类错误和二类错误呈反比关系,取0.10,0.20或更大较为适宜。根据样本特点,选用不同假设检验方法(1)计量资料的两均数进行比较时,一般可选用t检验和u检验。对两小样本均数比较必须满足两个条件:正态性和方差齐性。(2)计数资料的率或构成比比较可选用检验(3)等级资料可选用秩和检验正确理解统计推断的意义统计推断的结论是依据现有的设计、现有的研究方法与条件、现有的资料及其分析目的和要求,所取的检验水准,所采用的统计分析方法等所做出的具有相应概率意义的解释,不宜将结论的意义扩展或缩小。假设检验的结论不能绝对化统计结论是具有概率性质的推论,不能使用“证明”、“肯定”、“一定”、“说明”等词。有统计学意义时不一定有专业意义。若样本足够大或标准差特别小,即使两均数间相差很小,也可能得出P≤0.05的结果。结合专业知识作出推论假设检验能够帮助研究者做出较合理的推断,但不能代替研究者做出专业结论。CI与假设检验的区别和联系CI推断参数值的范围;由于CI给出了具体的数量范围,即可回答差别有无显著的统计学意义,还可提示差别有无实际意义。.假设检验判断各参数间有无质的不同,可以获得较为确切的概率值。7.1.3正态性检验与数据转换对数值变量进行假设检验时应先进行正态性检验和方差齐性检验,必要时还需要对资料进行数据转换,已使资料满足数值变量资料统计方法的应用条件——正态性和方差齐性。第二节统计检验的前期工作——对数据分布特征的检验7.2.1正态性检验矩法D检验法Jarque-Bera检验图方法非参数检验方法矩法偏度系数和峰度系数偏度系数g1表示分布的对称性g1=0:对称g1>0:正偏态g1<0:负偏态峰度系数g2表示峰型g2=0:正态峰g2>0:尖峭峰g2<0:平阔峰若g1=0且g2=0则为正态分布D检验法计算步骤(频数表资料)无效假设H0:总体服从正态分布计算统计量D值其中,x
为各组组中值,f为各组频数,T
为各组平均秩次,n
为总例数查D界限值表,做出结论Jarque-Bera检验(偏度和峰度的联合分布检验法)检验统计量为JB=JB过大或过小时,拒绝原假设。图方法1、P-P图以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标,做散点图。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。
2、Q-Q图以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为直角坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。以上两种方法以Q-Q图为佳,效率较高。3、直方图,是否以钟形分布。4、箱式图,观测离群值和中位数。5、茎叶图,类似与直方图,但实质不同。7.2.2软件操作Descriptive–Explore考察“统计分析案例”的“男、女”“环境分数”的正态分布Analyze-NonparametricTest-K-s考察“统计分析案例”的“男、女”“环境分数”的正态分布,分组用Split–FileGraph-Legacy“环境分数”的正态分布,”“性别”分类,”年级聚类“第三节两个独立样本差异的显著性检验——两个群体差异的比较之一平均数差异的显著性检验方差齐性条件下,平均数差异显著性检验方差不齐性独立小样本平均数差异的显著性检验假设检验方差齐性检验总体方差未知,独立样本t检验的完整过程方差齐性条件下,平均数差异显著性检验的统计量及计算公式平均数差异的显著性检验时,统计量的基本计算公式为:H0:μ1=μ2
表示之差的标准差⑴两样本相关⑵两样本独立1.两总体正态,总体标准差已知总体标准差已知条件下,平均数之差的抽样分布服从正态分布2两总体正态,标准差未知,方差齐性,n1或n2小于30总体标准差未知条件下,平均数之差的抽样分布服从t分布。计算公式为:(1)两样本相关
还可以计算为:(2)两样本独立总体标准差未知条件下,平均数之差的抽样分布服从t分布,但样本容量较大,t分布接近于正态分布,可以以Z近似处理,因此以Z′作为检验统计量,计算公式为:
3.两总体非正态,n1和n2大于30(或50)
(1)两样本相关(2)两样本独立不能对平均数差异进行显著性检验。4.两总体非正态,小样本
方差不齐性独立小样本平均数差异的显著性检验
对于方差不齐性的独立小样本,平均数差异的显著性可能由两方面的原因造成:一是两平均数确实存在显著差异;二是两总体方差之间存在显著差异。当两总体的方差之间差异显著时,运用一般的t检验不准确,需要进行特别的检验。1.统计量及计算公式
总体方差不齐性的两个独立样本平均数之差的标准误,可用两个样本方差分别估计出的两个平均数标准误平方之和再开方来表示。这时样本平均数之差与相应总体平均数之差的离差统计量,既不是Z分布,也不是t分布,而是与t分布相近似的t′分布。
这种检验方法被称为柯克兰—柯克斯t检(Cochran
-Cox),其统计量的计算公式为:
2.t′临界值的计算公式方差齐性检验
方差齐性检验是对两总体方差是否齐性(即是否一致或是否存在显著性差异)进行的检验。方差齐性检验的统计量是F,其概率分布遵循F分布。
当总体方差未知时,对独立小样本进行t检验的完整过程有两种方式:总体方差未知,独立样本t检验的完整过程1.先做方差齐性检验方差齐性检验方差齐性方差不齐性t检验t′检验2.先按方差齐性进行差异检验方差齐性独立样本t检验差异不显著接受差异不显著的检验结论差异显著方差齐性检验方差齐性方差不齐性t′检验接受差异显著的检验结论非参数检验方法Kolmogorov-Smirnov检验(D检验)Shapiro-Wilk(W检验)Mann-WhitneyutestWald-WolfowitzrunTestMosesextremereactionstestIndependent–SampleTtest”男、女””环境变量“,演示“学习状态”cutpoint男女”环境变量‘两独立样本K-S检验,Transform-RankcasesTesttype选项应用第四节两个配对样本差异的显著性检验——两个群体差异的比较之二配对资料t检验(Paired-SamplesTTest)资料类型:两个同质对象接受不同处理;同一受试对象分别接受不同的处理,同一受试对象处理前后。条件:差值d服从正态分布。一般的,配对样本T检验用于检验两个相关的样本是否来自具有相同均值的总体,实质是检验差值变量的均值与0之间差异的显著性。计算公式Spss操作:在菜单栏中Analyze|CompareMeans|Paired-SamplesTTest非参数检验两个非正态总体的差异SigntestWilcoxonSigned-ranktestMcNemartestMarginalHomogeneitytest操作途径Analyze-NonparametricTests-2Related-Samples例子“技术培训效果比较”,前后考评分数案例11、学生对教学改革态度的分析(onesample)某校在对实行挂牌上课教学改革措施的效果评价中,随机抽选了60位学生进行态度调查,他们的10项态度量表的态度反映资料如下:挂牌上课态度反映得分(X)人数(f)10—2020—3030—4040—5050—6060—702610122010合计60案例1
(1分表示“很不同意”,7分表示“很同意”,将10项态度分累加后得一总态度分,这种量叫7级李克累加量表):试计算:(1)学生态度得分的平均值和标准差;(2)构造学生态度得分平均值的98%置信区间。操作步骤:(1)定义变量X(转换-计算变量,表达式…)和f,X为组中值,输入数据资料;(2)选择DataWeightCases,加权个案,频率变量,确定。(3)选择AnalyzeComparemeansone-sampleTTest(4)将变量X放入Test栏中(5)激活子对话框,置信度为98%,单击按钮,返回one-sampleTTest主对话框;(6)单击按钮执行。Options…ContinueOKT-Test
结论:表1:学生态度得分的平均值为47分,标准差为13.6295分.表2:以98%的置信区间估计学生总体态度得分平均值的置信区间为(42.7925,51.2075)从中可以反映出学生对挂牌上课这一教改措施普遍赞成,但并不十分拥护,可见还需进一步改进和完善.案例2___电视广告平均受益量的估计2、某电视台广告部想要估计一下各企业在该电台的黄金时间播放电视广告后的一个月内的平均受益量.为此他们抽取了33家播放广告的同类企业的随机样本,资料如下:该电视台想以95%的置信度宣布平均受益量(平均利润增长量),试构造适当的置信区间.案例2数据企业序号1234567891011利润增量(万元)7.38.67.76.59.48.37.110.25.49.28.8企业序号1213131415161718192021利润增量(万元)9.76.94.311.28.28.77.69.16.68.58.9企业序号2324252627282930313233利润增量(万元)10.412.814.67.511.76.013.213.69.05.99.6解:该电视台宣布的平均受益量应是最小受益量,故构造置信下限.设X为企业利润增量.操作步骤:
(1)定义变量X输入数据资料;(2)选择AnalyzeComparemeansone-sampleTTest(3)将变量X放入Test栏中(4)激活子对话框,置信度改为90%,单击按钮,返回one-sampleTTest主对话框;(5)单击OK按钮执行Options…ContinueT-Test结论:表1:33家平均受益量为8.8636万元,标准差为2.4027万元.表2:该项电视台可以95%的置信度宣布在该电台黄金时间做广告给企业带来的平均受益量至少在8.1552万元以上.注意:此题是作业。实例分析3___新旧电池使用寿命比较(Independent)
某一个新的制造过程可以增加电池的使用寿命,假设电池使用寿命服从正态分布.在新电池中随机抽取15个,而在旧电中随机抽取12个同时测试其使用寿命,资料如下:新旧两种电池平均使用寿命之差95%的置信区间.新电池(日):18.2\10.4\12.6\18.0\11.7\15.0\24.0\17.6\23.6\24.8\19.3\20.5\19.8\17.1\16.3旧电池(日):12.1\17.5\8.6\13.9\7.8\15.1\17.9\10.6\13.8\14.2\15.3\11.6解:已知的原始数据是总体服从正态分布的两个独立样本。设X代表电池使用寿命,g代表分组号操作步骤:(1)定义变量X和g,输入数据资料,新旧电池寿命数据全部输入X同一列中,g分别取1和2,新电池组号为1,旧电池组号为2(2)选择AnalyzeCompareMeansIndependent-SamplesTTest,打开Independent-SamplesTTest对话框(3)将变量X放入Test栏中(4)激活DefineGroups按钮,打开该对话框Groups1中输入1Groups2中输入2,单击Continue返回主对话框;(5)单击OK按钮执行T-Test结论:表1:得出两个独立样本各自的均值,标准差以及平均标准误差.新电池的平均使用寿命明显长于旧电池。表2:可以看出新旧电池平均使用寿命之差的95%的置信区间为:若两个样本方差相等则为(2.4454,8.6746);若两个样本方差不等则为(2.5437,8.5763)实例分析4___吸烟有害广告作用的分析(Paired)
形形色色的广告已深入到社会各个方面,与人民生活密不可分.成功的广告将留给人们较深的印象,并带给企业丰厚的回报,如何鉴定广告的效果,如何选择最佳的广告制作,对此西方国家更多地采用统计方法来判断,举例如下:为了研究吸烟有害广告对吸烟者减少吸烟量甚至戒烟是否有作用,从某吸烟者中随机抽取33位吸烟者,调查他们在观看广告前后的每天吸烟量(支)数据如下表.试问影片对他们的吸烟量有无产生作用?为了支持你的答案,请构造一个99%的置信区间.吸烟者编号1234567891011看前X1(支)看后X2(支)20181515141011101213161219152620221716799吸烟者编号1213141516171819202122看前X1(支)看后X2(支)1710333425208441401910263016163120271862吸烟者编号2324252627282930313233看前X1(支)看后X2(支)13112422222548504134669133827251129102821解:配对样本的试验,比较观看前后平均数的大小可解决第一个问题,求出两平均数之差的99%的双侧置信区间可解答第二个问题.操作步骤:1)定义变量X1和X2,输入数据;(2)选择AnalyzeComparemeansPaired-samplesTTest(3)将变量X1和X2放入Test栏中(4)激活Options…子对话框,置信度改为99%,单击Continue按钮,返回Paired-samplesTTest主对话框;(5)单击OK按钮执行T-Test结论:表1:显示观看影片前的平均每日吸烟量约为21.5758支.观看影片后的平均每日吸烟量约为17.5758支,说明该影片发生了作用.表2:反映了影片观看前与后存在着显著相关关系,相关系数为0.878.表3:显示了前后两个总体平均每日吸烟量之差的99%置信区间为(1.4888,6.5112),这意味着不管随机抽到哪几对样本单位做调查,均有99%的把握保证,观看影片前的平均每日吸烟量大于观看影片后的平均每日吸烟量之差在(1.4888支至6.5112支之间,即大约在2—7支之间.第五节单因素方差分析—多个群体差异的比较之一7.5.1一个完整的单因素方差分析实例Step1正态性检验Step2方差齐性检验Step3方差检验(方差分析表)Step4追踪分析:多重比较Step5区间估计理论准备方差齐性检验:理论准备方差齐性检验:理论准备方差齐性检验:“统计案例”不同年级“环境利用水平”的方差分析书本,注意“对比”contrast提高:单因素重复测量案例假设你是某个企业的HR,你观察到员工似乎在周一的情绪比较糟糕,而到了周五(周末前)则明显好转。员工私下里也会讨论什么“星期一综合症”之类的话题,于是,你找到一个调查员工快乐水平的包含20个项目(均为“是”或“否”选项)测量表,选择“是”越多表示快乐水平越高。在这个准实验设计中,自变量包含三个水平(k=3):1)星期一;2)星期三;3)星期五。你随机从公司里抽取了6(n=6)名员工来完成这个研究,最后,收集到的数据如下表所示:案例数据假设设置虚无假设表述的是工作周不同的时间点对员工心情没有影响,亦即不管在星期几,员工的心情都是一样开心的。对应的备择假设表述的是,员工的心情受到所处的工作周的时间点的影响,即H0:μ1=μ2=μ3H1:以上三个均值不全相等。下面是计算步骤:第一步:总变异分解SST=∑Xij2-(∑Xij)2/N =247.11SSBG=∑X*j2/nj-(∑Xij)2/N=31.44SSwg=SST-SSBG =215.67公式1公式2公式3第二步:移除个别差异导致的变异计算被试间的平方和。将数据中每个被试当做是一个处理,那么每个“处理”(被试)下面有三个分数,然后同样使用ANOVA中计算处理间变异的公式(在这里k=6,而每组内n=3)这个平方和提供了对个别差异的一个量度,将个别差异的变异从处理内变异中减去,就得到F比率分母部分的误差(残差)平方和。 =36.67-31.44=5.23(SSerror=SSwithin-SSbetweensubjects)各个平方和对应的自由度第一步:dft=N-1=18-1=17dfbg=k-1=3-1=2dfwg=N-k=18-3=15第二步:dfsubject=n-1=6-1=5dferror=dfwithin-dfsubject=15-5=-10计算对应的均方和F比率247.11215.6731.445.23210.440.52315.7230.06方差分析表多重比较法拒绝H0,接受H1,表示总体均数不全相等哪两两均数之间相等?哪两两均数之间不等?————>需要进一步作多重比较。方差分析结果不拒绝H0,表示拒绝总体均数相等的证据不足,
————>分析终止。
常用多重比较法
最小显著差数法(Leastsignificantdifference,简称LSD法)
水平数,每个样本的容量,都相等。
q法(又称SNK(student-Newman-Keuls)检验法)q测验方法是将r个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差LSRα值的。下面介绍2个改进的最小显著极差法
级极差的检验
Tukey法(又称honestlysignificantdifference,简称HSD
)这里显然指两个均值差异的比较,Tukey对法似乎有不同的版本。
Bonferroni法Bonferroni法是根据所比较的两个处理平均数的个数k,将检验水平缩小k倍成为真实比较水平,确定是几个平均数间的极差分别确定最小显著差数LSDα值的。由“2”知,这里显然指两个均值差异的比较。
多重比较法选择1.试验事先确定比较的标准,凡是与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法LSDa法;2.根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。参考以下观点:根据试验的侧重点选择。三种方法的显著尺度不相同,LSD法最低,HSD法次之,SNK法最高。故对于试验结论事关重大或有严格要求时,用SNK法,一般试验可采用HSD法。当比较次数不多时,Bonferroni法的效果较好;但当比较次数较多(例如在10次以上)时,则由于其检验水准选择得过低,结论偏于保守。第六节多个样本的非参数检验——多个群体差异的比较之二
6.0什么是非参数检验?和数据本身的总体分布无关的检验称为非参数检验--不假定总体的具体背景分布形式;--多根据数据观测值的相对大小建立检验统计量,然后找到在零假设下这些统计量的分布,看这些统计量的数据实现是否在零假设下属于小概率事件。t-检验、方差分析、相关、回归的显著性检验,都需要利用总体分布的信息,因此这些检验都称为参数检验而非参数检验由于不涉及总体参数,也不依赖于总体分布的形式,因此它与总体分布状况无关,因此非参数检验又称为无分布检验(distribution-freetest)非参数检验是利用样本数据之间的大小比较以及大小顺序,对2个或多个样本所属总体是否相同进行检验非参数检验常用在以下情况:(1)样本所在总体的分布状况未知,或知之甚少无法肯定总体分布的性质(2)样本观测值明显偏离正态分布,因而不具备参数检验的应用条件非参数检验具有以下优点:计算简便、直观、易于掌握、检验速度快非参数检验的效率在资料符合参数检验的条件时,非参数检验的效率始终低于参数检验法,这是因为:非参数检验法没有充分利用已知的总体分布信息也没有充分利用样本提供的信息,因而非参数检验的功效较低,犯Ⅱ型错误的可能性较大6.1多个样本的非参数检验的统计学定义和计算公式定义:多独立样本非参数检验分析样本数据是推断样本来自的多个独立总体分布是否存在显著差异。SPSS多独立样本非参数检验一般推断多个独立总体的均值或中位数是否存在显著差异。多独立样本的简判:在一个总体中抽取样本对其他总体中抽取样本没有影响。1.多独立样本的中位数检验(Median)多独立样本的中位数检验通过对多组数据的分析推断多个独立总体分布是否存在显著差异。原假设H0:样本来自的多个独立总体的中位数无显著差异。
SPSS中有3种多独立样本非参数检验方法基本思想:如果各组样本的测定数据的分布无差异,那么各组独立样本的中位数无显著差异,也就是可以说各组样本拥有共同的中位数。这个共同的中位数在每组样本中都应该处于中间位置。故可检验其中位数上下各有观察值数目的差异在各组之间是否有统计意义,从而作出统计推断。检验计算步骤以及检验统计量:1.将各组样本(A、B…)资料混合由小到大排列。求混合资料的中位数md。2.对每一样本分别计数超过共同中位数以及小于等于共同中位数的数据个数。列成表格。4.用卡方检验法或精确概率法(理论频数小于5时)进行检验。第1组样本第2组样本…第k组样本混合样本>md的个数O11(E11)O12(E12)O1k(E1k)N1≤md的个数O21(E21)O22(E22)O2k(E2k)N2O1i(O2i):第i组样本中,观测到>(≤)md的个案数。N1(N2):混合样本中,>(≤)md的个案数。N=N1+N2E1i(E2i):第i组样本中,>(≤)md的期望个案数。ni:第i组样本的样本容量。(各个子样遵从两项分布,其中的参数估计有混合样本获得。)
当Eij都大于5时,构造卡方统计量给出检验:2.多独立样本的K-W检验多独立样本的Kruskal-Waillis检验,是一种推广的平均秩检验。原假设H0:样本来自的多个独立总体的分布(的位置参数)无显著差异。基本方法:首先将多组样本数混合按升序排列,并求出每个观察值的秩,然后对各组样本的秩分别求出平均值。如果各组样本的平均秩大致相等,则可以认为多个独立总体的分布没有显著差异。如果各样本的平均秩相差很大,则不能认为多个独立总体的分布无显著差异。考察处理间平方和占总方差的比重:K-W检验统计量:K-W检验统计量:ni:第i组样本的样本容量。N:混合样本的总样本容量。:第i组样本的平均秩。:平均秩(N+1)/2。SPSS编秩的方法:Transform/rankcases此过程可以进行样本编秩,秩的累计频率等数值计算。3.多独立样本的Jonkheere-Terpstra检验多独立样本的Jonkheere-Terpstra检验用于分析样本来自的多个独立总体分布(的位置参数是否具有方向性)是否存在显著差异。原假设H0:样本来自的多个独立总体的分布无显著差异。备择假设是呈某种方向性的,要求样本的变化按此方向性进行,例如通过观察,按大小顺序编号。检验统计量:Uij:第i组样本观察值小于第j组样本观察值的个数。(从后半部分显示这里是针对可能有结的情形的。)其实,这里计算的J-T统计量是按照组号(1,2,3)。按照组序号的不同顺序可以计算出所有的J-T值,进而可以得到J-T的均值E(J)和方差D(J),于是自然的想利用渐近正态性。研究问题随机抽取3个班级的学生,得到21个学生成绩样本,如表6.2所示,问3个班级学生总体成绩是否存在显著差异?6.2SPSS中实现过程举例表6.2 3个班级学生成绩学生成绩所属班级学生成绩所属班级60.00190.00270.00196.00271.00170.00280.00185.00375.00192.00365.00197.00390.00196.00380.00288.00385.00289.00381.00280.00383.002spss实现步骤图6.2-1在菜单中选择“KIndependentSamples”命令图6.2-2“TestsforSeveralIndependentSamples”对话框设置分组变量及其取值范围。定义检验变量三种可选的检验方法同前。注意小样本情况下选择精确检验图6.2-3“SeveralIndependentSamples:DefineRange”对话框定义最小组序号和最大组序号6.3结果和讨论(1)多独立样本K-W检验结果如下两表所示。(2)多独立样本中位数检验结果如下两表所示。Oij值列表。作业中需要按照第8页ppt的表格那样注明Eij的值此时不宜参看正态近似检验。需要选择精确检验。(3)多独立样本Jonckheere-Terpstra检验结果
KindependentSamples分析“统计案例”不同年级学生的“环境利用”KRelatedSamples分析“专家组对学习教学评价”不同年级学生的“环境利用”KRelatedSamplesCochranQ“学生对教师评价”多个相关样本的非参数检验Friedman秩和检验Kruskal-Wallis检验是针对完全随机试验数据的非参数分析方法,在随机区组情形下,可以用类似的两因素秩方差分析法。Friedman秩和检验假定这些样本有连续分布F1,…,Fk,F为某连续分布函数,形式上,零假设为H0:F1=…=Fk,备选假设为Ha:Fi(x)=F(x+qi),i=1,…,k,诸参数qi并不相等(实质是关于位置qi的检验。)由于区组的影响,要首先在每一个区组中计算各个处理的秩;再把每一个处理在各区组中的秩相加.如果Rij表示在j个区组中第i个处理的秩。则秩按照处理而求得的和为
这样做的目的是在每个区组内比较处理。例如,同个年龄段中比较药品的疗效比不分年龄来比较疗效要合理;在同一个部位比较不同的材料要比混合起来比较要合理等等。Friedman秩和检验
Friedman统计量定义为第一个式子表明,如果各个处理(水平)很不一样,和的平方就会很大,结果就显著。第二个公式是为了计算方便而导出的。它有近似的(有k-1个自由度的)c2分布。
注意:当区组数较大或处理组数较小时,效果不好,需要用aligned-rankstestorHodges-_lehmmann检验。(处理间平方和出于总方差的估计值,再乘上一个校正系数(k-1)/k)Kendall协同系数检验在实践中,常需要按照某些特定的性质来多次对一些个体进行评估或排序;比如几个(m个)评估机构对一些(n个)学校进行排序。人们想要知道,这些机构的不同结果是否一致。如果很不一致,则该评估多少有些随机,意义不大。换句话说,这里想要检验的零假设是:这些对于不同学校的排序是不相关的或者是随机的;而备选假设为:这些对不同学校的排序是正相关的或者是多少一致的。Kendall协同系数检验正式提法假设k个变量,每个变量对应n个观测值,即为在中的秩。假设检验问题:Kendall协同系数检验思路一个机构对n个体的秩和为1+2+…+n=n(n+1)/2;所有m个机构对所有个体评估的总秩为mn(n+1)/2;于是每个个体的平均秩为m(n+1)/2。如果记第i个个体的m个秩和为Ri(i=1,…,n),那么,如果评估是随机的,这些Ri与平均秩的差别不会很大,反之差别会很大,也就是说下面的个体的总秩与平均秩的偏差的平方和S很大。S定义为S与Kendall协同系数(Kendall’sCoefficientofConcordance)W是成比例的(Friedman检验统计量的标准化)实际检验时,可以查零分布表在n固定,时:可以利用渐进性进行检验,对于有打结情况的数据,需要用调整公式计算。当各个个体显著不同时,若他们的秩不存在显著差异,则意味着评委的打分存在随意性,评分标准不一致(如果各个评委的评判标准是一致的,那么某个个体将获得一致的分数,也就是说,评委给出的若干个评分的秩应完全相同,这就必然会导致各个体得分的秩有较大的差异。关于二元响应的Cochran检验
前面讨论了两因子方差分析问题的Friedman秩和检验。但是当观测值只取诸如0或1两个可能值时,由于有太多同样的数目(只有0和1),排序的意义就很成问题了。Cochran1950年提出Cochran检验。零假设:各个总体分布相同(或各个处理发生概率相等)。实例:关于瓶装饮用水的调查20名顾客对4种瓶装饮用水进行了认可(记为1)和不认可(记为0)的表态。问这几种瓶装水在顾客眼中是否有区别?这里的零假设是这些瓶装水(作为处理)在(作为区组的)顾客眼中没有区别。下表是数据,每一行为20个顾客对某一饮料的20个观点(0或1)。最后一列中Ni为认可总数,而最后一行为每个顾客给出的4个观点中认可数的总和Li。最后一行的最后的元素为总认可数N。如果Ni和这些Ni的均值的差距很大,那么这些处理(水平)就很不一样了。用Ni
表示第i个处理所得到的“1”的个数,而Lj为第j个区组(第j个顾客)所给的“1”的个数,所有“1”的总数记为N。
二元响应的Cochran检验思路Cochran检验统计量(Cochran’sQ)假定有k个处理和b个区组,零假设下各处理发生的概率相等,则Ni为两项分布,大样本下,Ni近似为正态分布,
则近似卡方分布,经过一系列推理与最后的系数修正,得到Cochran’sQ:当k固定时,Q在b很大时有近似的自由度为k-1的c2分布。
Spearman秩相关检验检验问题设样本来自总体:
设是在中的秩,是在中的秩。秩的简单相关系数:
秩相关系数可简化为:检验在零假设成立时,服从自由度为的t分布。时表示正相关。在存在重复数据的时候,可以采用平均秩,节不多的时候,T仍然可以采用。在大样本情况下,可以采用正态近似进行检验:在出现打结的时候,需要使用修正公式计算。当相关检验Kendall(1938)提出一种类似于Spearman秩相关的检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 微生物培养基的配制试题及答案
- 项目沟通管理的信息流动性试题及答案
- 高分攻略的证券从业资格证试题及答案
- 2025年会计决策模型试题及答案
- 逐步提高2025年证券从业资格证考试试题及答案
- 财务深度分析案例研究试题及答案
- 2025年国际金融理财师考试的多元化投资策略试题及答案
- 专家论证施工方案的流程
- 2025年审计核心技能试题及答案
- 2024年微生物实验室的统计应用试题及答案
- 委托代签工程合同协议
- 无线网络优化技术探讨试题及答案
- 笔算加法(课件)-一年级下册数学人教版
- 鲁滨逊漂流记人物性格塑造与成长历程:八年级语文教案
- 2025年郑州信息科技职业学院单招职业适应性测试题库附答案
- 2025年安阳职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 成人原发性腹壁疝腹腔镜手术中国专家共识(2025版)解读
- 江苏省徐州市2024-2025学年五年级第二学期期中数学试题一(含答案)
- 2024年中国食品级双氧水行业调查报告
- 计算机网络试题题库单选题100道及答案
- 线上线下联动的营销推广活动方案
评论
0/150
提交评论