版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章X2检验第一节X2检验的原理—、Z2检验的假设(一)分类相互排斥,互不包容X2检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。此外,分类必须互不包容,这样,就不会出现某一观测值同时划分到更多的类别当中去的情况。(二)观测值相互独立各个被试的观测值之间彼此独立,这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时,常常会违反这个假定。当讨论列联表时,独立性假定是指变量之间的相互独立。这种情况下,这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。(三)期望次数的大小每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格的标准,当自由度等于1时,在进行X2检验时,每一个单元格的期望次数至少不应低于10,这样才能保证检验的准确性。另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽然很小,但在给以接受的标准范围内,只有一个类别的理论次数低于1。此时,一个简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避免使用近似的X2检验。二、X2检验的类别(一)配合度检验配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种X2检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。(二)独立性检验独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题。这种类型的X2检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独立),如果再加入另一个变量的影响,即探讨三个变量之间关系时,就必须使用多维列联表分析方法。同质性检验同质性检验的主要目的在于检定不同人群母总体在某一个变量的反应是否具有显著差异。当用同质性检验检测双样本在单一变量的分布情形,如果两样本没有差异,就可以说两个母总体是同质的,反之,则说这两个母总体是异质的。三、X2检验的基本公式z2是表示实测次数与理论次数(即期望次数)之间差异程度的指标,其基本数学定义是实测次数与期望次数之差的平方与期望次数的比率。X2检验就是检验实测次数与期望次数是否一致的统计方法。基本公式如下:其中f0表示实际观察次数,fe表示某理论次数。要求:fe25四、小期望次数的连续性校正第一,单元格合并法。若有一格或多个单元格的期望次数小于5时,在配合研究目的情况下,可适当调整变量的分类方式,将部分单元格予以合并。第二,增加样本数。如果研究者无法改变变量的分类方式,又想获得有效样本,最佳的方法是直接增加样本数来提高期望次数。第三,去除样本法。如果样本无法增加,次数偏低的类别又不具有分析与研究价值时,可以将该类被试除去,但研究的结论不能推论到这些被除去的母总体中。第四,使用校正公式。在2x2的列联表检验中,若单元格的期望次数低于10但高于5,可使用耶茨校正(Yates’correctionforcontinuity)公式来加以校正。若期望次数低于5时,或样本总人数低于20时,则应使用费舍精确概率检验^Fisher’sexactprobabilitytest)。当单元格内容牵涉到重复测量设计时(例如前后测设计),则可使用麦内玛检验(McNemartest)。第二节配合度检验配合度检验(goodnessoffittest)主要用于检验单一变量的实际观察次数分布与某理论次数是否有差别。由于它检验的内容仅涉及一个因素多项分类的计数资料,故可以说是一种单因素检验(One-waytest)。一、配合度检验的一般问题
建立假设H0:f=fe°"在Z2检验中,理论(或期望)次数的确定就取决于这种比例的假设。*2的临界值是在H0成立的条件下导出理论分布,并由*2公式计算出来的。若实际计算出的*2值大于理论上的临界值*d)0.05,即*2>*(df)0.05则说在以=0,05的显著水平上拒绝H0。自由度的确定原则自由度确定的一般原则是:以相互独立的类别数*(或C)减去所受的限制数M,即£f=£f0edf=k-M£f=£f0e的限制,在各种适合性检验中,如果理论次数只受到总和的限制,即受df=k-1则自由度为在正态分布的适合性检验,因其除了受^f0=£fe的限制以外,还受理论分布的均数和标准差两个未知参数的限制,即受到三个条件的限制,其自由度为df的限制,df=k-1理论次数的计算规则(.一是数据分布有其理论概率为依据,这时的理论次数^e等于总次数乘以某种属性出现的概率(P),即fe=Np理论次数的计算,一般是根据某种理论,按一定的概率通过样本即实际观察次数计算。某种理论有经验概率,也有理论概率,如二项分布、正态分布等理论概率。二、配合度检验的应用(一)检验无差假说这里讲的无差假说,是指各项分类的实计数之间没有差异,也就是假设,各项分类之间的几会相等,或概率相等,因此理论次数完全按概率相等的条件计算。即:1理论次数二总数X分类项数例10-1:随机抽取60名学生,询问他们在高中是否需要文理分科,赞成分科的39人,反对分科的21人,问他们对分科的意见是否有显著差异?解:1)建立假设H:f=fH:f=fH0:f卜f2)计算统计量f=60x-=30X2=S^ff-e(39-30)2*(21-30)23030(赞成与反对的人数相等)(赞成与反对的人数不相等)92+(-9)2=5.4303)进行统计决策查X2表,当查X2表,当df=1时X0.05=3.84,X20.01=6.63,因为x2=5.4,X2vX2<X2,0.050.01所以,0.01vpV0.05。达到显著性水平,拒绝原假设。说明两种态度有显著差异。例10-2:某项民意测验,答案有同意、不置可否、不同意三种。调查了48人,结果同意的24人,不置可否的12人,不同意的12人。问持这三种意见的人数是否有显著不同?=48x13=16e'解:此题为检验无差假说,已知分类的项数为三,故各项分类假设实计数相等。所以p=—,N=48,f=48x13=16e'1)建立假设H0:f=fH:f”2)计算统计量(24-16)2(12-(24-16)2(12-16)2(12-16)2X2=++=61616163)进行统计决策,所以查X2表,当df=3-1=2时,X2=5.99,因为X2=6〉X2—0.050.05Pv0.05。达到显著性水平,拒绝原假设。说明三种态度有显著差异。,所以(二)检验假设分布的概率假设某因素各项分类的次数分布为正态,检验实计数与理论上期望的结果之间是否有差
异。因为已假定所观察的资料是按正态分布的,故其理论次数的计算应按正态分布概率,分别计算各项分类的理论次数。具体方法是先按正态分布理论计算各项分类应有的概率再乘以总数,便得到各项分类的理论次数。如果不是事先假定所观察的资料为正态分布而是其他分布,如二项分布、泊松分布等,其概率应按各所假定的分布计算。事先假定的分布不是理论分布而是经验分布,亦可按此经验分布计算概率,在乘以总数便可得到理论次数,从而进一步检验假设分布与实计数的分布之间,亦即实计数与理论次数之间差异是否显著。例10-3:某班有学生50人,体检结果按一定标准划分为甲乙丙三类,其中甲类16人,乙类24人,丙类10人,问该班学生的身体状况是否符合正态分布?解:该题中的理论次数应按假设的正态分布概率计算。按正态分布,就可以认为土勿包括了全体,各等级所占的横坐标应该相同(衍:3=星),故各类人数应占的比率为:甲级:%〜1。之间,曲线下的面积应为0.50-0.3413=0.1587乙级:1。〜-1。之间,曲线下的面积应为0.3413x2=0.6826丙级:-1。〜-3。之间,曲线下的面积应为0.50-0.3413=0.1587各等级的理论次数为:f=0.1587x50牝8e甲f=0.6826x50=34e乙f=0.1587x50牝8e丙1)建立假设H0:学生的身体状况符合正态分布H"学生的身体状况不符合正态分布2)计算统计量(16-8)2(16-8)28(24-34)2(10-8)2++834=11.443)进行统计决策当df=3-1=2时,X2=10.6,X2>X2,所以达到显著性水平,拒绝原假设。0.050.05说明学生身体状况不符合正态分布。例10-4:根据以往的经验,某校长认为高中生升学的男女比例为2:1,今年的升学情况是男生85人,女生35人,问今年升学的男女比例是否符合该校长的经验?解:此题是假设男女生升学的人数分布与校长的经验分布相同,故理论次数应按经验分
布的概率计算理论次数为:/=(85+35)x2,;=80/=(85+35)x%=40e男e女1)建立假设H0:男女升学比例符合校长经验H1:男女升学比例不符合校长经验2)计算统计量(85-80)2(35-40)2八命40X2=+=0.9480403)进行统计决策当df=2-1时,X005=3.84,因为X2<X005,故差异不显著。接受原假设。说明男女升学比例符合校长经验。三、连续变量分布的吻合性检验(自学)对于连续性数据总体分布的检验,一种方法是将测量数据整理成次数分布表,画出次数分布曲线图,根据次数分布曲线,判断选择恰当的理论分布。有时可选择某一直线或曲线的理论分布函数方程式计算理论次数,然后把实际分组次数(f0)和理论次数(fe)代入检验的基本公式,计算X2值查X2表,确定其差异是否显著。若差异显著,说明实际次数分布于所选择的理论次数分布不吻合,这时可另选择理论分布函数,再次比较,直至吻合,这个理论分布函数就是该实际测量的次数分布函数。若差异不显著则说明所选的理论次数分布于实际次数分布吻合。对连续随机变量分布的吻合性检验,关键的步骤是计算理论次数与确定自由度。理论次数的计算是把实际次数分布的统计量代入所选的理论分布函数方程,计算各分组区间的理论频率,然后乘以总数得到各分组区间的理论次数。确定自由度时是将分组的数目减去计算理论次数是所用统计量的数目。下面以正态分布吻合性检验为例,说明理论次数的计算与自由度的确定。例10-5:表10-1所列资料是552名中学生的身高次数分布,问这些学生的身高分布是否符合正态分布。解:(1)本题要求检验实际次数分布与正态分布是否符合,它的理论次数计算应该根据正态分布概率,查正态曲线表得到。一般地,这一类问题计算理论次数的方法有两种。第一种方法的具体步骤包括:①求各分组区间组中值%c与平均数的离差x;②求各is离差的Z分数;③根据Z分数查正态表求y值;④将y值乘以(以Z分数为单位的组间距),得到按正态分布各分组区间的概率p;⑤求各组的理论次数f=pxN。e第二种方法的步骤是:①求各分组精确上、下限的Z分数,z=组限—平均数;②查标准差正态表求各Z分数的概率;③求各分组区间的概率;用精确上限查到的概率值减去精确下线查到的概率值,这是平均数以上各分组区间的求法。若用平均数以下各分组区间则与此相反;④用各组区间的概率乘以总数,求出各组的理论次数,即f=pxN。e下表是按照第一种方法计算理论次数的过程。身高分组Xcf0xZypfe(f0fe169-170215.383.030.00400.002371}0.125166-167712.382.440.00200.012017163-164229.381.850.07200.04260240.167160-161576.381.260.18400.10888600.150157-1581103.380.670.31870.188581040.471154-1551240.380.070.39790.235441300.277151-152112-2.26-0.520.34840.206151140.035148-14980-5.26-1.110.21540.12746701.429145-14625-8.26-1.700.09400.05562311.161142-1438-11.26-2.290.02890.017109}0.090139-1404-14.26-2.880.00670.003962N=552X=154.62s=5.07Xfe=552x2=3.905(2)有了各组的理论次数与实际次数,代人X2基本公式,得到咒2=3.9°5。(3)确定自由度。本题共分11组,在计算理论次数时,为了克服由于分组最高组和最低组两极端次数太少络带来的影响,进行了组别合并。一般合并分组的原则是当f小e于5时,就应合并。合并后为9组。在计算理论次数的过程中共用到平均数、标准差、总数三个统计量,故本题的自由度df=9-3=6(4)查X2值表。当#=6时X2=3.45,X2=5.35,用内插法计算得X2=3.905,0.750.500.6938X2VXj®,故差异不显著。答:552名中学生的身高分布符合正态分布。第三节独立性检验独立性检验主要用于两个或两个以上因素多项分类的计数资料分析,也就是研究两类变量之间的关联性和依存性问题。如果要研究的两个因素(又称自变量)或两个以上因素之间是否具有独立性,或有无关联的,或有无“交互作用”的存在,就要独立性检验。其目的在于检验从样本得到的两个变量的观测值,是否具有特殊的关联。一、独立性检验的一般问题与步骤(一)统计假设独立性检验的虚无假设是二因素(或多因素)之间是独立的或无关联的,备择假设则是二因素(或多因素)之间有关联或者说差异显著。一般多用文字叙述而很少用统计符号表示。(二)理论次数的计算独立性检验的理论次数是假设两个变量没有关联的情况下推算出来的。二变量或称两样本其各行或各列数目的和,即每一项分类的数目与总数(N)的比值,提供了样本的比率。f=eN(三)自由度的确定两因素列联表自由度与两因素各自的分类项数有关。设R为每一行的分类项数,C为每一列的分类数目,则自由度为:df=(R-1)(C-1)(四)统计方法的选择一般应用独立性检验的场合,独立样本居多用X2检验的基本公式计算:穴2_£(fff,)2e简捷式:f2X2=N(S-f―f--1)(五)结果及解释查df为(R-1)(C-1)时确定X2临界值,如果X2<X0.05⑵或X201,则接受原假设,说明两个因素无关联,或者两个因素独立。当X2〉X2()或X,则拒绝原假设,说明两个因素有关联,或者两个因素不独立..J-二、四格表独立性检验(一)独立样本四格表检验计算公式:N(AD—BC)2X2=(A+B)(C+D)(A+C)(B+D)式中A,B,C,D分别为四格表内各格的实计数,(A+B),(C+D),(A+C),(D+B)为各边缘次数,自由度cf=1。四格表各单元格表示方式具体见表如下所示:因素A分类1分类2分类1ABA+B因素B分类2CDC+DA+CB+DN=A+B+C+D例10-7:随机抽取90人,按男女不同性别分类,将学生成绩分为中等以上中等以下两类,结果如下。问男女生在学业水平是是否有关联?学业水平中等以上中等以下性男23(A)17(B)_40(A+B)别女28(C)22(D)_50(C+D)51(A+C)39(B+D)90解:1)建立假设H0:男女生在学业成绩上没有关联H"男女生在学业成绩上有关联计算统计量X2二(23x22-17x28)2x90八==0.0203640x50x51x39进行统计决策查X2表,当df=1时,先205⑴=3.84,Z2<又(205,所以接受原假设,说明男女生在学业成绩上没有关联。在2x2列联表中若某格的理论次数小于5,—般需要进行耶茨校正,其校正公式为N\ad-bC-?j
3+b凡+d)a+c旃+d)例10-8:今对一广告的态度调查,随机抽20名被试对该广告进行评价。试问对广告的偏好与性别有无关联?表10-1被试对广告的评价表
不好男7£9151812不好男7£91518122020x[|7x3-9x1|-20T7200=°.01=I2J8x12x15x5=0.01<")0.05=3.484.说明对广告的偏好与性别没有关联。7200=°.013)X2与%的关系在2x2列联表的独立样本X2检验中,不仅可以检验两种变量的相倚关系,而且还可以对“二分变量''的叩相关系数进行显著性检验。只要X2检验结果是显著的,就可以检验%是否与零相关的虚无假设有显著的差别,这是因为二者之存在着以下关系:z2=N%,即x2是七系数的函数。_:X2W'N2.相关样本的X2检验(二)相关样本四格表检验检验公式为:(A-D)2
A+D例10-8:100名学生先后测验两次,结果如下:测验1错对测验2对5(A)55(B)一60(A+B)错25(C)15(D)一40(C+D)30(A+C)70(B+D)100解:1)建立假设丑。:两次测验分数无显著关系Ha:两次测验分数有显著关系2)计算统计量
(a-d*%2=a+d(a-d*_(5-15)2_-5+15一查%2值表,当df=1时,有h05=3-84%.01=6.63。因为%2=5>查%2值表,当df=1时,有h05=3-84%.01=6.63。因为%2=5>%2)0.05=3,84,p<0.05,相关显著。所以,拒绝虚
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 20042.5-2024质子交换膜燃料电池第5部分:膜电极测试方法
- 二零二五版瓷砖行业展会赞助合同3篇
- 2024泰州旅游行业员工劳动合同标准范本2篇
- 2024标的为800万元的物流服务合同
- 2025年度绿色节能产品展销会参展服务合同书3篇
- 二零二五年度高层管理人才派遣服务合同2篇
- 2025年度集装箱金融服务合同含融资与结算3篇
- 2024版纱窗订购合同范本
- 2025年度钢材企业兼并收购合同2篇
- 2024版担保个人借款协议
- 2024年中考复习-数学(广州专用)(解析版)
- 第三十六届全国电力行业风力发电运行检修职业技能竞赛基础理论题库附有答案
- 2024年纪检监察综合业务知识题库含答案(研优卷)
- 科室医疗质量与安全管理小组工作制度
- 中华民族共同体概论课件第五讲大一统与中华民族共同体初步形成(秦汉时期)
- 初二生地会考试卷及答案-文档
- 私营企业廉洁培训课件
- 施工单位值班人员安全交底和要求
- 中国保险用户需求趋势洞察报告
- 数字化转型指南 星展银行如何成为“全球最佳银行”
- 中餐烹饪技法大全
评论
0/150
提交评论