22列联表资料的流程相关与应用_第1页
22列联表资料的流程相关与应用_第2页
22列联表资料的流程相关与应用_第3页
22列联表资料的流程相关与应用_第4页
22列联表资料的流程相关与应用_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

22列联表资料的流程相关与应用

列联系数计算群体相关性,也称为联合表相关性,是列联表中显示的特殊类型的相关性。列联表中的行和列分别代表两个分类变量。其中列代表第一个分类变量,行代表第二个分类变量。两个分类变量可以分别是无序分类变量如二项分类或多项分类变量,也可以是有序分类变量即等级资料。列联表中的数据一般为频数或例数。进行行列相关的测度有多种指标,这些指标称为列联系数。用英文大写字母R表示。它们的应用条件有所不同,其基本计算步骤及方法如下。(1)首先,根据研究目的及原始资料的特点和性质列出列联表,计算χ2值。根据χ2值大小判断P值。如果P≤α(一般取α=0.05,或α=0.01),认为行变量与列变量存在相关关系。此时,应该进一步作行列相关的测度。如果P>α,可以认为行变量与列变量无相关关系,不必再作行列相关的测度。(2)根据资料及列联表的特点,选择适当的行列相关的测度指标,计算列联系数R值。(3)根据列联系数R值的大小,判断其相关程度及方向。列联系数的取值范围一般为-1.0~+1.0,有的为0~+1.0。一般的判断标准如下:弱相关:|R|<0.2低度相关:0.2≤|R|<0.4中度相关:0.4≤|R|<0.7高度相关:|R|≥0.7注意:R值取负值时,为负相关;R值取正值时,为正相关。当R值<0.2时为弱相关,所求指标的实际意义可能不大。应根据资料的实际情况作出判断,下结论应较为慎重。22列1.ad、bc和b.b的相关主要用于2×2列联表或称四格表资料的行列相关测度(表1)。其取值范围为:-1.0~+1.0。可以反映行列相关的程度和方向。公式为:R1=ad-bc√(a+b)(c+d)(a+c)(b+d)(1)R1=ad−bc(a+b)(c+d)(a+c)(b+d)√(1)2×2列联表模式见表1。当ad>bc时为正相关,ad<bc时为负相关。当ad≈bc时为零相关,此时,作χ2检验,则P>α,无行列相关。[例1]研究人员调查125名白领工人受到性骚扰的情况,数据见表2。试分析不同的性别与性骚扰发生率之间有无相关关系。计算步骤如下:(1)本例:χ2=34.19,P<0.01。行列两变量存在相关关系。(2)计算Φ系数:R1=ad-bc√(a+b)(c+d)(a+c)(b+d)=10×20-40×55√50×75×65×60=-0.5230R1=ad−bc(a+b)(c+d)(a+c)(b+d)√=10×20−40×5550×75×65×60√=−0.5230(3)判断:Φ系数即R1=-0.5230,为中度负相关。可以认为不同的性别与受到性骚扰的发生率之间存在相关关系。就本例的具体情况而言,男性受到的性骚扰发生率低于女性。注意:由于R1的正负值决定于ad与bc的大小,故正负相关反映的只是男性或女性受到性骚扰的比例的大小。2.ndall、r3的计算应用条件及意义与Φ系数相同。应注意:计算的R2值和R3值的绝对值与Φ系数有一定差异,其中R2值稍偏大,R3值与Φ系数较接近。这两个指标一般应用较少,可作为参考。Yule和Kendall在1950年提出下式:R2=ad-bcad+bc(2)R2=ad−bcad+bc(2)Ives和Gibbons在1950年提出下式:R3=(a+d)-(b+c)a+b+c+d(3)R3=(a+d)−(b+c)a+b+c+d(3)应用表2数据计算,有:R2=10×20-40×5510×20+40×55=-0.8333R3=(10+20)-(40+55)10+20+40+55=-0.52R2=10×20−40×5510×20+40×55=−0.8333R3=(10+20)−(40+55)10+20+40+55=−0.52rc列1.居住地区家庭对家庭满意程度的相关分析主要用于r×c列联表资料。其中r或c中至少有一个变量的分类数大于或等于2,而另一个变量的分类数至少应大于或等于3。即r×c至少应为2×3或3×2。计算公式为:R4=√χ2Ν(q-1)(4)R4=χ2N(q−1)−−−−−√(4)式中:R4为Cramer列联系数,χ2为卡方值,N为列联表中的总例数。q为较小的行数(r)或列数(c)。如3×4列联表,其最小行数为3,则q=3。3×2列联表,其最小列数为2,则q=2。R4值在0~1.0范围内,R4接近1.0表示高度行列相关,接近0表示相关很弱或无相关。[例2]研究人员调查230户家庭对居住地区的满意程度。资料见表3。试分析居住地区与家庭满意程度之间有无相关关系。计算步骤及方法:(1)本例:χ2=53.178,P<0.01。行列两变量存在相关关系。(2)计算Cramer列联系数代入数据,有:R4=√χ2Ν(q-1)=√53.178230(3-1)=0.34R4=χ2N(q−1)−−−−−√=53.178230(3−1)−−−−−−√=0.34(3)判断:R4=0.34,为低度相关。可以认为不同居住地区与家庭满意程度之间存在相关关系。根据本资料具体情况,可以认为,居住在农村的家庭满意程度高于城市。2.其他rc列的连接数(1)佩斯特列出的连接数由西格勒1973年和mcnemar196年提出R5=√χ2Ν+χ2(5)(2)20世纪50年代,朱勒和赫克提出了平均距离指数的连接数R6=χ2Ν(6)(3)craur列联系数R7=√χ2Ν√(r-1)(c-1)(7)将例2的数据代入上述三个公式,有:R5=√53.178230+53.178=0.4333R6=53.178230=0.2312R7=√53.178230√(3-1)(3-1)=0.3400注意:R5,R6,R7这三个列联系数不太常用,对于同一资料的计算结果,与Cramer列联系数或大或小有一定差别。仅作为参考指标或方法。观察对象的选取1.Goodman-KruskalG系数当r或c大于2,资料有顺序性即等级资料时,也可用Goodman-Kruskal系数表示两变量的相关程度,其取值范围为-1.0~+1.0,判断其相关程度及方向,与列联系数R值相同。该系数的样本指标用G表示,总体指标用γ表示。设有两个变量X和Y,两者均为等级资料。X取值为X1,X2,…,Xr,由小到大排序为X1<X2<…<Xr。同样,Y取值并排序为Y1,Y2,…,Yc。X的取值排秩次为1,2,…,r,Y的取值排秩次为1,2,…,c,并以秩次r和c作为列联表的行和列。如表4所示。如果一个观察对象所取X值的秩次为1,而其Y值的秩次也为1,则放入列联表的第1,1格子中,如果一个观察对象所取X值的秩次为2,其Y值的秩次为3,则放入第2,3格子中,余类推。则N个观察对象可放入到所有i,j个格子中去。令N对数据中,每对数据的X和Y值顺序一致的个数为P,顺序不一致的个数为Q,则相关的测度的总体指标为:γ=ΡΡ+Q-QΡ+Q=Ρ-QΡ+Q(8)样本统计量为:G=Ρ-QΡ+Q(9)为了计算G系数,首先计算出值P和Q值。计算P值的方法和步骤如下。(1)将列联表左上角N11格子中的频数作为乘数P1。(2)将列联表中不与P1同行同列的右下方的格子中的剩余频数加起来称为合计P1。(3)计算:乘积P1=(乘数P1)×(合计P1)(4)将与P1同行的下一个格子的频数作为乘数P2,将表中P2右下方的格子频数加起来作为合计P2。(5)计算:乘积P2=(乘数P2)×(合计P2)(6)继续步骤(1)到(5)直到各行和各列全部计算结束。(7)将各乘积P1,P2,…相加,即为P值。计算Q值的方法和步骤如下。(1)以列联表右上角的第一个格子频数作为乘数Q1。(2)将不与Q1同行同列的左下方的格子中频数加起来作为合计Q1。(3)计算:乘积Q1=(乘数Q1)×(合计Q1)(4)重复步骤(1)到(3)计算Q2、Q3等,直到把各行各列全部计算结束。(5)将各乘积Q1,Q2,…相加则为Q值。[例3]调查某医院180件医用设备的价格和质量之间的关系。数据如表5所示。试用G系数表示价格和质量之间的相关强度。计算方法及步骤如下。(1)本例:χ2=25.37,P<0.01,行列两变量之间存在相关关系。(2)计算P值:P1=20(45+19+17+29)=2200P2=13(19+29)=624P3=15(17+29)=690P4=45(29)=1305P=P1+P2+P3+P4=2200+624+690+1305=4819(3)计算Q值Q1=12(15+45+10+17)=1044Q2=13(15+10)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论