列联表资料的SPSS分析_第1页
列联表资料的SPSS分析_第2页
列联表资料的SPSS分析_第3页
列联表资料的SPSS分析_第4页
列联表资料的SPSS分析_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

列联表资料的SPSS分析

在实验研究与基础实验研究中,所分析的指标可以是定量的,也可以是定性的。其定量指标,有时也转化成定性资料进行分析。这些定性资料或由定量资料转化而来的定性资料,一般都整理成列联表形式,根据资料性质和分析目的选择恰当的分析方法进行统计分析,并将统计分析结果与专业知识相结合,做出合理的解释。我们以实验研究列联表资料实例,运用SPSS软件包进行统计分析,对操作过程和结果解释予以详细说明,希望能给大家提供借鉴。1

一、一般四格表(2×2列联表)资料实验研究一般四格表(2×2列联表)资料分析目的主要有2个,一是分析两个比率总体的差别有无统计学意义或两样本某指标的分布(或构成)总体是否相同,二是分析两个分类特征是否有关联。例1.

某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效,将200例颅内压增高患者随机分为2组,见表1。表1试验组和对照组降低颅内压疗效的比较组别有效无效有效率(%)合计试验组99595.20104对照组752178.1396合计1742687.002002

数据录入:打开SPSS;点击VariableView定义变量,变量1Name为“group”,Type为“String”;变量2Name为“effect”,Type为“String”;变量3Name为“count”;Type为“Numeric”,Decimals为“0”,其它为默认设置;点击DataView输入数据。

分析过程:

①频数加权(所有列联表资料均需经过频数加权,以下例题分析中省略该过程):

Data→WeightCasesWeightCasesby:

FrequencyVariable:countOK3

②分析:

Analyze→DescriptiveStatistics→CrosstabsRows:groupColumns:effectStatistics:√Chi-square:ContinueOK4

主要结果与解释:根据2×2表资料

2

检验的应用条件:①总例数(n)≥40且所有的理论值(T)≥5时,选用一般的

2

检验;P≈

时,改用Fisher确切概率法;②n≥40,有1≤T≤5时,选用连续校正的检验;或改用Fisher确切概率法;③n<40,或T<1时,用Fisher确切概率法。该资料n大于40,所有T

均大于5,可取Pearson

2

值和似然比(Likelihoodratio)

2值,二者

2

值分别为12.123和12.864,P<0.01,试验组和对照组的疗效差别有统计学意义,可认为异梨醇口服液降低颅内压的疗效优于氢氯噻嗪+地塞米松。5

例2.

一项关于婴儿喂养方式与腹泻关系的研究,资料如表2;试分析腹泻与喂养方式间是否有关联。表2婴儿喂养方式与腹泻的关系喂养方式有腹泻无腹泻人工母乳301710256

数据录入:

定义变量,变量1Name为“method”,变量2Name为“result”,变量3Name为“count”,Type均为“Numeric”,Decimals均为“0”,其它为默认设置;

输入数据,method:1为“人工喂养”,2为“母乳喂养”;result:1为“有腹泻”,2为“无腹泻”。

分析过程:

Analyze→DescriptiveStatistics→CrosstabsRows:methodColumns:resultStatistics:√Chi-square,√ContingencycoefficientContinueOK7

主要结果与解释:这里,n>40,且所有T>5,取Pearson

2

检验结果,

2=9.981,P<0.01,可认为婴儿腹泻与喂养方式有关联;Pearson列联系数C=0.329,根据C≥0.7为高度关联、C≥0.4为中度关联、C<0.4为低度关联的判断原则,二者关联强度较弱。8

二、配对四格表(2×2列联表)资料

例3.

某研究者对同一批标本进行两个指标的检测,结果见表3。问:①两个指标的分布有无差别?②两个指标有无关联?表3同一批标本两个指标的检测结果

甲指标乙指标+-+-21734231629

数据录入:

定义变量,变量1Name为“A”,变量2Name为“B”,变量3Name为“count”,Type均为“Numeric”,Decimals均为“0”,其它为默认设置;

输入数据,A=1、B=1:甲指标“+”、乙指标“+”;A=1、B=2:甲指标“+”、乙指标“-”;A=2、B=1:甲指标“-”、乙指标“+”;A=2、B=2:甲指标“-”、乙指标“-”。

分析过程:

Analyze→DescriptiveStatistics→CrosstabsRows:AColumns:BStatistics:√Chi–square,√Contingencycoefficient,√McNemarContinueOK10

主要结果与解释:

McNemar

2

检验(SPSSMcNemar检验法不给

2

值),P=0.185,说明两个指标分布的差别无统计学意义;一般

2

检验,Pearson

2=235.821,P<0.01,说明两个指标存在关联,Pearson列联系数C=0.592,关联程度中等。11

例4.

某研究者用胃镜和活检对1321例患者进行胃癌检查,结果见表4。问胃镜和活检的结果是否一致?表41321例患者胃镜和活检结果胃镜活检+-+-143448112612

数据录入:同例3。

分析过程:

Analyze→DescriptiveStatistics→CrosstabsRows:AColumns:BStatistics:√Kappa,√McNemar,ContinueOK13

主要结果与解释:

McNemar检验,P<0.01,说明两种检查方法有差别;Kappa检验(SPSS不给可信区间),Kappa=0.824,P<0.01,说明两种检查具有较好的一致性。可以看出,两种检验结果是矛盾的。为什么呢?McNemar法一般用于样本含量n

不太大的资料,因只考虑结果不一致的情况,而未考虑样本含量

n

和结果一致的情况,所以,当

n

很大且结果一致率高时,不一致的数值相对较小,容易出现有统计学意义的检验结果,但实际意义可能不大。本例即是如此,应以一致性检验结果为准。实际上,对于两种检验(查)方法或诊断方法结果进行分析时,主要分析的也就是一致性。根据Kappa值判断一致性强度的标准尚有争议,一般认为:Kappa值<0.4时,一致性较差;在0.4~0.75之间有中度至高度一致性;>0.75时,有极好的一致性。14

三、R×C表资料

1.双向无序R×C表资料

例5.

某医生研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表5,问三种疗法的有效率有无差别?表5三种疗法治疗周围性面神经麻痹的疗效疗法有效无效合计有效率(%)物理疗法药物疗法外用膏药1991641187182626018214496.6090.1181.94合计4815153290.4115

数据录入与分析过程,见例1。

主要结果与解释:该资料的原因变量(疗法)与结果变量(有效与无效)均无序,属双向无序R×C表资料,选用一般

2

检验分析即可。R×C表资料

2

检验时,要求所有T≥1且T<5的格子数不超过总格子数的1/5,否则:①增加样本含量以增大理论频数;②根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并;③改用Fisher确切概率。这里,所有T>5,取Pearson

2

值或似然比

2

值,

2=21.038(或21.559),P<0.01,认为3种疗法有效率的差别有统计学意义。16

例6.

测得某地5801人的ABO血型和MN血型结果,问两种血型系统之间是否有关联?表6某地5801人ABO血型和MN血型分布ABO血型MN血型合计MNMNOABAB43138849513849041058717990280095032182315982032348合计145116662684580117

数据录入与分析过程:

见例2。

主要结果与解释:所有T>5,

2=213.162(或248.143),P<0.01,认为该地ABO血型和MN血型系统之间有关联。列联系数C=0.188,关联性很弱。18

2.单向有序R×C表资料

例7

某医生用3种药物治疗某病患者,疗效如表7。问3种药物的疗效有无差别?表73种药物对某病患者的疗效药物种类治愈显效好转无效合计ABC154149915315045522241008585合计207312651270192024/6/2520

数据录入:定义变量,变量1Name为“medicine”,变量2Name为“result”,变量3Name为“count”,Type均为“Numeric”,Decimals均为“0”,其它为默认设置;

输入数据:

medicine:1为“A药”,2为“B药”,3为“C药”,result:1为“治愈”,2为“显效”,3为“好转”,4为“无效”。21分析过程:

Analyze→Nonparametrictests→KIndependentSamplesTestVariableList:resultGroupingVariable:medicineDefineRange:RangeforGroupingVariable:Minimum:1;Maximum:3;Continue√Kruskal-WallisHOK22

主要结果与解释:该资料原因变量“药物种类”属于无序变量,而结果变量“疗效”属于有序变量;可以选用秩和检验、Ridit分析或有序变量的Logistic回归分析,本例选用秩和检验分析。结果,

2(Hc)=61.146,P<0.01,说明3种药物的疗效差别有统计学意义。23

3.双向有序且属性不同R×C表资料

例8

某研究者对不同肥胖程度的高血压患者进行治疗,观察患者血压控制情况,试作分析。表8不同肥胖程度高血压患者的血压控制情况肥胖程度血压控制情况合计良好尚可不良不肥胖轻度肥胖中/重度肥胖154202421312711511344合计39393010824

数据录入:定义变量,变量1Name为“fat”,变量2Name为“control”,变量3Name为“count”,Type均为“Numeric”,Decimals均为“0”,其它为默认设置;输入数据,fat:1为“不肥胖”,2为“轻度肥胖”,3为“中/重度肥胖”;result:1为“良好”,2为“尚可”,3为“不良”。25分析过程:

Analyze→DescriptiveStatistics→CrosstabsRows:fatColumns:controlExact:Exact:Continue/MonteCarlo:ContinueStatistics:√Chi-square,ContinueOKAnalyze→Correlate→BivariateVariables:fat,controlCorrelationCoefficients:√Spearman,√Kendall+stau-bTestofSignificance:Tow-tailedOK26

主要结果与解释:该资料原因变量“肥胖程度”和结果变量“血压控制情况”均属有序(等级)变量,但属性不同,可通过

2检验判断高血压患者的血压控制情况和肥胖度之间有无相关性,并通过等级相关分析其相关程度。该资料有3个格子(33.3%)的理论值均小于5,不能取Pearson

2

检验或似然比

2

检验结果,而应取Fisher确切概率法检验结果,P=0.072>0.05,故尚不能认为高血压患者的血压控制情况与其肥胖程度有相关关系。Kendall和Spearman等级相关分析结果:

=-0.074,P=0.401;rs=-0.085,P=0.381,也不支持两者之间有相关关系。该资料若把“肥胖程度”视为无序的分组变量,则可按照“单向有序R×C表资料”进行秩和检验分析。27

4.双向有序且属性相同R×C表资料

例9

两位放射科医生对一批矽肺胸片独自作出了矽肺分级诊断,请问他们的诊断结果是否一致。表9两位医生对一批矽肺胸片的分级诊断结果甲医生乙医生合计1级2级3级1级2级3级32101554701245476752合计33765716628

数据录入与分析过程:见例4。

主要结果与解释:该资料两位医生的诊断结果有序(等级)且属性相同,选用一致性检验。结果,Kappa=0.676<0.75,P<0.01,认为两位医生的诊断存在一致性,一致性中等。29

四、多个样本率间的两两比较

对于K×2表或2×K表资料,总体检验有统计学意义时,只能说明各总体比率(分布)之间总的说来有差别,但不能说明任两个总体比率(分布)之间有差别。若要对每两个总体比率(分布)之间做出有无差别的推断,需进一步分析。30

1.组间全面比较—Bonferroni法设总的检验水准为

,进行比较的次数为m,令各次比较的检验水准

’=

/m,并规定P≤

’时拒绝H0,基于这样的做法,就可以把Ⅰ类错误的累积概率控制在

。当多组间比较次数不多时,该法的效果较好。但是,当组间比较次数较多(如10次以上)时,检验水准过低,导致结果过于保守,犯Ⅱ类错误的概率增加。以例5为例,分析三种疗法任两种疗法之间疗效有无差别。31①求总的

2

值,P<

时,作两两比较。本例Pearson

2=21.038,P<0.01;②求各四格表的

2值及P值;③按公式计算校正的

’值,式中k为比较的组数,本例为3;④各P值与校正的

’值比较,判别有无统计学意义。表10三种疗法有效率的两两比较比较组

2值P值

’值统计学意义物理疗法与药物治疗物理疗法与外用膏药药物治疗与外用膏药6.75621.3234.5910.0090.0000.0320.01250.01250.0125有有无32

结果与解释:物理疗法与药物治疗、物理疗法与外用膏药比较,Pearson

2

值分别为6.756和21.323,P

值分别为0.009和0.000,均小于调整后的检验水准

’(0.0125),差别有统计学意义,结合物理疗法、药物治疗与外用膏药的有效率分别为96.60%、90.11%和81.94%,可以认为物理疗法的有效率高于药物治疗和外用膏药;药物治疗与外用膏药比较,Pearson

2=4.591,P=0.032>

’,表明尚不能认为此两种疗法有效率有差别。33

2.多个实验组与同一对照组比较—Brunden法若多个实验组与同一对照组进行比较时,设总的检验水准为

,样本率个数为k,则每个实验组与对照组比较的检验水准

’,并规定P≤

’时拒绝H0。仍以例5为例,以外用膏药作为对照,分析物理疗法和药物治疗两种疗法与物理疗法之间疗效有无差别。

34

①求总的

2

值,P<

时,作两两比较。本例Pearson

2=21.038,P<0.01;②求各实验组与对照组四格表的

2值及P

值;③按公式计算校正的

’值;④各P值与校正的

’值比较,判别有无统计学意义。表11物理疗法和药物治疗与外用膏药法有效率的比较比较组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论