单组、配对、成组设计定性资料的SAS实现_第1页
单组、配对、成组设计定性资料的SAS实现_第2页
单组、配对、成组设计定性资料的SAS实现_第3页
单组、配对、成组设计定性资料的SAS实现_第4页
单组、配对、成组设计定性资料的SAS实现_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单组、配对、成组设计定性资料

统计分析的SAS实现医学统计学教研室单组设计定性资料的案例

据报道,对输卵管结扎了的育龄妇女实施壶腹部-壶腹部吻合术后,受孕率为0.55。今对10名输卵管结扎了的育龄妇女实施峡部-峡部吻合术,结果有9人受孕。试对此资料做统计分析。单组设计定性资料的假设检验和区间估计精确置信区间(根据二项分布原理)给定样本例数n,需要根据二项分布原理计算总体率的置信区间。对于n≤50的小样本资料,可以通过查阅相应的统计表得到置信区间。假设检验

原假设:样本率与总体率相等;

备择假设:样本率与总体率不等。

单组设计定性资料的分析对某疾病采用常规治疗,其治愈率约为45%。现改用新的治疗方法,随机抽取180名患者进行治疗,治愈117人。试求新疗法治愈率的95%置信区间,并与常规疗法进行比较

dataa1;inputgroupcount;cards;1117263;run; procfreqdata=a1;tablesgroup/binomial(p=0.45);weightcount;run;group”的二项分布比例

=1比例0.6500渐近标准误差0.035695%置信下限0.580395%置信上限0.7197

H0检验:比例=0.45H0下的渐近标准误差0.0371Z5.3936单侧Pr>Z<.0001双侧Pr>|Z|<.0001

据报道,对输卵管结扎了的育龄妇女实施壶腹部-壶腹部吻合术后,受孕率为0.55。今对10名输卵管结扎了的育龄妇女实施峡部-峡部吻合术,结果有9人受孕。问实施峡部-峡部吻合术妇女的受孕率是否高于壶腹部-壶腹部吻合术

单组设计定性资料的分析dataa3;inputgroupcount;cards;1921;run;procfreqdata=a3;tablesgroup/binomial(p=0.55);weightcount;

exactbinomial;run;H0检验:比例=0.55H0下的渐近标准误差0.1573Z2.2247单侧Pr>Z0.0130双侧Pr>|Z|0.0261

精确检验

单侧Pr>=P0.0233双侧=2*单侧0.0465

配对设计定性资料的统计分析

指按照配对原则分别接受两种不同的处理方法,每种处理方法的结果都可分为“阳性”和“阴性”两种,数出两种处理方法同时判定为阳性、阴性的频数以及它们结果不一致的频数表1两种检测方法对同一组受试者检测的结果试验法检测结果例数金标准检测:

+

-合计+31

4

35-

330

33合计3434

68

对于隐含金标准和特设金标准的2×2表资料,可有两种假设检验方法:

其一,检验两种方法检测结果不一致部分差别是否具有统计学意义,可用McNemar2检验公式计算;

其二,检验两种检测方法检测结果是否具有一致性,可用Kappa检验(即一致性检验)法。试分析表1资料表1两种检测方法对同一组受试者检测的结果试验法检测结果例数金标准检测:

+

-合计+31(a1b1)

4(a1b2)

35-

3(a2b1)30(a2b2)

33合计3434

68dataa4;doa=1to2;dob=1to2;inputf@@;output;end;end;cards;314330;run;procfreqdata=a4;tablesa*b/agree;

testkappa;weightf;run;McNemar检验统计量(S)0.1429自由度1Pr>S0.7055

简单Kappa系数Kappa0.7941渐近标准误差0.073795%置信下限0.649795%置信上限0.9385

H0检验:Kappa=0H0下的渐近标准误差0.1212Z6.5513单侧Pr>Z<.0001双侧Pr>|Z|<.0001

它是配对设计2×2列联表资料的“扩大”,在处理这类资料时,人们关心的是两种检测方法检测的结果之间是否具有一致性,故常用的统计分析方法为一致性检验(Kappa检验)

双向有序且属性相同的R×C表资料及对应的统计分析方法

表2446例流行性出血热病情转化情况早期分度患者例数最后定型:轻型中型重型合计轻度111

21

1133中度

5163

20188重度

0

1124125合计116185145446表3100例脑肿瘤患者的临床诊断与CT诊断的结果临床诊断结果病例数CT诊断结果:检出疑惑未检出合计检出60

4

2

66疑惑

412

3

19未检出

3

3

9

15合计671914100

对表2而言,研究者希望看前、后两个不同时间点上诊断的结果是否具有一致性,而对表3而言,研究者希望考察两种方法诊断的结果是否具有一致性。他们的本质是相同的,都是希望回答两种检测方法检测结果是否具有一致性的问题。这样的资料实际上就是配对设计2×2列联表资料的“扩大”dataa5;doa=1to3;dob=1to3;inputf@@;output;end;end;cards;60424123339;run;procfreqdata=a5;tablesa*b;

testkappa;weightf;run;

简单Kappa系数Kappa0.6205渐近标准误差0.073395%置信下限0.476995%置信上限0.7642H0检验:Kappa=0H0下的渐近标准误差0.0749Z8.2841单侧Pr>Z<.0001双侧Pr>|Z|<.0001

对称性检验统计量(S)0.2000自由度3Pr>S0.9776加权的Kappa系数加权的Kappa0.6540渐近标准误差0.073295%置信下限0.510495%置信上限0.7975简单kappa系数主要是利用对角线上的信息,加权kappa系数除了利用对角线上的数据外,还将对角线外的数据进行加权打分,将对角线外的信息也充分利用

如果满足对称性假设,选择简单kappa系数;如果不满足对称性假设,选择加权kappa系数在确定中老年职工最大呼气流量与工作能力的关系时,采用工作能力指数(WAI)法和75%肺活量位最大呼气流量(V75)法评价285名中老年职工的工作能力,并对他们的工作能力划分为差、中、好三个等级,结果见表4。检验WAI分级与V75分级是否具有较好的一致性

dataa6;doa=1to3;dob=1to3;inputf@@;output;end;end;cards;2125749995641311;run;procfreqdata=a6;tablesa*b;

testwtkap;weightf;run;对称性检验统计量(S)35.3991自由度3Pr>S<.0001

简单Kappa系数Kappa0.0718渐近标准误差0.043695%置信下限-0.013895%置信上限0.1573加权的Kappa系数加权的Kappa0.1173渐近标准误差0.043495%置信下限0.032295%置信上限0.2025

H0检验:加权的Kappa=0H0下的渐近标准误差0.0398Z2.9473单侧Pr>Z0.0016双侧Pr>|Z|0.0032成组设计定性资料的统计分析(1)来自横断面研究设计的2×2表资料及对应的统计分析方法

横断面研究设计的2×2表资料,在某个时间断面(时点或很短时间内)进行的调查或实验研究时,对一组受试对象同时按两个定性变量来划分,每个定性变量都只有2个水平,其目的是了解某个时间点的现状四格表资料分析方法的选择原则(1)当n≥40且所有的T≥5时,用2检验的基本公式或四格表资料2检验的专用公式;

(2)当n≥40但有1≤T<5时,用连续性校正公式;(3)当n<40,或T<1时,用Fisher精确概率法;表5两种药物治疗相同疾病患者疗效的观察结果药物种类患者例数疗效:治愈未治愈合计药物A30(a)10(b)

40(e)药物B11(c)49(d)

60(f)合计41(g)59(h)100(n)试分析表5资料

dataa7;doa=1to2;dob=1to2;inputf@@;output;end;end;cards;30101149;run;procfreqdata=a7;tablesa*b/chisqriskdiff;weightf;run;统计量自由度值概率卡方131.8589<.0001似然比卡方133.2156<.0001连续校正卡方129.5594<.0001Mantel-Haenszel卡方131.5403<.0001Phi系数

0.5644

列联系数

0.4915

CramerV统计量

0.5644

Fisher精确检验单元格(1,1)频数(F)30左侧Pr<=F1.0000右侧Pr>=F1.552E-08表概率(P)1.444E-08双侧Pr<=P2.279E-08列1风险估计值

风险渐近标准误差(渐近的)95%置信限(精确)95%置信限第1行0.75000.06850.61580.88420.58800.8731第2行0.18330.05000.08540.28120.09520.3044合计0.41000.04920.31360.50640.31260.5129差值0.56670.08480.40060.7328

差值为(行1-行2)列2风险估计值

风险渐近标准误差(渐近的)95%置信限(精确)95%置信限第1行0.25000.06850.11580.38420.12690.4120第2行0.81670.05000.71880.91460.69560.9048合计0.59000.04920.49360.68640.48710.6874差值-0.56670.0848-0.7328-0.4006

差值为(行1-行2)试分析表6资料表6某病患者接受手术时间与疗效的观察结果手术时间(h)患者例数疗效:治愈未治愈合计≤513229242>5

7

56

63合计20285305dataa8;doa=1to2;dob=1to2;inputf@@;output;end;end;cards;13229756;run;procfreqdata=a8;tablesa*b/chisqexpected;weightf;run;a*b”表的统计量统计量自由度值概率卡方12.68710.1012似然比卡方12.37670.1232连续校正卡方11.83210.1759Mantel-Haenszel卡方12.67830.1017Phi系数

-0.0939

列联系数

0.0935

CramerV统计量

-0.0939

WARNING:25%的单元格的期望计数比5小。

卡方可能不是有效检验。

(2)来自队列研究设计的2×2表资料及对应的统计分析方法

依据专业知识,提出可能的危险因素,按此危险因素“接触、不接触”将全部受试者分成两组,相当于将他们排成两个队伍,研究者对此两个队列人群进行随访追踪观察若干年,最后记录各组中的受试者患某病与不患该病的人数,这样收集到的2×2表资料称为来自队列研究设计的2×2表资料(前瞻性)试分析表7资料表7按受试者体检时的血压状况分成两组追踪观察6年后看患冠心病的结果体检时血压状况例数患冠心病情况:患病未患病合计血压偏高

19

61

80血压正常

20

465485合计

39

526565dataa9;doa=1to2;dob=1to2;inputf@@;output;end;end;cards;196120465;run;procfreqdata=a9;tablesa*b/chisq

cmh;weightf;run;统计量自由度值概率卡方141.1629<.0001似然比卡方129.3491<.0001连续校正卡方138.1655<.0001Mantel-Haenszel卡方141.0901<.0001Phi系数

0.2699

列联系数

0.2606

CramerV统计量

0.2699

普通相对风险的估计值(行1/行2)研究类型方法值95%

置信限案例对照Mantel-Haenszel7.24183.660514.3269(优比)Logit7.24183.660514.3269CohortMantel-Haenszel5.75943.219310.3034(第1列风险)Logit5.75943.219310.3034CohortMantel-Haenszel0.79530.70280.9000(第2列风险)Logit0.79530.70280.9000

在要了解暴露于某种因素对疾病的发生有无影响及其影响程度时,针对某因素从部分病人发病之后开始调查,将病人设为病例组,并选择相应的非病人设为对照组,分别调查这两组人暴露于可疑致病因子的情况(回顾性)(3)来自病例-对照研究设计的2×2表资料及对应的统计分析方法试分析表8资料表8妇女孕前6个月内是否服用某药者其子代染色体异常与否的调查结果妇女孕前服用某药与否例数子代染色体异常正常合计服药34

68102未服药20128148合计54196250dataa10;doa=1to2;dob=1to2;inputf@@;output;end;end;cards;346820128;run;procfreqdata=a10;tablesa*b/chisq

cmh;weightf;run;统计量自由度值概率卡方114.00720.0002似然比卡方113.82460.0002连续校正卡方112.86130.0003Mantel-Haenszel卡方113.95120.0002Phi系数

0.2367

列联系数

0.2303

CramerV统计量

0.2367

普通相对风险的估计值(行1/行2)研究类型方法值95%

置信限案例对照Mantel-Haenszel3.20001.71165.9829(优比)Logit3.20001.71165.9829CohortMantel-Haenszel2.46671.50914.0319(第1列风险)Logit2.46671.50914.0319CohortMantel-Haenszel0.77080.66260.8967(第2列风险)Logit0.77080.66260.8967

结果为多值名义变量的2×K表资料的统计分析2×K列联表资料是指2行,K列的列联表资料,具体讲是指原因变量为二值变量,结果变量为多值变量的列联表如果结果变量为多值名义变量则可按双向无序的R×C表资料进行分析,采用一般2检验或Fisher精确检验(当表中小于5的理论频数超过了总格子数的1/5时用此法)

某医师在研究血管紧张素Ⅰ转化酶(ACE)基因I/D多态与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表9。问两组患者ACE基因型的分布有无差别dataa11;doa=1to2;dob=1to3;inputf@@;output;end;end;cards;424821307236;run;procfreqdata=a11;tablesa*b/chisq

exact;weightf;run;统计量自由度值概率卡方27.91270.0191似然比卡方27.90270.0192Mantel-Haenszel卡方16.44750

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论