版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计方法选择与结果解释,刘元元 2010.6.12,第一节 统计方法的正确选择,一、统计方法选择的基本思路 二、统计分析需注意的若干问题,数据特征,样本含量,研究目的,对比组数,设计类型,资料类型,综合判断,1. 研究目的 一是通过比较,回答观测指标的差别是否归因于处理因素或分组因素,在本教材范围内所涉及的主要是单变量问题。 二是分析变量之间是否存在某种联系,这主要涉及相关分析和回归分析,在本教材范围内所涉及的主要是双变量问题。,表1. 两种方法检测12名妇女最大呼气率(L/min)结果,表2. 甲、乙两药治疗小儿上消化道出血的效果,2. 设计类型 从实验研究设计来看,常见的设计类型为 完全随
2、机设计(成组设计) 配对或配伍设计(随机区组设计),两样本(成组)t 检验 单因素(完全随机设计)方差分析 卡方检验(独立样本) 两样本Wilcoxon秩和检验或多样本Kruskal-Wallis秩和检验,对完全随机设计的数据,应选择相应的方法:,配对t检验 配伍组(随机区组)设计方差分析 配对卡方检验 配对(符号秩和检验)或配伍设计的秩和检验(Friedman秩和检验)等。,对于配对或配伍设计的数据,应选择相应的方法:,3. 资料类型 对于定量变量,选择它所对应的统计方法? 对于定性变量,选择它所对应的统计方法?,4. 数据特征 对于同一设计类型和同一资料类型,仍然有许多方法可以选择。,表3
3、. 九个测定点用甲、乙两种方法的测定结果(g/m3),t检验和方差分析属参数检验方法,对数据要求较高,通常要求数据服从正态分布和方差齐性。 如果服从该条件或经变量变换后服从条件,则采用参数检验方法,否则采用秩和检验这类非参数检验方法。,能否不考虑分布和方差齐性问题,直接采用非参数检验?,5. 对比组数 单组问题(样本与与已知总体参数比较) 两组问题 多组(3组或以上)比较 注意,多组比较在差别有统计学意义时,需再进行两两比较。,6. 样本含量 在样本较小时: 如果是一个样本率与总体率的比较,可采用直接计算概率的方法如基于二项分布的确切概率法。 如果是四格表资料则采用Fisher确切概率法或校正
4、卡方检验。 对于均数比较问题,一般情况下采用t检验。 在大样本时:可考虑Z检验作近似。,在实际工作中,遇到的实际问题可能并非如此简单,须结合专业问题和所要分析的具体内容加以综合考虑和仔细判断,有时需对各种统计方法加以综合运用。,此外: 当分析目的是分析变量之间是否存在某种联系时,这就涉及到双变量的分析方法,即相关关系或回归关系的分析。 需注意相关分析和回归分析的区别与联系,关联性分析: 对于定量变量,需根据两个变量是否满足双变量正态分布,相应地采用Pearson积矩相关分析或Spearman秩相关分析。 对于等级变量则直接采用Spearman秩相关分析。,对分类变量,常计算列联系数进行分析 对
5、于RC表资料,需注意区分是单向有序或者是双向有序 对于一个二分类变量和一个等级变量之间的线性关联通常采用线性趋势卡方检验,表4. 某市不同年级中学生吸烟率,生存分析: 是一类较为特殊的针对具有截尾数据的生存时间数据所进行的分析 针对分组和未分组资料,方法有所不同,多变量的数据分析: 多重线性回归是对反应变量为定量变量进行的多变量分析 Logistic回归是对反应变量为分类变量所进行的多变量分析 Cox比例风险回归是对反应变量为含有截尾数据的生存时间所进行的分析,一、统计方法选择的基本思路 二、统计分析需注意的若干问题,1. 数据分析通常的步骤,数据探测,统计描述,统计推断,数据探测 数据分布特
6、征、方差齐性、散点图绘制、离群值的发现,以及了解数据是否符合特定统计方法的应用条件等,必要时可进行变量变换或转换以满足分析的需要。 数据探测将增加对数据的基本了解,为进一步的分析奠定基础。,统计描述 统计描述内容? 注意首先要区分变量类型,统计推断 在数据探测和统计描述的基础上选择恰当的统计推断方法分析资料。,区间估计: 总体均数区间估计:可采用t分布或正态分布原理进行估计 总体率区间估计:可采用二项分布、Poisson分布或正态分布原理进行估计,2. 混杂因素的控制 非研究因素的“可比性”问题 可比性好,各组观测指标之间的差异只能归因于研究因素而不是其它原因,如果各组在研究因素之外的某种或某
7、些因素有所不同,那么这个或这些其它因素的效应就可能同研究因素的效应混淆在一起 在这种情况下,通常的统计分析结论在进行因果推断时常常是不可靠的,对于非研究因素不具可比性的资料,应采用统计调整技术消除那些因素的影响 对于具有多个变量的复杂情况,则需采用多变量分析技术加以调整,分析阶段控制混杂因素可采用: 1) 分层分析 2) 标准化法 3) 协方差分析 4) 多重回归,1) 分层分析 Example:研究吸烟与健康的关系,吸烟者与不吸烟者死亡率的直接比较可能存在问题 因为: 吸烟者多为男性,而男性比女性更易患心脏病而发生死亡,吸烟者与未吸烟者之间死亡率的差异也许是因为性别的差异,为了排除这种可能性
8、,可以性别因素分层,再比较吸烟与非吸烟者的死亡率: 男性人群中,吸烟与不吸烟者进行比较 女性人群中,吸烟与不吸烟者进行比较,年龄可能又是另外一个混杂因素,这就需要对年龄进行分层分析:,男 40岁 40岁 女 40岁 40岁,以上是通常的分层分析思路,但这并不能保证这样分析的结论一定是正确的 尤其当:调查设计存在严重问题,样本对总体代表性很差,未能反映被调查总体的真实情况时,另需注意: 当一个事件的影响因素较多时,由于不断分层的结果致使某些层中样本含量太少; 采用这种简单的分层分析可能割裂多个因素之间的内在联系,难以真实揭示多个因素对观测结果的影响,从而导致错误的结论。,表5. 两种疗法治疗某病
9、的病死率,2) 标准化法,新疗法组的标准化病死率: 一般疗法组的标准化病死率:,标准化法解决了由于患者病型构成不同而导致的合计病死率与分病型比较相矛盾的问题,表6. 两班人数及百米跑优秀率统计,3. 正确理解可比性问题,如果我们的目的是想了解“班级因素”,即分组因素对优秀率的影响或作用,同时知道还存在其它影响优秀率的因素在各组分布不一致(即存在混杂因素),此时谈论“可比性”才是有意义的 正确做法:消除混杂因素的影响,揭示分组因素对研究指标的影响或作用,表7. 直接法计算标准化率,但如果研究目的并非探讨分组因素对研究指标的影响或作用,谈论可比性没有意义,也没必要去调整混杂因素的影响, 单纯描述谁
10、高谁低无需进行调整,只是在进一步探究导致高低不同的归因(所谓因素分析)时才对混杂因素进行控制或调整,4. 数据的分组问题 同质性问题 分组:就是将专业上认为性质相同的个体归在一起,将性质不同的个体区别开来,即试图在专业上反映出组内的同一性和组间的差异性,实战练习,1. 欲了解某地城乡婴儿营养状况有无差别,测量了其血红蛋白含量,见表1 该资料属何种类型? 该资料属何种设计? 不同月龄婴儿的血红蛋白浓度有无差异? Any else?,表1. 某地婴儿血红蛋白浓度,该资料类型?属何种设计类型? 可用何种统计方法分析上述资料?,2. 某检验员用两种方法测定了10名正常人的血红蛋白含量(g/dl),结果
11、如下:,3. 选甲型流感病毒感染者24人,随机分成2组,每组12人。用甲型流感病毒活疫苗进行免疫,一组用鼻腔喷雾法(X1),另一组用气雾法(X2) ,免疫后一月采血,分别测定血凝抑制抗体滴度,结果如下。问两法免疫的效果是否不同? X1 :50 40 30 35 60 70 30 20 25 70 35 25 X2 :40 20 30 25 10 15 25 30 40 10 15 30,4. 某医生用泼尼松、转移因子和胸腺肽治疗系统性红斑狼疮(SLE)患者14人。治疗前后血清Sil-2R(U/ml)数据见下表。他用成组设计两样本t检验,得t 0.3737,P0.7116。因此他得出治疗前后血清
12、Sil-2R的差异没有统计学意义的结论,请问该结论是否正确?,表2. 治疗前后血清Sil-2R(U/ml)数据,4. 某医生用泼尼松、转移因子和胸腺肽治疗系统性红斑狼疮(SLE)患者14人。治疗前后血清Sil-2R(U/ml)数据见下表。他用成组设计两样本t检验,得t 0.3737,P0.7116。因此他得出治疗前后血清Sil-2R的差异没有统计学意义的结论,请问该结论是否正确?,有人提议用配对t检验,如果治疗前后的差异有统计学意义就可以说明治疗有效,你同意否?,5. 某地抽样调查了部分健康成人的红细胞数,其中男性360人,均数为4.6601012/L,标准差为0.5751012/L;女性25
13、5人,均数为4.1781012/L,标准差为0.2911012/L,试问该地男、女平均红细胞数有无差别?,6. 某社区随机抽取了30名糖尿病患者、IGT异常和正常人进行载脂蛋白含量(mg/dL)测定,结果见下表,问三种人的载脂蛋白有无差别?,7. 在抗癌药筛选试验中,5个窝别,各4只,共20只小白鼠,按不同窝别分为5组。分别观察三种药物、一种对照物,对小白鼠肉瘤(S180)的抑瘤效果,表3. 三种药物抑瘤效果的比较(瘤重,g),new表3. 三种药物抑瘤效果的比较(瘤重,g),8. 用15只小白鼠,随机分为3组,比较小白鼠接种三种不同菌型伤寒杆菌9D、11C、DSC1后存活天数,实验数据见表6
14、,问接种不同菌型伤寒杆菌的小白鼠存活天数间有无差别?,表4. 小白鼠接种三种不同菌型伤寒杆菌后存活天数,new表4. 小白鼠接种三种不同菌型伤寒杆菌后存活天数,9. 用配对设计观察两种方法治疗16名扁平足患者的效果记录如下,问两种方法的疗效有无差别? 病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A法 好 好 好 好 差 中 好 好 中 差 好 差 好 中 好 中 B法 差 好 差 中 中 差 中 差 中 差 好 差 中 差 中 差,差值 2 0 2 1 -1 1 1 2 0 0 0 0 1 1 1 1,10. 已知某地正常人尿氟含量的中位数为2.15m
15、mol/L。今在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如表3。问该厂工人的尿氟含量是否高于当地正常人?,11. 研究不同饲料对雌鼠体重增加的关系,资料如下表。试比较喂高蛋白的雌鼠与喂低蛋白的雌鼠增重是否不同?,表4. 不同饲料组雌鼠所增体重,表3. 鼻咽癌患者与眼科病人的血型分布,12. 某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表3,问其血型构成有无差别?,13. 在某项治疗牙科术后疼痛控制的双盲临床研究中,将178例患者随机分为两组,A药组90人,有效人数为68人;B药组88人,有效人数为58人。资料经整理成下表形式。问两种药有效率有无差别?,表1. 两
16、种药物治疗牙科术后疼痛有效率的比较,表2. 某省三个地区花生的黄曲霉毒素B1污染率比较,14. 某省观察三个地区的花生污染黄曲霉毒素B1的情况,见下表,问三个地区花生污染黄曲霉毒素B1污染率有无差别?,15. 某研究室用甲、乙两种血清学方法检查410例确诊的鼻咽癌患者,得结果如下,问两种方法检出率有无差别?,两种检验结果之间有无关联?,16. 某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,492例患者资料整理如下表,问矽肺患者肺门密度的增加与期次有无关系?,表7. 不同期次矽肺患者肺门密度级别分布,17. 某研究者欲评价普通儿童和患某种心理疾病儿童的智力水平有无差异,调查了189名儿童,结果见下表,问两组儿童的智力水平有无不同?,表5. 两组儿童的智力水平情况,表5. 两组儿童的智力水平情况,17. 某研究者欲评价普通儿童和患某种心理疾病儿童的智力水平有无差异,调查了189名儿童,结果见下表,问两组儿童的智力构成分布有无不同?,18. 以下资料为 20名糖尿病人血糖水平(mmol/L)与胰岛素水平(mU/L)的测定值,研究两变量之间的相互关系及其密切程度。,表5. 20名糖尿病人血糖(mmol/L)与胰岛素(mU/
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论