浅谈科研中统计学的思路和常见问题_第1页
浅谈科研中统计学的思路和常见问题_第2页
浅谈科研中统计学的思路和常见问题_第3页
浅谈科研中统计学的思路和常见问题_第4页
浅谈科研中统计学的思路和常见问题_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系统计学如何应用于科研?统计学如何应用于科研?研究设计研究设计资料收集资料收集与加工与加工统计分析统计分析结果解释结果解释与报告与报告实验设计实验设计 调查设计调查设计资料来源资料来源 质量控制质量控制 检错纠错检错纠错 数据预处理数据预处理统计描述统计描述 统计推断统计推断统计学结论统计学结论 专业结论专业结论 撰写报告(包括论文)撰写报告(包括论文)统计参与了科研的整个过程!统计参与了科研的整个过程!EPIDEMIOLOGY AND HEALTH S

2、TATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系组组 别别例数例数治疗前(治疗前( s)治疗后(治疗后( s)实验组(小剂量氨甲喋呤)实验组(小剂量氨甲喋呤)3216.89 8.4611.81 4.18 对照组(安慰剂)对照组(安慰剂)2920.10 7.0216.10 3.87 P0.05例例1 表表1 氨甲喋呤对哮喘患者外围血氨甲喋呤对哮喘患者外围血IL-2水平的影响水平的影响xxEPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 原文中称采用随机化分

3、配,但从上表可知,实原文中称采用随机化分配,但从上表可知,实验组验组32例,对照组仅例,对照组仅29例;治疗前实验组例;治疗前实验组IL-2活性活性水平为水平为16.898.46,而对照组则为,而对照组则为20.107.02。经。经t检验两组检验两组IL-2水平有差异,即在治疗前水平有差异,即在治疗前 ,两组,两组IL-2水平不相同,水平不相同,不是来自同一总体不是来自同一总体。所以无法评价氨。所以无法评价氨甲喋呤治疗后甲喋呤治疗后IL-2活性水平变化的影响。活性水平变化的影响。 究其原因就是究其原因就是未严格随机化分配原则,未严格随机化分配原则,识别方识别方法就是法就是对基线资料进行均衡性检

4、验。对基线资料进行均衡性检验。EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 某人设计了4个组,每组用20只小鼠,观察定量指标的数值。 第1组: 空白对照组 第2组:单用A药组 第3组:A、B药联合使用组 第4组:第3组的空白对照组 此设计错在哪?此设计错在哪?这种安排在统计学上叫什么实验设计?这种安排在统计学上叫什么实验设计?例例2EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系例例2 2的正确表达的

5、正确表达- A A 药药 对应的分组结果对应的分组结果 - 用用 否否 B B药用否:不用药用否:不用 使用使用 - - 不用不用 空白组空白组 B B药组药组 使用使用 A A药组药组 (A+B)(A+B)药组药组-这这叫叫做做两两因因素素析析因因设设计计EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 为了观察甲紫注入某种动物正常腮腺为了观察甲紫注入某种动物正常腮腺后组织病理变化情况后组织病理变化情况, ,有人选择有人选择6 6个月龄、个月龄、体重体重2020 25kg25kg的中国实验用小型猪

6、的中国实验用小型猪1515只,雄只,雄性性9 9只、雌性只、雌性6 6只。每只动物任选一侧腮腺只。每只动物任选一侧腮腺为实验侧,另一侧作为正常对照,以消除为实验侧,另一侧作为正常对照,以消除个体差异及增龄对实验结果的影响。个体差异及增龄对实验结果的影响。 例例3EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 注入药物后注入药物后1周、周、2周、周、1个月、个月、3个月个月及及6个月将个月将15只动物随机分为只动物随机分为5组,每组组,每组3只只(每个组的(每个组的3只动物分别随机注入只动物分别随机

7、注入0.6ml、1.0ml及及4.0ml 1%某药物溶液),然后观察某药物溶液),然后观察组织病理变化情况。组织病理变化情况。实验设计错在哪?实验设计错在哪?EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系例例4 有人研究某地健康成人血清铁的正有人研究某地健康成人血清铁的正常值,选择了该地常值,选择了该地126名郊区农民献血员名郊区农民献血员(其中部分献血员曾长期多次献血),(其中部分献血员曾长期多次献血),于献血前取血样进行血清铁的测定,计于献血前取血样进行血清铁的测定,计算其平均值并将其平均值作

8、为该地健康算其平均值并将其平均值作为该地健康成人血清铁的正常值。成人血清铁的正常值。 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系统计学如何应用于科研?统计学如何应用于科研?研究设计研究设计资料收集资料收集与加工与加工统计分析统计分析结果解释结果解释与报告与报告实验设计实验设计 调查设计调查设计资料来源资料来源 质量控制质量控制 检错纠错检错纠错 数据预处理数据预处理统计描述统计描述 统计推断统计推断统计学结论统计学结论 专业结论专业结论 撰写报告(包括论文)撰写报告(包括论文)统计参与了科研的

9、整个过程!统计参与了科研的整个过程!EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 例5 有人调查服用某减肥药物与某病的关联,采用病例对照研究方法,病例组当面询问其服药情况,但对照组用信函方法调查,结果见表1,OR=2,认为服某减肥药物和某病有关联。 表2 某病患者与对照服药情况比较 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系表表3 8例恶性滋养细胞肿瘤患者灌注治疗前后例恶性滋养细胞肿瘤患者灌注治

10、疗前后hcG值值(pmol/L)病例号病例号 疗前值(疗前值(x1) 疗后值(疗后值(x2) lgx1 lgx2 1 1280000 210000 6.1072 5.3222 2 75500 3300 4.8779 3.5185 3 12450 2210 4.0952 3.3444 4 1500000 9.3 6.1761 0.9685 5 10000 2500 4.0000 3.3979 6 9700 1203 3.9868 3.0803 7 15588 4825 4.1928 3.6835 8 4223 914 3.6256 2.9609 例6EPIDEMIOLOGY AND HEALTH

11、 STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系统计学如何应用于科研?统计学如何应用于科研?研究设计研究设计资料收集资料收集与加工与加工统计分析统计分析结果解释结果解释与报告与报告实验设计实验设计 调查设计调查设计资料来源资料来源 质量控制质量控制 检错纠错检错纠错 数据预处理数据预处理统计描述统计描述 统计推断统计推断统计学结论统计学结论 专业结论专业结论 撰写报告(包括论文)撰写报告(包括论文)统计参与了科研的整个过程!统计参与了科研的整个过程!emphasisEPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫

12、安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系统计描述 选用适宜的统计指标(和/或统计图/表)描述资料的特征统计推断 用样本信息推断总体的特征统计分析统计分析参数估计参数估计:用样本信息估计总体参总体参数数的大小及大小及其范围其范围。假设检验假设检验:用样本信息比较多个总总体参数或分布体参数或分布是否是否相同相同。总体总体样本样本samplingsampling inferenceinferenceEPIDEMIOLOGY AND H

13、EALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系统计描述统计描述选择指标选择指标统计表统计表统计图统计图/p X/SQ EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系图图1 1 2008-2012年沿淮某市乙肝年沿淮某市乙肝发病率变化曲线发病率变化曲线例例7EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系图图 2 2008-2012年沿淮某市乙

14、肝各县区发病数构成年沿淮某市乙肝各县区发病数构成 例例8EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系例例9EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系例例10 表4 47份脑脊液荧抗法与培养法检验结果 有学者进行一项研究,结论:两法的符合率83%,荧抗法假阳性率及假阴性率分别为14.9%、2.1%EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大

15、学流行病与卫生统计学系流行病与卫生统计学系表表5 47份脑脊液荧抗法与培养法检验结果份脑脊液荧抗法与培养法检验结果EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系数据类型数据类型分布特征分布特征背背 景景 知知 识识体重体重坐高坐高RBCRBC数数性别性别血型血型民族民族尿检、病情尿检、病情EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 定量资料(数值变量资料) 如:身高、体重、血压、血糖、如:身高、体

16、重、血压、血糖、RBCRBC 定性资料(分类变量资料 ) 如:性别、民族、职业、血型如:性别、民族、职业、血型 等级资料(半定量资料 ) 如:文化程度、尿检结果、疗效如:文化程度、尿检结果、疗效EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系展示连续型连续型变量资料(包括统计量)的分布正态分布泊松分布二项分布展示离散型离散型变量资料的分布EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 对称分布对称分布

17、、s表达和描述定量资料表达和描述定量资料 偏态分布偏态分布 M、Q表达和描述定性和等级资料:表达和描述定性和等级资料: 相对数或率相对数或率xEPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 例例11表表6 两组褥疮愈合时间指数对比(两组褥疮愈合时间指数对比( s) x组 别 愈合时间指数 猪皮组 1.342.63 对照组 0.751.47 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系应用相对数应注意

18、的问题应用相对数应注意的问题 计算相对数的分母一般不宜过小:观察单位足够计算相对数的分母一般不宜过小:观察单位足够多时,计算出的相对数比较稳定,能够反映实际多时,计算出的相对数比较稳定,能够反映实际情况;观察单位过小,偶然性大,则可靠性差。情况;观察单位过小,偶然性大,则可靠性差。一般要求观察单位数不小与一般要求观察单位数不小与 30。 分析时不能以构成比代替率。分析时不能以构成比代替率。 应注意不能用构成比的动态分析代替率的动态分应注意不能用构成比的动态分析代替率的动态分析析 在比较相对数时应注意可比性。影响率与构成比在比较相对数时应注意可比性。影响率与构成比变化的因素很多,除了研究因素外,

19、其余的影响变化的因素很多,除了研究因素外,其余的影响因素应尽可能相同或相近。因素应尽可能相同或相近。EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系表表7 甲醛灭菌处理甲醛灭菌处理6层以内缝线催化熏蒸的结果层以内缝线催化熏蒸的结果 线线轴轴种种类类(丝丝线线型型号号) 次次数数 细细菌菌培培养养 阴阴性性次次数数 细细菌菌培培养养 阳阳性性次次数数 灭灭菌菌率率 (%) B (7) 2 2 0 100 B (4) 2 2 0 100 A (1) 2 1 1 50 B (000) 2 2 0 100

20、合合 计计 8 7 1 87.3 例例12 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系率与比的区别 率是指某种事物发生的频率或强度,是事物实际率是指某种事物发生的频率或强度,是事物实际发生的例数与可能发生某事物总人口数之比。发生的例数与可能发生某事物总人口数之比。 比(构成比):说明某一事物内部组成部分所占比(构成比):说明某一事物内部组成部分所占的比重。的比重。 率是动态变化的,与时间区间联系在一起,是动率是动态变化的,与时间区间联系在一起,是动态发生变化者占原来全体的频率;构成比是反映态发

21、生变化者占原来全体的频率;构成比是反映点状态的比重构成,不反映时间区间内的变化过点状态的比重构成,不反映时间区间内的变化过程。程。EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 将构成比错误地当作率来使用,这是临床科研将构成比错误地当作率来使用,这是临床科研中最常见的错误之一。中最常见的错误之一。 由于医院中资料的局限性,所得的数据一般只由于医院中资料的局限性,所得的数据一般只能计算构成比。由于构成比通常不能说明事物能计算构成比。由于构成比通常不能说明事物发生的强度,而且某一类别的构成比的大小受发

22、生的强度,而且某一类别的构成比的大小受到其他类别数量变化的影响,因而其应用有较到其他类别数量变化的影响,因而其应用有较大的局限性。大的局限性。 例如,我们不能由中性粒细胞比例的升高肯定例如,我们不能由中性粒细胞比例的升高肯定患者有急性炎症,因为中性粒细胞百分比的升患者有急性炎症,因为中性粒细胞百分比的升高也可以是由于淋巴细胞或其他类白细胞的数高也可以是由于淋巴细胞或其他类白细胞的数量减少所致。量减少所致。 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 表表8是某医院统计门诊沙眼病人年龄构成的数据

23、。作者是某医院统计门诊沙眼病人年龄构成的数据。作者由此得出了由此得出了20岁组人口最易患沙眼的结论。岁组人口最易患沙眼的结论。 表表8 某医院门诊沙眼病人的年龄构成某医院门诊沙眼病人的年龄构成 年年 龄龄 组组 ( 岁岁 ) 沙沙 眼眼 人人 数数 % 0 47 4.6 10 198 19.3 20 330 32.1 30 198 19.3 40 128 12.4 50 80 7.8 60 38 3.7 70 8 0.8 合合 计计 1027 100.0 例例13 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病

24、与卫生统计学系 表表9资料是假设的某地资料是假设的某地1995年和年和1997年疟疾发病人数年疟疾发病人数资料,已知该地人口在两年中没有什么变动。资料,已知该地人口在两年中没有什么变动。表表9 各种疟疾的构成情况各种疟疾的构成情况 从表中可以看到,从表中可以看到,1997年间日疟疾和三日疟的百分比年间日疟疾和三日疟的百分比都上升了,但由此得出间日疟和三日疟增多的结论都上升了,但由此得出间日疟和三日疟增多的结论 ,是是否正确?否正确?* 例例14 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系例例5

25、 表表10 两种方法治愈率的比较两种方法治愈率的比较 新新 疗疗 法法 一般疗法一般疗法 组别组别 治疗人数治疗人数 治愈人数治愈人数 治愈率(治愈率(%) 治疗人数治疗人数 治愈人数治愈人数 治愈率 (治愈率 (%) 成人成人 42 32 80 70 49 70 儿童儿童 80 40 50 30 12 40 合计合计 120 72 60 100 61 61 例例15 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽

26、医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系参数估计参数估计点估计区间估计pX /、如某医师从某市抽查了如某医师从某市抽查了190190名健康男性大学生的身高,名健康男性大学生的身高,得平均值得平均值=172.2cm=172.2cm,标准差为,标准差为4.5cm4.5cm。 = 172.2cm)%95(/CIpxspsx/ 95%CI = (171.3,173.1)cmEPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 1.1.科研程序:科研程序:假说假说-验证验证-对假说作出结论对假

27、说作出结论不同情况下,验证方法不同不同情况下,验证方法不同l结局变量结局变量l研究设计研究设计l样本含量样本含量l研究目的研究目的 。具体的计算交给软件去做,又快又准。具体的计算交给软件去做,又快又准。假设检验假设检验EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系2. 2. 统计上的假设检验统计上的假设检验: : 抽样误差抽样误差 0 2X1X?21 ?0 0 XEPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生

28、统计学系l 为比较两个班级同学英语成绩,使用同一张试卷对为比较两个班级同学英语成绩,使用同一张试卷对A、B个班同学进行考评,结果:个班同学进行考评,结果: 能不能认为能不能认为A,B两班同学英语成绩两班同学英语成绩不同?不同?l 为比较两个班级同学英语成绩,分别从为比较两个班级同学英语成绩,分别从A、B两个班两个班各随机抽取各随机抽取15名同学,使用同一张试卷进行考评,结名同学,使用同一张试卷进行考评,结果:果: ,能不能认为,能不能认为A,B两班同学英语成绩不同?两班同学英语成绩不同?, 5 .95 .87A0 .110 .85B0.110.85,5.95.87xxBA例例16EPIDEMI

29、OLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系看电影前买瓜子看电影前买瓜子 顾客:老板,瓜子质量怎么样?顾客:老板,瓜子质量怎么样? 老板:好得很,昨天刚进的货。老板:好得很,昨天刚进的货。 顾客内心:顾客内心:1.瓜子质量真的很好;瓜子质量真的很好; 2.质量不好,老板就是想挣我钱;质量不好,老板就是想挣我钱; 老板:你捏几个尝尝。老板:你捏几个尝尝。顾客从瓜子袋里摸了顾客从瓜子袋里摸了3颗瓜子,颗瓜子,2颗是坏的。颗是坏的。结论:老板骗人!?1.抽样方法是否科学?2.样本量是否足够?3.延伸:检验目的与检验

30、方法EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系单样本数据单样本数据两样本数据两样本数据多样本数据多样本数据常见设计类型及其方法选择常见设计类型及其方法选择判断设计类型:包含的组数以及组间的关系EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系分析思路单单样本数据 特征:研究设计中有:研究设计中有“一组数据一组数据”。 案例a:已知一般无肝肾疾患的健康人群尿素氮已知一般无肝肾疾患的健康人群尿素氮均值为均

31、值为4.882 4.882 (mmolmmol/L/L)。)。1616名脂肪肝患者的尿名脂肪肝患者的尿素氮(素氮(mmolmmol/L/L)的测定值为)的测定值为5.74,5.75,4.26,6.24, 5.36,8.68,6.47,5.24,4.13,11.8,5.57,5.61,4.37,4.59, 5.18,6.96。问脂肪肝患者尿素氮测定值的均。问脂肪肝患者尿素氮测定值的均数是否高于健康人?数是否高于健康人?(以定量资料为例)(以定量资料为例)1个数据组个数据组EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流

32、行病与卫生统计学系如何选取统计推断方法如何选取统计推断方法考察正态性满足满足正态性(P0.05)不满足正态性(P0.05)单样本单样本 t-test符号秩和检验符号秩和检验正态性检验方法:N2000,S-W testN2000, K-S test00.010.020.030.040.050.060.0757606366697275788184Xf(X)EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系分析思路两两样本数据 特征:研究设计中有:研究设计中有“两组数据两组数据”。 类型:完全随机完全随机(

33、独立) 配对配对(非独立)(以定量资料为例)(以定量资料为例)EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系分析思路两两样本数据 案例b:测定测定功能性功能性子宫出血证中实热组子宫出血证中实热组与虚寒组的免疫功能,淋巴细胞转化率分与虚寒组的免疫功能,淋巴细胞转化率分别为别为0.71、0.75、0.65、0.71、0.72、0.69、0.62、0.67、0.69、0.79和和0.62、0.61、0.62、0.63、0.59、0.68、0.69、0.72、0.61、0.62;问实热组与虚寒问实热组与虚

34、寒组的淋巴细胞转化率是否不同?组的淋巴细胞转化率是否不同?(以定量资料为例)(以定量资料为例)两组、完全随机两组、完全随机EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系如何选取统计推断方法如何选取统计推断方法考察正态性、方差齐性均满足均满足(P0.05)两独立样本t test满足正态性,但方差不齐两独立样本ttestWilcoxon 秩和检验非正态非正态/均不均不满足满足(P0.05)EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫

35、生统计学系流行病与卫生统计学系 处理前后比较; 同一受试对象分别接受两种不同的处理; 将条件近似的观察对象配对,再给予不同的处理。表表11 用某药治疗高胆固醇病人前后血浆胆固醇的变化用某药治疗高胆固醇病人前后血浆胆固醇的变化两组、配对两组、配对EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系如何选取统计推断方法如何选取统计推断方法考察正态性满足满足正态性(P0.05)不满足正态性(P0.05)配对样本配对样本 t-test符号秩和检验符号秩和检验切记切记:此处是 差值,而非原始数据.EPIDEMIO

36、LOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系分析思路多多样本数据 特征: 研究设计中有研究设计中有“多组数据多组数据”, 即,即,k3 。(以定量资料为例)(以定量资料为例)效应效应指标指标1个处理个处理因素因素1个处个处理因素理因素1个个单变量单因素单变量多因素1个个多变量多变量单因素单因素多变量多变量多因素多因素类型:类型:EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系分析思路单单变量变量单单因素因素多多组组数

37、据(以定量资料为例)(以定量资料为例)效应指标处理因素的三个分组(水平)处理因素处理因素? 疾病状态!案例案例d:完全随机设计完全随机设计Completely random designEPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系如何选取统计推断方法如何选取统计推断方法考察正态性、方差齐性均满足均满足(P0.05)完全随机设计的方差分析正态性/方差齐不能同时满足Kraskal-Wallis 检验(K-W检验 or H检验)均不满足均不满足(P0.05)EPIDEMIOLOGY AND HEALT

38、H STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 配伍设计Randomized Block Design 拉丁方设计拉丁方设计Latin Square Design 析因设计Factorial Design 正交设计正交设计Orthogonal Design 重复测量设计Repeated Measurement Design 嵌套设计嵌套设计Nested Design 裂区设计裂区设计Split-plot Design 星点设计Central Composite Design分析思路单单变量变量多多因素因素多多组组数据(以定量资料为例)(以定

39、量资料为例)种类多条件宽松弄清设计类型设计类型EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系为何没有正态性和方差齐性的限制?为何没有正态性和方差齐性的限制?因为因为,各单元的样本量常很少,很难检出差别。单元单元:各因素水平之间的组合。案例案例e:以配伍设计为例以配伍设计为例效应效应指标指标处理因素处理因素单单元元EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系定性资料常用分析方法定性资料常用分析方法 U

40、检验:适用于:适用于np及及n(1-p)均大于均大于5时时 2检验: 用途:比较用途:比较2个个总体率或构成比总体率或构成比间差别有无统计学意义间差别有无统计学意义 数据形式:行列表(数据形式:行列表(RC表)表) R:处理因素的水平数(组数):处理因素的水平数(组数) C:效应指标的水平数(分类数):效应指标的水平数(分类数) 常见类型:常见类型: 普通四格表普通四格表-22表,随机设计,表,随机设计,R与与C均均2个水平个水平 配对四格表配对四格表-22表,配对设计,表,配对设计,R与与C均均2个水平个水平 多行多列表多行多列表-RC表,随机设计,表,随机设计,R或或C3个水平个水平EPI

41、DEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 双向无序双向无序RC表资料:表资料: 2检验检验 单向有序单向有序RC表资料:表资料:有序性有联系的秩有序性有联系的秩和检验、和检验、Ridit分析分析 双向有序且属性不同:双向有序且属性不同:有序性有联系的等有序性有联系的等级相关分析、典型相关分析、线性趋势检级相关分析、典型相关分析、线性趋势检验验 双相有序且属性相同:双相有序且属性相同:Kappa检验检验D定性资料常用分析方法定性资料常用分析方法EPIDEMIOLOGY AND HEALTH STAT

42、ISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 表表12 某地某地6094人按两种血型系统划分的结果人按两种血型系统划分的结果 人人 数数 ABO 血血 型型 M N血血 型型 M N M N 合合 计计 O 431 490 902 1823 A 388 410 800 1598 B 495 587 950 2032 AB 137 179 325 641 合合 计计 1451 1666 2977 6094 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系表表

43、13 三种药物疗效的观察结果三种药物疗效的观察结果 人人 数数 疗疗 效效 药药物物: A B C 合合计计 治治愈愈 15 4 1 20 显显效效 49 9 15 73 好好转转 31 50 45 126 无无效效 5 22 24 51 合合计计 100 85 85 270 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 表表14 眼晶状体混浊度与年龄之关系眼晶状体混浊度与年龄之关系 眼眼 数数 晶晶状状体体混混浊浊程程度度 年年龄龄 20 30 40 合合计计 + 215 131 148 49

44、4 + 67 101 128 296 + 44 63 132 239 合合计计 326 295 408 1029 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 表表15 两法检查室壁收缩运动的符合情况两法检查室壁收缩运动的符合情况 冠冠 心心 病病 人人 数数 对对 比比 法法 测测 定定 结结 果果 核核 素素 法法 : 正正 常常 减减 弱弱 异异 常常 合合 计计 正正 常常 58 2 3 63 减减 弱弱 1 42 7 50 异异 常常 8 9 17 34 合合 计计 67 53 27

45、147 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系一般一般22表资料分析方法的选用标准表资料分析方法的选用标准 一般的一般的2检验;检验; 连续性校正的连续性校正的2检验;检验; Fisher的精确检验。的精确检验。EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 国内统计教科书一般是这样规定的:国内统计教科书一般是这样规定的: 当总样本含量当总样本含量n40,且理论频数且理论频数T均大于均大于5时

46、,选用方法;时,选用方法; 当总样本含量当总样本含量n40,但有理论频数满足但有理论频数满足1T5时,选用方法;时,选用方法; 当总样本含量当总样本含量n40或有理论频数小于或有理论频数小于1时,时,选用方法。选用方法。EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 研究单味中药对小鼠细胞免疫机能的影响,把研究单味中药对小鼠细胞免疫机能的影响,把40只小鼠随只小鼠随机均分为机均分为4组,每组组,每组10只,雌雄各半,用药只,雌雄各半,用药15d后测定后测定E-玫瑰结形成率(玫瑰结形成率(%),结果

47、如下,试比较各组总体均值之),结果如下,试比较各组总体均值之间的差别有无显著性意义?间的差别有无显著性意义? 处理本例资料,通常人们的做法是,重复运用成组设计资处理本例资料,通常人们的做法是,重复运用成组设计资料的料的t检验对检验对4个组的均值进行个组的均值进行6次两两比较。次两两比较。对 照 组 : 14 10 12 16 13 14 12 10 13 9 党 参 组 : 21 24 18 17 22 19 18 23 20 18 黄 芪 组 : 24 20 22 18 17 21 18 22 19 23 淫 羊 藿 组 : 35 27 23 29 31 40 35 30 28 36 例例1

48、7EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系比较的内容比较的内容 t 检验检验 方差分析加方差分析加 q 检验检验 资料的利用率资料的利用率 低:每次仅用两组低:每次仅用两组 高:每次要有全部数据高:每次要有全部数据 对原实验设计的影响对原实验设计的影响 残:割裂了整体设计残:割裂了整体设计 全:与原实验设计相呼应全:与原实验设计相呼应 犯假阳性错误的概率犯假阳性错误的概率 大:大:1-(1-0.05)6=0.265 小:小:0.05(假定(假定=0.05) 结论的可靠性结论的可靠性 低:统计

49、量的自由度小低:统计量的自由度小 (=18) 高:统计量的自由度大高:统计量的自由度大 (=36) 表表16 用用t检验与方差分析处理检验与方差分析处理(实例实例)资料的区别资料的区别 注:自由度大,所对应的统计量的可靠性就高,它相当于注:自由度大,所对应的统计量的可靠性就高,它相当于“权重权重”,也,也类似于产生类似于产生“代表代表”的基数,基数越大,所选出的的基数,基数越大,所选出的“代表代表”就越具有权就越具有权威性。威性。EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 表表17 764-3

50、对低氧所致右心室收缩压(对低氧所致右心室收缩压(KPa)变化的影响)变化的影响 收缩压(收缩压(Kpa, X SE) 组别组别 _ 天数:天数: 3 7 14 21 对对 照照 3.06 0.12 3.01 0.18 3.07 0.15 3.02 0.12 单纯低氧单纯低氧 3.37 0.12* 3.82 0.21* 3.90 0.19* 3.85 0.12* 764-3+低氧低氧 3.35 0.15 3.45 0.18* 3.39 0.12* 3.33 0.09* 注:原作者采用注:原作者采用t检验检验分析资料,得:与对照组比,分析资料,得:与对照组比, *P0.05, *P0.01;与单纯

51、低氧组比,与单纯低氧组比,P0.05。 实验设计与统计分析正确吗?实验设计与统计分析正确吗?例18EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系误将“部分合计频数”当作22表的原始频数 原先的设计、资料、统计分析方法、结果与结论原先的设计、资料、统计分析方法、结果与结论 表表18 螺纹管消毒处理前后采样结果螺纹管消毒处理前后采样结果 用一般用一般2检验,检验,2=7.48,P0.05,结论为螺蚊管消毒前后结论为螺蚊管消毒前后的合格率有显著性的差别,消毒后的合格率明显高于消毒前。的合格率有显著性的差

52、别,消毒后的合格率明显高于消毒前。 螺螺 纹纹 管管 消消 毒毒 采采 样样 份份 数数 合合 格格 数数 合合 格格 率率 ( % ) 前前 20 3 15.00 后后 20 18 90.00 例19 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系原表改为表原表改为表17式。式。表表 19 高高 压氧舱的螺纹管消毒前后的观测结果压氧舱的螺纹管消毒前后的观测结果 例例 数数 监监测测时时间间 合合格格 不不合合格格 合合计计 合合格格率率 (%) 螺螺纹纹管管消消毒毒前前 3 17 20 15.0

53、 螺螺纹纹管管消消毒毒后后 18 2 20 90.0 合合 计计 21 19 40 52.5 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系原先的设计、资料、统计分析方法、结果与结论:原先的设计、资料、统计分析方法、结果与结论: 表表20 不同分娩方式与重症肝炎孕妇的结局不同分娩方式与重症肝炎孕妇的结局 分娩方式 例 数 存 活 死 亡 剖宫产 9 8 1 阴道分娩 13 4 9 合 计 22 12 10 误用一般2检验取代Fisher精确检验 例例20EPIDEMIOLOGY AND HEALT

54、H STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系2k表中“0”频数过多,结果可靠性差 原先的设计、资料、统计分析方法、结果与结论原先的设计、资料、统计分析方法、结果与结论 A组组20例经末例经末梢静脉输注榄香稀乳均出现程度不同的局部刺激症状及静脉炎,梢静脉输注榄香稀乳均出现程度不同的局部刺激症状及静脉炎,而而B组组20例经锁骨下静脉穿刺置管输注均未出现任何局部刺激症例经锁骨下静脉穿刺置管输注均未出现任何局部刺激症状及静脉炎。见表状及静脉炎。见表21。表表21 两种处理下不同程度的局部刺激症状的频数分布情况两种处理下不同程度的局部刺激症状的频数

55、分布情况 不不同同分分度度的的例例数数及及百百分分比比(%) 组组 别别 00 0 0 0 0 合合计计 P 末末梢梢静静脉脉组组 0 4(20) 9(45) 6(25) 1(5) 20 5,故可用一般故可用一般2检验。得:检验。得:2=40.000 组组 别别 00例例 数数 非非 00例例 数数 合合 计计 末末 梢梢 静静 脉脉 组组 0 20 20 锁锁 骨骨 下下 静静 脉脉 组组 20 0 20 合合 计计 20 20 40 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系 原先的设计、

56、资料、统计分析方法、结果与结原先的设计、资料、统计分析方法、结果与结论论 表表22表表22 产次与新生儿低体重率产次与新生儿低体重率 原作者采用一般的原作者采用一般的2检验方法,得检验方法,得2=6.99, P0.05。1、2产次低体重率间的差别无显著性产次低体重率间的差别无显著性意义。意义。 将将1、2产次合并与产次合并与3产次比较:结果见表产次比较:结果见表22(b)。结论:结论: 2=6.515, P0.01小于小于3产次与大于等于产次与大于等于3产次的低体重率产次的低体重率间的差别有显著性意义,即间的差别有显著性意义,即“3产次产次”组低体重儿发生率高于组低体重儿发生率高于1产次、产次

57、、2产次组,而第一、二产次组间的差别无显著性意义,产次组,而第一、二产次组间的差别无显著性意义,不应作出第二产次组低体重发生率最低的结论。不应作出第二产次组低体重发生率最低的结论。 产产次次 低低体体重重例例数数 正正常常例例数数 合合计计 1 495 9456 9951 2 114 2344 2458 合合计计 609 11800 12409 产产次次 低低体体重重例例数数 正正常常例例数数 合合计计 0.05所对应的实验因素一定是无用因素所对应的实验因素一定是无用因素 “P0.05”等价于等价于“某因素是无用因素某因素是无用因素”吗?吗? 某研某研究者在研究多个实验因素对某产物的影响时,运

58、用究者在研究多个实验因素对某产物的影响时,运用正交设计安排了全部实验因素。运用方差分析处理正交设计安排了全部实验因素。运用方差分析处理资料后发现资料后发现“温度温度”这个实验因素所对应的这个实验因素所对应的P值是值是“P0.05”,便认为便认为“温度温度”这个实验因素对产物这个实验因素对产物的影响无显著性意义,于是,得出结论:的影响无显著性意义,于是,得出结论:“温度这温度这个实验因素在本实验中是无关紧要的,可忽略不予个实验因素在本实验中是无关紧要的,可忽略不予考虑考虑”。 EPIDEMIOLOGY AND HEALTH STATISTICS1957卫卫安徽医科大学安徽医科大学流行病与卫生统计学系流行病与卫生统计学系统计统计“显著性显著性”与医学与医学/临床临床/生物学生物学“显显著性著性” 统计统计“显著性显著性”对应于统计结论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论