




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、常用假设检验方法和回归分析综述昆明医学院公卫学院流行病与卫生统计学系何利平 资 料计量资料计数资料等级资料正态分布资料非正态分布资料t检验方差分析秩和检验2检验秩和检验常见的设计类型单样本设计配对设计完全随机设计配伍组设计析因设计拉丁方设计正交设计重复测量例1: 某医生在一山区随机抽查了25名健康成年男子,求得脉搏均数为74.2次/分,标准差为6.0次/分。根据大量调查,健康成年男子的脉搏均数为72次/分,能否认为该山区健康成年男子的脉搏均数高于一般?单样本资料(One-sample data)单样本资料(One-sample data)例2 某医师在某地某工厂随机抽取16名工人,测得尿铅含量
2、(mol/L)为0.65,0.78,2.13,2.48,2.54,2.68,2.73,3.01,3.13,3.27,3.54,4.38,4.47,5.05,6.08,11.27.已知该地正常人尿铅含量的中位数为2.50 mol/L,问该工厂工人的尿铅含量是否高于当地正常人?配对资料(Paired-sample data)配对设计资料:将受试对象按一定条件配成对子,分别给予每对中的两个受试对象以不同的处理。自身对照资料:同一个受试对象给予不同的处理或者处理前后的观察结果。配对资料(Paired-sample data)例3 15名接种卡介苗的儿童,8周后用两批不同的结核菌素,一批是标准结核菌素,
3、一批是新制结核菌素,分别注射在儿童的左右前臂。以皮肤浸润直径(mm)为指标。数据如下表所示。编号123456789101112131415标准品12.014.515.513.012.010.57.59.015.013.014.014.06.511.05.5新制品10.010.012.510.0 5.5 8.56.55.5 8.0 6.5 5.510.04.0 3.53.5 两种方法测定水中硫酸盐的含量(mmol/L)水样号(1)EDTA法(2)重量法(3)1129.89119.58259.6852.63328.7929.68469.8570.56546.7842.5662.353.2171.5
4、62.42878.8870.56956.8750.551066.8562.45配对资料(Paired-sample data)配对资料(Paired-sample data)甲法乙法合计162642 71118合计233760 例7 为研究肥胖与脂质代谢的关系,在某地小学中随机抽取30名肥胖儿童(肥胖组)和30名正常儿童(对照组),用改良八木国夫法测定两组儿童血中脂质过氧化物(LPO)得下表结果,能否认为肥胖与脂质代谢有关?表 两组儿童血中LPO含量(mol/L)分组n肥胖组309.361.83对照组307.580.64成组设计两样本资料成组设计两样本资料例8 某医生随机抽取正常人和脑病病人各
5、11例,测定尿中类固醇排出量(mg/dl),结果如下表 分组尿中类固醇排出量(mg/dl)正常人2.905.415.484.604.035.104.974.244.373.052.78脑病病人5.288.793.846.463.796.645.894.577.716.024.06成组设计两样本资料例9 为观察美能注射液对酒精性脂肪肝降血脂的作用,将72例酒精性脂肪肝患者随机分为两组,观察组38例应用美能注射液静脉注射,对照组34例口服非诺贝特胶囊,一个疗程后比较两组疗效。结果见下表 :分组时间TCTGLDL-CHDL-C观察组治疗前6.60 1.123.32 1.223.86 0.760.82
6、 0.16治疗后5.64 0.862.46 0.862.86 0.701.74 0.24对照组治疗前6.58 0.973.34 1.282.68 0.780.86 0.18治疗后5.49 0.822.34 0.882.58 0.681.68 0.18成组设计两样本资料例10 2005年某县疾病预防控制中心为评价该县小学生卡介苗抗体效价,随机抽取了30名小学生,测定结果见下表。性 别卡介苗抗体滴度倒数男生40201604032080402040801604080404040女生80201604040160402040160160408040成组设计两样本资料例11 某医生研究男性甲状腺机能减退症
7、患者尺骨骨矿含量与正常人是否有差别,随机抽取10例患者和10例正常人,分别测得骨矿含量如下(g/cm2)。患者组:0.31 0.35 0.37 0.39 0.52 0.62 0.62 0.63 0.74 0.98正常组:0.28 0.29 0.31 0.35 0.36 0.37 0.41 0.48 0.53 0.53成组设计两样本资料例13 某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。中西药治疗胃炎的疗效有无差别?组别有效无效合计中药641680西药352560四格表2检验的应用条件n 40和
8、T 5,用2检验。n 40,1 T 5,校正2检验。n40,或T1,不能用2检验,可改用确切概率法。成组设计两样本资料中药和西药治疗非典病人有效率的比较 组别缓解数未缓解数合计阳性率()西药2101216.7中药14142850.0合计16244040.0(4.8)成组设计两样本资料为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见下表,中药和西药的疗效是否有差异?药物有效无效合计有效率(%)中药1221485.7西药 671346.2合计1892766.7成组设计多样本资料例15 某医生为研究慢性阻塞性肺部疾病患者的肺动脉血氧分压情
9、况,按肺动脉压的分级标准将44例患者随机分为三组,分别测量肺动脉血氧分压,结果见下表。三组患者之间动脉血氧分压有无差异?肺动脉正常组556969728080849091929297100108109隐性肺动脉高压组455657596666707476777880839092肺动脉高压组2438394250505660626568718181成组设计多样本资料三种中药治疗流感的疗效比较组别有效例数无效例数合计有效率()热毒清 5826096.7板兰根48 126080.0复方板兰根57 36095.0合计1631718090.6成组设计多样本资料例17 某医生用七氟醚对即行肺切除术的三组患者进行
10、麻醉,麻醉效果分三级,结果如下,问三组患者的麻醉效果是否相同?组别合计肺癌 1813839肺化脓症12151340肺结核 9111939随机区组设计资料例18 对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系、同体重的 24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增加结果(克)列于表3。问小白鼠经三种不同营养素喂养后所增体重有无差别?表 不同营养素组小白鼠增加体重(g)配伍组ABC150.158.264.557.6247.848.562.452.9353.153.858
11、.655.2463.564.272.566.7571.268.479.373.0641.445.738.441.8761.953.051.255.4842.239.846.242.7合计431.2431.6473.1 24 (N)53.9053.9559.1455.66 ( )随机区组设计资料例19 观测龙葵浓缩果汁对S180实体瘤NK细胞活性的影响,将同种属的32只大白鼠按窝别、性别、体重配成10个区组,建成S180实体瘤模型。一定时间后将小鼠脱椎处死,测定并计算NK细胞活性,结果见下表,不同剂量组之间小鼠NK细胞活性有无差异?表 龙葵浓缩果汁不同剂量组小鼠NK细胞活性测定结果(%)配伍组高
12、剂量组中剂量组低剂量组对照组 120.717.312.3 6.5 212.411.618.6 8.4 314.914.610.811.3 418.5 9.419.915.6 513.2 9.0 9.0 8.9 614.220.111.514.1 712.811.57.312.3 813.511.714.710.6 914.410.912.6 9.81013.818.4 9.5 7.2析因设计资料(Factorial design data)例20 某研究人员为了解升白细胞药物和纯苯对大鼠吞噬指数的影响,以及两者同时使用的作用,将20只性别相同、体重相近的大鼠,按A、B两因素有无分为四组,测得其
13、吞噬指数结果如下:用升白细胞药物不用升白细胞药物用纯苯不用纯苯用纯苯不用纯苯1.943.801.853.882.253.902.013.842.034.062.103.962.103.851.923.922.083.842.043.80析因设计资料结果:SourceSSdfMSFsigA 0.0141 0.014 1.5190.236B 17.1681 17.1681857.0090.000 A*B 0.0091 0.009 1.0000.332拉丁方设计(Latin square design)拉丁方设计是将三个因素按水平数r排列成一个rr随机方阵,要求各因素的水平数相等且无交互作用,并要尽
14、量避免数据缺失。可以用较少的重复次数获得较多的信息。拉丁方设计资料例21 为研究不同剂量甲状腺素注射液对甲状腺体的影响,以豚鼠5个种系,每个种系各5只,分养于5个笼子,每笼内放置各种系豚鼠1只,并以甲状腺素的5个不同剂量分别注射,测得甲状腺素的重量如下表:种系 笼号甲C(65)E(85)A(57)B(49)D(79)乙E(82)A (73)D(92)B(81)B(63)丙D(68)C(67)A(56)D(77)C(51)丁B(63)E(99)C(70)E(76)A(41)戊D(75)A(46)B(52)E(68)C(66)拉丁方设计资料结果:SourceSSdfMSFsig剂量2690.960
15、4672.7408.0080.002种系 375.7604 93.9401.1180.393笼子 908.1604227.0402.7030.081正交设计(Orthogonal design)正交设计利用一套规格化的正交表将各实验因素、各水平之间的组合均匀搭配,合理安排,大大减少实验次数,提供较多的信息。正交设计可以了解哪些因素存在交互效应,还可以找出诸因素各水平的最佳组合;避免了析因设计的全面试验、工作量大的弊病。正交设计资料例22 过氧乙酸是广泛使用的消毒剂,但其有效成分极不稳定,以致影响其消毒效果。现欲通过实验找出有关因素对其稳定性的影响,选出各因素的一个最佳组合,组成保持过氧乙酸稳定
16、性的最优条件。已知的可能影响因素及水平有:水平12A:稳定剂加磷酸0.3%不加磷酸B:水浴温度2530oC3540oCC:浸泡口表浸泡口表10支不浸口表D:加盖与否加盖不加盖正交设计资料同时稳定剂和水浴温度、稳定剂与加盖与否间可能存在交互效应。现根据L8正交设计表进行了实验,每种组合重复两次,测得数据如下:ABCD第一次测量第二次测量11117.004.1111226.053.5012121.100.8012211.900.9621122.401.6521214.001.5022110.350.3022220.300.90正交设计资料结果:SourceSSdfMSFsigA12.285112.
17、2859.2720.014B34.810134.81026.2740.001C0.12210.1220.0920.768D0.73110.7310.5520.477 A*B4.20214.2023.1720.109 A*D0.16410.1640.1240.733重复测量资料(Repeated measurement data)重复测量资料:同一受试对象的同一观察指标在不同时间点上进行测量所得的资料。重复测量资料的方差分析,除需满足一般方差分析的条件外,还需满足协方差阵(covariance matrix)的球形性(sphericity)。球对称性通常采用Mauchly检验来判断。重复测量资料
18、例23 某研究者为了解某药对血液某因子的提升作用,将16名患者随机分为2组,一组用该药,另一组用传统药,分别与治疗前和治疗后1,2,3周测定结果,资料如下:重复测量资料受试对象j组别k测定时间i(周)受试对象j组别k测定时间i(周)01230123119.7354.6155.9146.81925.6426.3231.5645.69215.5050.8779.9082.371022.5615.2423.2633.27317.9633.4346.1056.211123.6918.7521.3035.69412.3718.6533.1256.051227.5222.3232.5642.12514.3
19、725.8551.2668.231328.3332.2141.5655.12616.3048.2365.1878.361425.6841.1253.4562.54718.3452.1365.3269.511523.6638.5645.1656.33812.9823.4546.8756.211624.8731.2542.6545.77重复测量资料结果:SourceSSdfMSFP处理 2214.05512214.055 7.4870.016时间22615.62337538.541145.3380.000处理*时间 826.4113 275.470 5.3110.003回归分析(Regressio
20、n analysis)线性回归(Linear regression)Logistic回归(Logistic regression)Cox回归(Cox regression)例24 为探讨父母身高对子女成年后身高的影响,某研究者调查了12个家庭的父母和成年儿子的身高,见下表,请建立回归方程。 家庭编号父亲身高x1(cm)母亲身高x2(cm)儿子身高y(cm)1172149173218816719031761641824170149170518517019561821641907173162182818516018991791581821017015017211168160170121701641
21、78回归分析的前提条件线性(Linearity)独立性(Independence)正态性(Normality)等方差(Equal variance)线性回归(Linear regression)线性回归(Linear regression)线性回归方程b1,b2bk称偏回归系数(Partial regression coefficient),b0为截距(intercept)。 偏回归系数(Partial regression coefficient): bk是自变量xk的偏回归系数,表示当方程中其它自变量保持不变时,自变量xk每变化一个单位,应变量平均变化bk个单位。线性回归(Linear r
22、egression)标准化偏回归系数(standardized partial regression coefficient) 表示自变量对应变量的贡献大小的指标,标准化偏回归系数越大,表示自变量对应变量的贡献越大。线性回归(Linear regression)线性回归(Linear regression)例24 中以儿子的身高为应变量Y,父亲的身高X1、母亲的身高X2为自变量,进行多重回归分析,所得的回归模型(方程)为线性回归(Linear regression) 假设检验: (1)多重线性回归方程的假设检验: 检验应变量y与P个自变量之间是否存在线性回归关系,用方差分析。线性回归(Line
23、ar regression)H0:12i0H1:各偏回归系数i不全为00.05可认为父母身高与儿子身高的多重线性回归方程有统计学意义,回归方程成立。SourceSSdfMSFsig回归 767.509 2 383.75464.6680.000残差 53.408 9 5.934 总 820.91711(2)偏回归系数的假设检验: 为检验每个自变量是否对y都有线性回归关系,需分别对每个自变量进行假设检验,以免把作用不显著的自变量引入方程中。 t检验: 计算一个包含P个自变量的多重线性回归方程,再用t检验法对各偏回归系数进行假设检验。线性回归(Linear regression)线性回归(Linea
24、r regression)H0:i0H1:i00.05P10.001,P2=0.008,均拒绝H0,接受H1,可认为父亲身高和母亲身高的偏回归系数均有统计学意义。 模型偏回归系数标准误标准回归系数t值P值常数项-41.94019.650-2.1340.062父亲身高 0.861 0.1320.701 6.5270.000母亲身高 0.445 0.1320.363 3.3820.008线性回归(Linear regression)回归方程为X1的偏回归系数b10.861的意义为母亲身高不变的情况下,父亲身高每增加1cm,儿子的身高平均增加0.861cm。标化偏回归系数分别为0.701和0.363
25、。即对儿子身高影响较大的是父亲的身高,其次为母亲的身高。筛选自变量的方法:最优子集法(the best subset):得到的回归方程残差最小。强制法(enter):即所有自变量均进入方程。向前法(forward)向后法(backward):可反映自变量间的交互作用。逐步法(stepwise)线性回归(Linear regression)线性回归(Linear regression)例25 某医学院校对25名健康男性教工测定年龄(x1)、体重(x2) 、跑完1000米用时(x3) 、跑时平均脉搏数(x4) 、跑后动脉血氧分压(y),要分析跑后动脉血氧分压与其它4项指标的关系。线性回归(Line
26、ar regression)H0:1340H1:各偏回归系数i不全为00.05可认为回归方程成立。SourceSSdfMSFsig回归12.80334.26820.7000.000残差4.330210.206总17.13324线性回归(Linear regression)H0:i0H1:i00.05模型偏回归系数标准误标准回归系数t值P值常数项8.8102.0684.2590.000年龄-0.0760.018-0.508-4.3070.000所用时间-0.5340.109-0.581-4.9090.000跑时平均心率0.0240.0110.2782.2850.033线性回归(Linear re
27、gression)以跑后动脉血氧分压Y为应变量,年龄X1、体重X2 、跑完1000米用时X3、跑时平均脉搏数X4为自变量做线性回归分析,所得的回归模型(方程)为:线性回归(Linear regression)标化偏回归系数分别为-0.508、-0.581和0.278。即对跑后动脉血氧分压影响较大的是跑完1000米用时,其次为年龄。 Logistic回归计数资料二分类多分类等级资料Binary Logistic regressionMultinomial Logistic regressionOrdinal regression医学研究者经常关心的问题诸如:哪些因素导致了人群中有的人患胃癌而有的
28、人不患胃癌?哪些因素导致了手术后有的人感染,而有的人不感染? 是回归分析的问题吗? “问题如何解决?” y=f(x)p=p(y=1|x)=p(x)不能直接分析变量y与x的关系转换为分析y取某个值的概率变量 p与x的关系y=1,0 x任意0p1, x任意Logistic回归模型不存在Logistic回归Logistic回归的概念:Logistic回归是一种用于多因素分析的曲线模型,特别适用于应变量为离散型多项分类的资料。二分类Logistic回归Logistic回归的概率公式: 对概率P取logit变换,则Logistic回归模型变成:二分类Logistic回归即:变量logit(P)关于x的线
29、性函数。 P/Q表示了某事件发生的比数比(odds)。Logistic回归对变量的要求:应变量为二分类或多分类变量自变量为数值变量、等级或二分类变量多分类的计数资料需进行变量转换,形成一组哑变量(dummy variable)二分类Logistic回归筛选自变量: 意义:将回归系数有显著意义的自变量选入模型中,作用不显著的自变量则排除在外。 方法:前进法(Forward)后退法(Backward)逐步法(Stepwise)筛选方法:似然比检验、Wald检验二分类Logistic回归Logistic 回归模型的假设检验检验一:对建立的整个模型做检验。 检验方法 似然比检验 (likelihood
30、 ratio test) 检验全部自变量(包括常数项)对应变量的联合作用,即整个回归方程是否有意义。说明自变量对y的作用是否有统计意义。检验二:检验模型中某是否对y有作用。 检验假设: 检验统计量:主要为Wald检验=1Logistic 回归模型的假设检验Logistic回归系数的解释:当偏回归系数为正时,x增加,OR增加,为危险因素。当偏回归系数为负时,x增加导致OR减小,为保护因素。Logistic 回归中回归系数的意义Logistic 回归中回归系数的意义0(常数项):暴露因素xi=0时,个体发病概率与不发病概率之比的自然对数比值。 Logistic 回归中回归系数的意义当某暴露因素xi
31、(危险因素)只有两个水平时,且暴露时为1,不暴露时为0, 则模型中该暴露变量前的系数i就是当其它变量值固定时, xi暴露与不暴露的比数比的对数值。 即:Ln(OR) = i 或 OR = exp(i)Logistic 回归中回归系数的意义当暴露因素为等级变量时,如收入水平, xi 的取值为:1、2、3、4表示不同的等级。 i的意义为当其它变量值固定时,xi每相差一个等级时的比数比的对数,而Exp(i)表示xi每增加一个等级时的比数比Logistic 回归中回归系数的意义当暴露因素为连续变量(如年龄)时,i就表示当其它变量值固定时,年龄每增加一岁时比数比的对数。Exp(i)表示年龄增加一岁时比数
32、比。Logistic 回归中参数的意义 MI 非MI 合计 服OC 39 24 63 未服OC 114 154 268 合计 153 178 331 拟合的Logistic回归模型为: logit P 1.8590.786x ORexp(0.786)2.195 即:服用口服避孕药者发生心肌梗塞的概率是不服者的2.195倍。例26 自变量是分类型变量 为了了解冠心病与种族的关系,某研究所调查了100个样品,数据列在下表中。试估计各种族间患冠心病的相对危险度。设y=1表示患冠心病,y=0表示未患冠心病。把种族转换为两个哑变量, x(1)=1表示黑人,x(2)=1表示其它种族,两个哑变量都为0时表示白人.Logistic 回归中参数的意义Logistic回归分析结果模型总体检验结果说明该模型具有统计意义(p=0.0035)。参数检验说明,黑人与白人患冠心病的相对危险度是:OR=8(p=0.0010),说明黑人患冠心病的几率大约是白人的8倍。参数检验说明,其他种族人与白人患冠心病的相对危险度是:OR=5(p=0.0058),说明其他种族人患冠心病的几率大约是白人的5倍。Logistic回归分析中回归
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代林业造林方法及营林生产管理问题探寻
- 老年人护理中心
- 交通运输采购法务支持与合同违约责任明确合同
- 车辆租赁行业风险评估承包合同
- 高科技园区厂房场地租赁合同范本
- 槽棎施工与地基处理合同
- 矿山采矿权抵押贷款与矿山运营管理服务合同
- 叉车操作员健康管理与劳动合同
- 商业店铺租赁合同含装修补贴
- 特色餐饮店铺租赁与装修合同
- 探究大象耳朵秘密:2025年课堂新视角
- 《咸宁市政府投资房屋建筑和市政基础设施工程施工范本招标文件》2021版
- 固定矫治器护理查房
- 招生就业处2025年工作计划
- 市场营销学练习及答案(吴健安)
- 脊柱健康与中医养生课件
- 2024马克思主义发展史第2版配套题库里面包含考研真题课后习题和章节题库
- 急救车药品管理制度
- 2024年职业技能:拍卖师专业知识考试题与答案
- 4.1中国特色社会主义进入新时代+课件-高中政治统编版必修一中国特色社会主义+(36张)
- 围栏网片采购安装投标方案(技术标)
评论
0/150
提交评论