医学统计学答案_第1页
医学统计学答案_第2页
医学统计学答案_第3页
医学统计学答案_第4页
医学统计学答案_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 定量资料的统计描述第四章 定量资料的统计描述 【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,。不同点:均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。2. 同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小

2、,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;标准差用于描述正态分布或近似正态分布资料的离散程度;变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。4. 正态分布的特征:正态曲线在横轴上方均数处最高;正态分布以均数为中心,左右对称;正态分布有两个参数,

3、即位置参数和形态参数;正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间内的面积为95.00%;区间内的面积为99.00%。5通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。二、案例辨析题统计描述时,常见错误是对定量资料的描述均采用均数、标准差,。正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资料的血清总胆固

4、醇的频数分布图如下:频数图4-1 血清甘油三酯(TG)的频数分布可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:集中趋势指标 (mmol/L)离散程度指标 四分位数间距= (mmol/L) 三、最佳选择题1. B 2. E 3. B 4. C 5. D 6. E 7. A 8. D 9. D四、综合分析题1. 解:输出结果频数图4-4 尿总砷的频数分布图 由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。频数输出结果 图4-5 尿总砷对数的频数分布图由图可见lgx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近

5、似服从对数正态分布。(2) 燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。输出结果结果中的Mean表示尿总砷对数值的均数为1.1831,求其反对数,得到几何均数。2. 解: (1) 已知健康人的血清TC服从正态分布,故采用正态分布法制定95%的参考值范围。下限:(mmol/L) 上限:(mmol/L)该市4555岁健康男性居民的血清总胆固醇的95%参考值范围为2.96 mmol/L6.72mmol/L。(2) 4555岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准

6、差的点估计值。查标准正态分布曲线下的面积表(附表2)得: 该市4555岁健康男性居民中,血清总胆固醇在3.25mmol/L5.25mmol/L范围内的比例为61.79%。 (3) 作标准化变换查标准正态分布曲线下的面积表(附表2)得:该市4555岁健康男性居民中,血清总胆固醇低于3.80mmol/L所占的比例为14.01%。3. 解:输出结果50 60 70 80 90 100 110 120 130 140 150 频数 跟骨硬度指数图4-8 跟骨硬度指数的频数分布图由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百分位数法,制定双侧95%参考值范围。输出结果St

7、atisticsSINValid120 Missing0Percentiles2.558.0167 97.5143.6618即该地区3035岁健康女性的SI的95%参考值范围为(58.02, 143.66)。第五章 定性资料的统计描述【习题解析】一、思考题1计算相对数应时有足够的观察单位数;分析时不能以构成比代替率;计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;样本率或样本构成比的比较应作假设检验。2. 率是指某现象实际发生数与某时间点或某时间段

8、可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。3. 如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以

9、说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。5. 标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不相同。因此,标准化率仅用于相互间的比较,实际水平应采用未标化率来反映。样本的标准化率是样本指标,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算

10、标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。二、案例辨析题该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。三、最佳选择题1. B 2. A 3. D 4. E 5. D 6. D 7. C 8. C 9. B四、综合分析题1. 解:表5-3 经常吸烟与慢性

11、阻塞性肺病(COPD)的关系分 组调查人数经常吸烟经常吸烟率(%)是否COPD患者35623112564.89非COPD患者47918329638.20COPD患者的经常吸烟率:231/356100%=64.89%非COPD患者经常吸烟率:183/479100%=38.20%COPD患者的经常吸烟率比非COPD患者高26.69%还需进一步对作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。 输出结果2. 解: 表5-4 某地居民19982004年某病死亡率(1/10万)动态变化年份符号死亡率绝对增长量发展速度增长速度 累计逐年定基比环比定

12、基比环比1998a0160.51999a1144.2-16.3-16.30.900.90-0.10-0.102000a2130.0-30.5-14.20.810.90-0.19-0.102001a3120.2-40.3-9.80.750.92-0.25-0.082002a485.6-74.9-34.60.530.71-0.47-0.292003a569.5-91.0-16.10.430.81-0.57-0.192004a638.5-122.0-31.00.240.55-0.76-0.45该病死亡率的平均发展速度该病死亡率的平均增长速度3. 解:因为该地男、女性的年龄构成有所不同,为了消除年龄构

13、成的不同对HBsAg阳性率的影响,应先进行标准化再进行比较。根据本题资料,以男、女合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。表5-5 直接法计算某地不同年龄、性别人群的HBsAg标准化阳性率(%)年龄组标准人口数男性女性原阳性率预期阳性数原阳性率预期阳性数 010812.3024.902.3225.092014732.7139.972.7240.024015466.0693.636.4699.866014087.52105.858.60121.04合 计5508(N)5.11264 ()4.86286()男性HBsAg标准化阳性率: 女性HBsAg标准化阳性率:

14、可见,经标准化后女性HBsAg阳性率高于男性。输出结果注:将SPSS输出的sp1的和除以sp的和,得男性HBsAg标准化阳性率;sp2的和除以sp的和,得女性HBsAg标准化阳性率。第六章 总体均数的估计【习题解析】一、思考题1抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。2样本均数的抽样分布的特点有:各样本均数未必等于总体均数;样本均数之间存在差异;样本均数服从正态

15、分布;样本均数的变异范围较原变量的变异范围小;随着样本含量的增加,样本均数的变异范围逐渐缩小。3标准差与标准误的区别在于:计算公式:标准差为,标准误为;统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。标准差与标准误的联系:当样本量一定时,标准误随标准差的增加而增加,公式为:。4数理统计的中心极限定理:从均数为,标准差为的正态总体中进行独立随机抽样,其样本均数服从均数为,标准差为的正态

16、分布;即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增加时,其样本均数的分布逐渐逼近于均数为,标准差为的正态分布。越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。计算总体均数置信区间的通式为:;当样本含量较大时,例如,分布近似标准正态分布,可用值代替值,作为置信区间的近似计算,相应的置信度为时,总体均数的置信区间为:。5置信区间与医学参考值范围的区别见表6-1。表6-1 均数的置信区间与医学参考值范围的区别区别均数的置信区间医学参考值范围意义按一定的置信度()估计的总体均数所在的区间范围大多数“正常人”的某项解剖、生理

17、、生化指标的波动范围计算公式未知:()未知而n较大:()已知:()正态分布法: 双侧95%的参考值范围为()偏态分布法:单侧下限95%的参考值范围为单侧上限95%的参考值范围为用途用于总体均数的估计或假设检验判断观察对象的某项指标正常与否,为临床诊断提供参考二、案例辨析题该学生误用医学参考值范围的公式来计算总体均数的95%置信区间,正确计算公式为:,二者的主要区别在于,计算医学参考值范围时应该用“标准差”,计算置信区间时应该用标准误。根据置信区间的公式算得2005年该市7岁男孩身高的95%置信区间为(122.01,122.99)。 三、最佳选择题1C 2E 3E 4A 5E 6A 7E 8B

18、四、综合分析题1解:由于该样本为小样本,故用公式估计总体均数95%置信区间为(8.27, 10.03)mm/h;用公式估计总体均数99%置信区间为(7.96, 10.34)mm/h。输出结果Descriptives StatisticStd. Error红细胞沉降率Mean9.1481.4256395% Confidence Interval for MeanLower Bound8.2697 Upper Bound10.0266 5% Trimmed Mean9.1795 Median9.4288 Variance4.529 Std. Deviation2.12816 Minimum5.01

19、 Maximum12.68 Range7.67 Interquartile Range2.73 Skewness-.250.464Kurtosis-.429.902DescriptivesStatisticStd. Error红细胞沉降率Mean9.1481.4256399% Confidence Interval for MeanLower Bound7.9576 Upper Bound10.3386 5% Trimmed Mean9.1795 Median9.4288 Variance4.529 Std. Deviation2.12816 Minimum5.01 Maximum12.68

20、Range7.67 Interquartile Range2.73 Skewness-.250.464Kurtosis-.429.9022解:抽样误差为1.82;由于该样本为大样本, 故用公式估计正常人ET含量的95%置信区间为(77.43, 84.57)ng/L。输出结果Descriptives StatisticStd. Error血浆内皮素Mean80.98911.8203395% Confidence Interval for MeanLower Bound77.3771 Upper Bound84.6010 5% Trimmed Mean80.8639 Median79.5837 V

21、ariance331.362 Std. Deviation18.20334 Minimum34.02 Maximum129.20 Range95.17 Interquartile Range21.75 Skewness.182.241Kurtosis.140.4783解:由于两样本均为小样本, 故用公式估计总体均数95%置信区间,肺心病组血液二氧化碳分压的95%置信区间为(7.86 , 13.10)kpa;慢性支气管炎合并肺气肿组血液二氧化碳分压的95%置信区间为(5.41 , 6.83)kpa。由于方差不齐,应当选择方差不齐时的结果。两组患者的血液二氧化碳分压差值的95%置信区间为(1.66

22、, 7.05)kpa,该区间不包含0,可以认为肺心病患者与慢性支气管合并肺气肿患者的均数不同,肺心病患者较高。输出结果Descriptives 组别 StatisticStd. Error二氧化碳压肺心病组Mean10.47821.2656495% Confidence Interval for MeanLower Bound7.8600 Upper Bound13.0964 5% Trimmed Mean10.2266 Median10.3473 Variance38.444 Std. Deviation6.20035 Minimum1.59 Maximum24.30 Range22.71

23、Interquartile Range7.13 Skewness.615.472Kurtosis-.030.918慢性支气管炎合并肺气肿组Mean6.1228.3380995% Confidence Interval for MeanLower Bound5.4151 Upper Bound6.8304 5% Trimmed Mean6.1266 Median6.0160 Variance2.286 Std. Deviation1.51198 Minimum2.93 Maximum9.25 Range6.32 Interquartile Range1.78 Skewness-.081.512K

24、urtosis.192.992Group Statistics 组别NMeanStd. DeviationStd. Error Mean二氧化碳压肺心病组2410.47826.200351.26564 慢性支气管炎合并肺气肿组206.12281.51198.33809Independent Samples Test Levenes Test for Equality of Variancest-test for Equality of MeansFSig.tdfSig. Mean DifferenceStd. Error Difference95% Confidence Interval of

25、 the Difference LowerUpper二氧化碳压Equal variances assumed17.431.0003.06142.0044.355471.422901.483947.22700Equal variances not assumed 3.32526.238.0034.355471.310021.663877.04706第八章 t检验【习题解析】一、思考题1理论根据是小概率事件和小概率反证法。值表示成立时,出现等于及大于(或等于及小于)现有样本统计量的概率。则表示在成立的前提下,得到现有样本统计量的概率为小概率事件,所以拒绝。2检验中是选择单侧检验还是双侧检验,需要根

26、据专业知识来确定。例如,根据专业知识能确定未知总体均数不会大(小)于标准值(单样本检验),则可用单侧检验,否则,采用双侧检验。3配对检验的应用条件是资料为配对设计,且数据差值服从正态分布。4理论上讲应取得大一些,如0.10或0.20,目的是减少犯II型错误的概率;在实际应用中,常取。5变量变换的目的在于使变换后的资料满足正态分别或方差齐性等条件,便于进一步的统计分析。6可以,大样本两组均数的Z检验是两组均数比较检验的近似。二、案例辨析题该医生的分析结果是错误的。正确作法应是分别将甲、乙两药各自治疗前后的血沉值作差值,比较两组差值的均值是否有差别,具体步骤如下:(1) 正态性检验分别对甲、乙两种

27、药物治疗前后的血沉差值进行正态性检验。甲药: 乙药: 故,甲药、乙药两组资料的差值均服从正态分布。(2) 方差齐性检验1) 建立检验假设,确定检验水准 ,两差值总体方差相等 ,两差值总体方差不等2)计算检验统计量 3) 确定值,作出统计推断 查界值表(附表4),得,按的水准,不拒绝,差异不具有统计学意义,尚不能认为两差值总体方差不等。(3) 以差值为资料,作两组均值检验1) 建立检验假设,确定检验水准:,即甲、乙两种药物的疗效无差别:,即甲、乙两种药物的疗效有差别2) 计算检验统计量3) 确定P值,作出统计推断查界值表(附表3),得,按水准,拒绝,接受,差异具有统计学意义,可认为甲、乙两种药物

28、的疗效有差别。由于乙种药物治疗前后血沉值的差值较大(均数为5.8),故乙药物治疗效果要好于甲药。输出结果三、最佳选择题1.E 2.C 3.C 4.B 5.E 6.E 7.C 四、综合分析题1. 解:本题应进行单样本检验,可按如下步骤完成:(1) 资料的正态性检验 ,故资料服从正态分布。(2) 单样本检验 1) 建立检验假设,确定检验水准,即该山区成年男子的脉搏与一般成年男子脉搏无差别,即该山区成年男子的脉搏与一般成年男子脉搏有差别2) 计算检验统计量由原始资料计算得:,于是3) 确定P值,作出统计推断查界值表(附表3),得,按水准,拒绝,接受,差异有统计学意义,可以认为该山区成年男子脉搏与一般

29、成年男子脉搏有差别。输出结果2解:本题应采用配对检验,完成步骤如下:(1) 分别作甲、乙两药治疗前后差值的正态性检验 由案例辨析题中的结论可知,资料均服从正态分布。 (2) 对甲、乙两药分别作配对检验 甲药:1) 建立检验假设,确定检验水准,即甲药治疗前后血沉值无差别,即甲药治疗前后血沉值有差别2) 计算检验统计量3) 确定P值,作出统计推断查界值表(附表3),得,按水准,拒绝,差异有统计学意义,即甲药降低血沉有效。乙药:1) 建立检验假设,确定检验水准,即乙药治疗前后血沉值无差别,即乙药治疗前后血沉值有差别2) 计算检验统计量 3) 确定P值,作出统计推断查界值表(附表3),得,按水准,拒绝

30、,差异有统计学意义,即乙药降低血沉有效。输出结果3解:本题资料为抗体滴度数据,一般服从对数正态分布,宜采用成组设计的两小样本几何均数比较的检验。(1) 将原始数据取常用对数值后分别记为、(2) 正态性检验用SPSS统计软件算得变量、的正态性检验结果。: : 故,两组资料均服从正态分布。(3) 方差齐性检验1) 建立检验假设,确定检验水准,两总体方差相等 ,两总体方差不等2) 计算检验统计量 ,于是3) 确定值,作出统计推断查界值表(附表4),得。按水准,拒绝,差异有统计学意义,故可认为两总体方差不相等。(4) 两样本均数()的检验1) 建立检验假设,确定检验水准 两总体几何均数的对数值相等 两

31、总体几何均数的对数值不等2) 计算检验统计量 3) 确定值,作出统计推断查界值表(附表3),得。按水准,拒绝,接受,差异有统计学意义,可认为两组的平均效价有差别。输出结果第十章 二项分布和Poisson分布及其应用 【习题解析】一、思考题1. Bernoulli试验的适用条件如下:每次试验只会发生两种互斥结果之一,即两种互斥结果的概率之和恒等于1;在相同的试验条件下,每次试验产生某种结果(如“阳性”)的概率固定不变;重复试验是互相独立的,即任何一次试验结果的出现不会影响其它试验结果出现的概率。2. Poisson分布的性质如下:总体均数与总体方差相等;当n很大,而很小,且为常数时,Poisso

32、n分布可看作是二项分布的极限分布;当增大时,Poisson分布渐近正态分布,一般而言,时,Poisson分布资料可作为正态分布处理;Poisson分布具备可加性,即对于服从Poisson分布的m个互相独立的随机变量,它们之和也服从Poisson分布,且其均数为这m个随机变量的均数之和;的大小决定了Poisson分布的图形特征。3. 随机变量X服从二项分布,是指在n重Bernoulli试验中,发生某种结果(如“阳性”)的次数的一种概率分布,其恰好发生X个阳性的概率为() ,且总有 。而随机变量X服从Poisson分布,是指X满足:取值范围为;相应的概率为 ,且总有 。在总体率很小,而样本含量(试

33、验次数)n趋向于无穷大时,二项分布近似于Poisson分布。因此, Poisson分布可看作是二项分布的一种极限情况,可用来描述小概率事件的发生规律。 4. 二项分布、Poisson分布和正态分布间的联系为:在n很大,而很小,且为常数时,二项分布的极限分布为Poisson分布;在n较大、不接近0也不接近1时,二项分布近似正态分布,而相应的样本率p的分布也近似正态分布。当增大时,Poisson分布渐近正态分布,一般而言,20时,Poisson分布资料可作为正态分布处理。二、案例辨析题不正确。溶液中的细菌数可以认为服从Poisson分布,当其“单位容积”所含细菌数时,可采用正态近似法估计总体均数的

34、()置信区间。但本例溶液的“单位容积”为10ml,应先用正态近似法估计出该溶液每10ml所含细菌数的95%置信区间,再除以10即得到每1ml所含细菌数的95%置信区间。由式(10.16)可得,每10ml该溶液所含细菌数的95%置信区间为,故每1ml该溶液所含细菌数的95%置信区间为。三、最佳选择题1. A2. C3. B4. E5. C6. E7. E8. C四、综合分析题1. 解:本例可认为治疗有效人数X服从二项分布,根据研究目的,选用单侧检验。其假设检验步骤为:(1) 建立检验假设,确定检验水准H0:,该药新剂型的疗效等于常规剂型H1:,该药新剂型的疗效优于常规剂型单侧 (2) 计算概率本

35、例,(3) 作出统计推断由结果可见,按水准,不拒绝H0,差异无统计学意义,尚不能认为该药新剂型能增加疗效。2. 解:本例中,乳腺癌患病人数可认为服从Poisson分布,两个样本的观察单位数不相等,以10000人为一个单位,则,。设甲、乙两地妇女乳腺癌的患病率分别为和,其假设检验步骤为:(1) 建立检验假设,确定检验水准H0:,两地妇女乳腺癌患病率相等H1:,甲地妇女乳腺癌患病率高于乙地单侧 (2) 计算检验统计量(3) 作出统计推断查t界值表(附表3 ),得,按水准,不拒绝H0,差异无统计学意义,尚不能认为甲地妇女乳腺癌的患病率高于乙地。第十一章 检验【习题解析】一、思考题1. 检验的基本思想

36、:在成立的条件下,推算出各个格子的理论频数T,然后利用理论频数T和实际频数A构造统计量,反映实际频数与理论频数的吻合程度。若无效假设成立,则各个格子的A与T相差不应该很大,即统计量不应该很大。A与T相差越大,值越大,相对应的P值越小,当,则越有理由认为无效假设不成立,继而拒绝,作出统计推断。由于格子越多,值也会越大,因而考虑值大小的意义时,应同时考虑格子数的多少(严格地说是自由度的大小),这样值才能更准确地反映A与T的吻合程度。检验可用于:独立样本两个或多个率或构成比的比较,配对设计两样本率的比较,频数分布的拟合优度检验,线性趋势检验等。2. 对不同设计类型的资料,检验的应用条件不同: (1)

37、 独立样本四格表的检验1) 当,且时,用非连续性校正的检验。或2) 当,且有时,用连续性校正的检验或用四格表的确切概率法。 或 3) 当或时,用四格表的确切概率法。(2) 独立样本列联表检验的专用公式为:1) 不宜有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1。2) 结果为有序多分类变量的RC列联表,在比较各处理组的平均效应有无差别时,应该用秩和检验或Ridit检验。(3) 配对四格表的检验1) 当时,。2) 当时,需作连续性校正,。3. 四格表的Z检验和检验的联系,体现在:能用四格表Z检验进行两样本率比较的资料,都可以用检验。四格表的双侧Z检验与检验是完全等价的,两个统计量的

38、关系为,相对应的界值的关系为。4. 拟合优度检验是根据样本的频数分布检验其总体是否服从某特定的理论分布。按照该理论分布计算的频数称为理论频数;从样本观察到的频数称为实际频数。利用检验,推断实际频数与理论频数的吻合程度。5. 检验的理论是基于分布,但是只有在大样本时检验统计量才近似服从分布,才能使用检验公式。如四格表资料,若,且有时,尚可以校正检验统计量使其近似服从分布;当时,这种近似性就很差,检验就不适用了,只能用确切概率法。二、案例辨析题该研究的试验设计和统计分析方法均存在不合理的地方。试验设计方面:样本含量偏小。该研究者在临床试验设计之初,就应该严格按照临床试验设计要求,进行样本含量的估计

39、,以保证足够的检验效能。此外,由于急性细菌性下呼吸道感染,某些症状疗效的判断可能易受主观因素的影响,因此应采用盲法。统计分析方面:由于样本含量小于40,不能采用检验,应采用四格表的确切概率法。具体步骤为:1. 建立检验假设,确定检验水准:,即两种抗生素治疗急性细菌性下呼吸道感染的有效率相同:,即两种抗生素治疗急性细菌性下呼吸道感染的有效率不同2. 计算概率:在周边合计不变的条件下,以最小行、列合计所对应的格子为基础,其取值的变动范围为从0到最小周边合计。本例中,将甲药治疗无效对应的格子的取值从0增至10,可得到11个四格表,并按第1个格子的值由小到大排列,结果见下表。表11-4 Fisher确

40、切概率法计算用表序号i有效无效14100.00003160 2590.001071513680.011991424770.063971335860.181911246950.2910511571040.2668010681130.13860979*1220.0389888101310.0053379111400.00027610* 表11-1数据按下式计算各四格表的概率,结果见表11-4最后一列。3. 确定P值,作出统计推断将小于等于原四格表概率的所有四格表对应的概率相加,得到双侧概率 按水准,不拒绝,差异无统计学意义,尚不能认为两种抗生素治疗急性细菌性下呼吸道感染的疗效有差别。该结果与该研究

41、者的结论相反。因此,在统计分析时应注意所选方法的应用条件。三、最佳选择题1. A 2. E 3. D 4. E 5. D 6. A 7. E 8. B 9. B 10. C四、综合分析题1. 解:(1) 资料整理后的表格为表11-5 A、B两种抗生素治疗单纯性尿路感染的疗效组别有效无效合计有效率(%)抗生素A37 54288.10 抗生素B29134269.05 合计66188478.57 (2) 该研究属于完全随机设计,所得资料为二分类资料。(3) 由于该资料为分类资料,欲比较A、B两药的有效率,宜选用独立样本四格表的检验。具体步骤为:1) 建立检验假设,确定检验水准:,即两种抗生素治疗单纯

42、性尿路感染的有效率相同:,即两种抗生素治疗单纯性尿路感染的有效率不同2) 计算检验统计量本题中最小行、列合计对应的格子为采用抗生素A治疗无效者或抗生素B治疗无效者,其理论频数,故采用四格表专用公式: 3) 确定P值,作出统计推断查界值表(附表9),得,按水准,拒绝,接受,差异有统计学意义,可以认为两种抗生素治疗单纯性尿路感染的疗效不同,A药的有效率高于B药。输出结果2. 解:(1) 资料整理后的表格为表11-6 两种CT对煤工尘肺肺气肿的检查结果螺旋CTHRCT合计有无有73275无71421合计801696 (2) 该研究属于配对设计,所得数据为分类资料。(3) 该资料为分类资料,欲比较螺旋

43、CT和HRCT在煤工尘肺肺气肿检出方面有无差异,宜选用配对四格表的检验。具体步骤为:1) 建立检验假设,确定检验水准:,即两种CT检出煤工尘肺肺气肿的结果无差异:,即两种CT检出煤工尘肺肺气肿的结果有差异2) 计算检验统计量本题,应采用配对四格表检验的校正公式: 3) 确定P值,作出统计推断查界值表(附表9),得,按水准,不拒绝,差异无统计学意义,尚不能认为两种CT煤工尘肺肺气肿的检出率有差异。 输出结果3. 解:本题资料为分类资料,欲比较3种方案治疗单纯性肥胖的有效率有无差异,宜选用独立样本列联表的检验。具体步骤为:1) 建立检验假设,确定检验水准:,即3种方案治疗单纯性肥胖的有效率相同:3

44、种方案治疗单纯性肥胖的有效率不全相同2) 计算检验统计量最小理论频数,故直接将数据带入独立样本列联表检验的公式: 3) 确定P值,作出统计推断查界值表(附表9),得,按水准,不拒绝,差异无统计学意义,尚不能认为3种方案治疗单纯性肥胖的有效率不同。输出结果4. 解:(1) 该资料为分类资料,欲比较两药治疗胃溃疡的疗效构成比有无差异,宜选用独立样本列联表的检验。先将资料整理成下表形式:表11-7 两种药物治疗治疗胃溃疡的疗效组别痊愈显效进步无效合计试验组20(58.82)6(17.65)4(11.76)4(11.76)34(100)对照组16(47.06)4(11.76)8(23.53)6(17.

45、65)34(100)合计3610121068假设检验的具体步骤为:1) 建立检验假设,确定检验水准:两药治疗胃溃疡的疗效构成比相同:两药治疗胃溃疡的疗效构成比不同2) 计算检验统计量最小理论频数,故直接将数据带入独立样本列联表检验的公式: 3) 确定P值,作出统计推断查界值表(附表9),得,按水准,不拒绝,差异无统计学意义,尚不能认为两药治疗胃溃疡的疗效构成比不同。(2) 若比较两药有效率有无差异,宜选用独立样本四格表的检验。按题意将资料整理成下表形式:表11-8 两种药物治疗治疗胃溃疡的疗效组别有效无效合计试验组26 834对照组20 1434合计462268(3) 若比较两药治疗胃溃疡的疗

46、效大小,宜选用秩和检验。因为本题中治疗效果呈等级变化,由于检验未考虑“疗效”的等级顺序,因此经检验只能说明各处理效应的构成比是否有差别。而秩和检验考虑了“疗效”的等级顺序,用于比较疗效大小比检验更合理。输出结果以上是问题(1)的SPSS分析过程。问题(2)的SPSS分析过程请参见本章综合分析题的第1题,问题(3)的SPSS分析过程请参见第十二章相关内容。第十三章 双变量关联性分析【习题解析】一、思考题1双变量关联性分析的目的在于推断从某一总体中随机抽取的同一份样本观测出的两个变量间是否存在关联性,以及这种关联性的密切程度如何。关联性只反映变量间数量上的关系,但数量上的关联并不表示专业上的因果关

47、系,是否确为因果关系还需结合专业知识、因果逻辑上的时间先后顺序等作进一步判定。 222列联表的关联性分析与两样本率比较的检验的数据形式非常相似,检验的公式以及应用条件也完全相同。但区别在于:两样本率比较的检验是从两个总体中分别抽取样本,两样本有各自的频数分布,所检验的是两总体的率是否相同;而22列联表的关联性分析是从同一个总体中进行随机抽样,对样本中的每个个体考察其两个变量的关系,检验两个分类变量之间是否存在关联性或者说是否独立。3P值越小,说明越有理由拒绝,犯I型错误的概率越小。相关系数r经假设检验有统计学意义且得到非常小的P值,表示有足够的理由认为两变量总体相关系数,只能定性回答两变量是否

48、存在直线相关,并非意味着其直线相关的强度。若要定量回答相关性的强弱,需结合样本相关系数r的大小和总体相关系数的置信区间来说明。4区别:Pearson积矩相关适用于二元正态分布资料,Spearman秩相关适用于不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。Pearson积矩相关是基于原始数据进行统计分析,而Spearman秩相关是将原始数据进行秩变换后进行统计分析。Pearson积矩相关是参数检验方法,而Spearman秩相关不以特定的总体分布为前提,为非参数检验的方法。联系:两种相关系数的取值都介于-1和1之间,无单位,小于 0 为负相关,大于0为正相关。用原始数据的秩次

49、来计算Pearson相关系数,得到的即为Spearman秩相关系数。二、案例辨析题该案例是对同一样本的两个分类变量之间的关联性进行分析,检验的计算方式不变,结果仍为84.533,但下结论时最好不要从“不同年龄的AKP酶反应活性不同”演绎到“两变量有关系”,而应为“按=0.05水准,拒绝,可认为年龄与AKP酶反应活性之间有关”。此外,可结合列联系数说明其关联强度,。由于年龄与AKP酶反应活性都是有序分类变量,可考虑进行Spearman秩相关分析,得,单侧,可认为随着年龄的增加,AKP酶反应活也降低。三、最佳选择题1. B 2. C 3. C 4.D 5.A 6.B 7.B 8.C 9. D四、综

50、合分析题1解:(1) 由散点图(略)结合两个变量的正态性检验,可进行直线相关分析。由式(13.1)分别算出但需进行假设检验以推断总体上这种相关是否存在。(2) 检验相关是否具有统计学意义1) 建立检验假设,确定检验水准:,即血浆清蛋白含量及血红蛋白含量之间无直线相关关系 :,即血浆清蛋白含量及血红蛋白含量之间有直线相关关系2) 计算检验统计量由式(13.4)和式(13.5)得3) 确定P值,作出统计推断查t界值表(附表3),得,按=0.05水准,拒绝,接受,可以认为该病成年男性患者血浆清蛋白含量与血红蛋白含量呈正相关关系。输出结果血红蛋白含量血浆清蛋白含量(3) 结果解释通过对血浆清蛋白和血红蛋白两变量的正态性检验可以看出:两者的P值分别为0.200,0. 200,可以认为两变量都服从正态分布,故进行Pearson积矩相关分析。两者相关系数为0.916,按水准拒绝,可以认为该病成年男性患者血浆清蛋白和血红蛋白两变量呈正相关关系。 2解:此问题属于配对设计列联表的关联性分析。(1) 建立检验假设,确定检验水准:甲法和乙法之间互相独立:甲法和乙法之间互相关联(2) 计算检验统计量将表13-3中数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论