版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章 定量资料的统计描述 【习题解析】 一、思考题 1均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,。 不同点:均数用于单峰对称分布,特别是正态分布或近似正态分布的资料; 几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后 呈正态分布或近似正态分布的资料;中位数用于不对称分布资料、两端无确切 值的资料、分布不明确的资料。 2. 同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均 水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表 示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间 变异小,即一组观
2、察值的分布较集中。若标准差远大于均数表明数据离散程度较 大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。 3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的 离散程度。不同点:极差可用于描述单峰对称分布小样本资料的离散程度,或 用于初步了解资料的变异程度;四分位数间距可用于描述偏态分布资料、 两端 无确切值或分布不明确资料的离散程度;标准差用于描述正态分布或近似正态 分布资料的离散程度;变异系数用于比较几组计量单位不同或均数相差悬殊的 正态分布资料的离散程度。 4. 正态分布的特征:正态曲线在横轴上方均数处最高;正态分布以均数为 中心,左右对称;正态分布有
3、两个参数,即位置参数和形态参数匚;正态 曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区 间(-2.582.58二)内的面积为95.00%;区间(J -2.5 2.5)内的面积 为 99.00%。 5. 通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态 分布曲线下面积分布的规律制定医学参考值范围; 服从对数正态分布的变量,可 对观察值取对数后按正态分布法算出医学参考值范围的对数值, 然后求其反对数 即可;对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学 参考值范围。 二、案例辨析题 统计描述时,常见错误是对定量资料的描述均采用均数、标准差,。
4、正确做 法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资 料的血清总胆固醇的频数分布图如下: 图4-1 血清甘油三酯(TG)的频数分布 可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程 度,而应计算中位数和四分位数间距,计算结果为: 集中趋势指标 M 二 X 150 X 150/ 2 =(1.76 1.75)/2 =1.755 (mmol/L) V K丿严丿丿 离散程度指标 四分位数间距=P75 -P25 =2.10-1.34 = 0.76 (mmol/L) 三、最佳选择题 1. B 2. E 3. B 4. C 5. D 6. E 7. A 8. D
5、9. D 四、综合分析题 1. 解:输出结果 图4-4 尿总砷的频数分布图 由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换 输出结果 图4-5尿总砷对数的频数分布图 由图可见Igx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从 对数正态分布。 (2)燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何 均数。 输出结果 Descriptive Statistics N Minim um Maximum Mean Std. Deviation lgx Valid N (listwise) 176 176 -1.99 -.24 -1.1831 .39685
6、结果中的Mear表示尿总砷对数值的均数为-1.1831,求其反对数,得到几何 均数 G = 0.0656( 旧/L)。 2. 解: (1)已知健康人的血清TC服从正态分布,故采用正态分布法制定95%的参 考值范围。 下限:X 1.96S =4.841.96 0.96 =2.96 (mmol/L) 上限: X 1.96S =4.84 1.96 0.96 =6.72(mmol/L) 该市4555岁健康男性居民的血清总胆固醇的95%参考值范围为 2.96 mmol/L6.72mmol/L 。 (2) 4555岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标 准化变换后,查表确定正态分布曲线下
7、面积。由于是大样本,可用样本均数和样 本标准差作为总体均数和总体标准差的点估计值。 Z11 一 CT 5一4.84 1.66 0.96 Z 2 3=90.43 0.96 查标准正态分布曲线下的面积表(附表2)得: :J(Z1 )= ( -1. 66)0. 0485 (Z2) =1 - 门(-0.43) = 1 - 0.3336 = 0.6664 D = G(Z2)(乙)=0.66640.0485 = 0.6179 = 61.79% 该市4555岁健康男性居民中,血清总胆固醇在3.25mmol/L5.25mmol/L范 围内的比例为61.79%。 (3)作标准化变换 0.96 查标准正态分布曲线
8、下的面积表(附表2)得: (Z) =(一1.08) =0.1401 =14.01% 该市4555岁健康男性居民中,血清总胆固醇低于3.80mmol/L所占的比例为 14.01%。 3. 解: 输出结果 数 频 跟骨硬度指数 图4-8跟骨硬度指数的频数分布图 由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常, 故应使用百分位数法,制定双侧95%参考值范围。 输出结果 Statistics SI N Valid 120 Miss ing 0 Perce ntiles 2.5 58.0167 97.5 143.6618 即该地区3035岁健康女性的SI的95%参考值范围为(58.0
9、2, 143.66) 第五章定性资料的统计描述 【习题解析】 一、思考题 1 计算相对数应时有足够的观察单位数;分析时不能以构成比代替率; 计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求 其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;相对 数的比较应注意其可比性,如果内部构成不同, 应计算标准化率;样本率或样 本构成比的比较应作假设检验。 2. 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位 总数之比,用以说明该现象发生的频率或强度。 构成比是指事物内部某一组成部 分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各
10、组 成部分所占的比重,不能说明某现象发生的频率或强度大小。 两者在实际应用时 容易混淆,要注意区别。 3. 如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用 直接法计算标准化率;当不知道被标化组的年龄别死亡率, 只有年龄别人口数和 死亡总数时,可采用间接法。 4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展 速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展 速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化; 平 均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期 内逐年的平均发展程度;平均增长
11、速度是说明事物在一定时期内逐年的平均增长 程度。 5. 标准化法的目的是通过选择同一参照标准, 消除混杂因素的影响,使算 得的标准化率具有可比性。但标准化率并不代表真实水平,选择的标准不同, 计 算出的标准化率也不相同。因此,标准化率仅用于相互间的比较, 实际水平应采 用未标化率来反映。样本的标准化率是样本指标,亦存在抽样误差, 若要比较 其代表的总体标准化率是否相同,需作假设检验。注意标准化方法的选用。 如 对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时, 宜采用直接法 计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时, 宜采用间接法。各年龄组率若出现明显交叉,
12、或呈非平行变化趋势时,则不适 合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内 部构成不同引起的不可比性问题,标准化法难以解决。 二、案例辨析题 该结论不正确。因为该医生所计算的指标是构成比,只能说明 98例女性生 殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性 3种病原体感染发 生的频率或强度,该医生犯了以构成比代替率的错误。 三、最佳选择题 1. B 2. A 3. D 4. E 5. D 6. D 7. C 8. C 9. B 四、综合分析题 1. 解: 表5-3经常吸烟与慢性阻塞性肺病 (COPD)的关系 分组 调查人数 经常吸烟 -经常吸烟率(%) 是
13、否 COPD患者 356 231 125 64.89 非COPD患者 479 183 296 38.20 COPD患者的经常吸烟率:231/356采00%=64.89% 非COPD患者经常吸烟率:183/479 100%=38.20% COPD患者的经常吸烟率比非 COPD患者高26.69% 231 汉 296 比值比(OR)=2.989 125 勺 83 还需进一步对OR作假设检验(见第十一章),若经检验有统计学意义,可以 认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。 输出结果 分组*吸 烟情况Crosstabula t ion Count 吸烟情况 Total 不吸烟 吸烟 分组
14、 非COPD患者 296 183 479 COPD患者 125 231 356 Total 421 414 835 Risk Estimate Value 95% Con fide nee In tenal Lower Upper Odcfe Ratio for 分组(非 COPD患者 / COPD患者) 2.989 2.247 3.976 For cohort吸烟情况=非经常吸烟 1.760 1.503 2.061 For cohort吸烟情况=经常吸烟 .589 .513 .675 N of Valid Cases 835 2. 解: 表5-4 某地居民19982004年某病死亡率(1/1
15、0万)动态变化 年份 符号 死亡率 绝对增长量 发展速度 增长速度 累计 逐年 定基比 环比 定基比 环比 1998 a0 160.5 一 一 一 一 一 一 1999 a1 144.2 -16.3 -16.3 0.90 0.90 -0.10 -0.10 2000 a2 130.0 -30.5 -14.2 0.81 0.90 -0.19 -0.10 2001 a3 120.2 -40.3 -9.8 0.75 0.92 -0.25 -0.08 2002 a4 85.6 -74.9 -34.6 0.53 0.71 -0.47 -0.29 2003 a5 69.5 -91.0 -16.1 0.43
16、0.81 -0.57 -0.19 2004 a6 38.5 -122.0 -31.0 0.24 0.55 -0.76 -0.45 该病死亡率的平均发展速度 =n an/a0二6 38.5/160.5二0.79 该病死亡率的平均增长速度 二平均发展速度-仁0.79 -1= -0.21 3. 解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对 HBsAg阳性率的影响,应先进行标准化再进行比较。根据本题资料,以男、女 合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。 表5-5直接法计算某地不同年龄、性别人群的HBsAg标准化阳性率() 年龄组 标准人口数 Ni
17、男性 女性 原阳性率 Pi 预期阳性数 MPi 原阳性率 Pi 预期阳性数 NiPi 0 1081 2.30 24.90 2.32 25.09 20 1473 2.71 39.97 2.72 40.02 40 1546 6.06 93.63 6.46 99.86 60 1408 7.52 105.85 8.60 121.04 合计 5508(N) 5.11 264 (乞 N p ) 4.86 286(、Mp ) 264 男性HBsAg标准化阳性率:p100% =4.79% 5508 286 女性HBsAg标准化阳性率:p100% = 5.19% 5508 可见,经标准化后女性HBsAg阳性率高
18、于男性。 输出结果 Descriptive Statistics N Sum sp 4 5508.00 sp1 4 264.35 sp2 4 286.01 Valid N (listwise) 4 注:将SPSS输出的sp1的和除以sp的和,得男性HBsAg标准化阳性率;sp2 的和除以sp的和,得女性HBsAg标准化阳性率。 第六章总体均数的估计 【习题解析】 一、思考题 1 抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一 总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也 存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差 异称均
19、数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。 2 样本均数的抽样分布的特点有:各样本均数未必等于总体均数;样本均 数之间存在差异;样本均数服从正态分布;样本均数的变异范围较原变量的 变异范围小;随着样本含量的增加,样本均数的变异范围逐渐缩小。 3 标准差与标准误的区别在于:计算公式:标准差为 (X X)2 n _1 标准 误为SX二 ;统计学意义:标准差越小,说明个体值相对越集中,均数对数 S 据的代表性越好;而标准误越小,说明样本均数的分布越集中, 样本均数与总体 均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大; 用 标准差与标准误的联系: 当样本量n定
20、时,标准误随标准差的增加而增加, 途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小 公式为: SX 4. 数理统计的中心极限定理:从均数为 J,标准差为二的正态总体中进行独立 随机抽样,其样本均数服从均数为 ,标准差为匚/ . n的正态分布;即使是从非 正态总体中进行独立随机抽样,当样本含量逐渐增加时(n _ 50),其样本均数的 分布逐渐逼近于均数为 ,标准差为匚儿n的正态分布。越大,抽样误差越 大,由样本均数估计总体均数的可靠性越小。反之,;x越小,抽样误差越小, 由样本均数估计总体均数的可靠性越大。 计算总体均数置信区间的通式为:(X -匕2护乂取中0/2,小乂);当
21、样本含量 较大时,例如n 100,t分布近似标准正态分布,可用 Z值代替t值,作为置信 区间的近似计算,相应的置信度为(1 -)时,总体均数的置信区间为: (X -Z :/2Sx,X Z :/2Sx) 5. 置信区间与医学参考值范围的区别见表6-1 表6-1均数的置信区间与医学参考值范围的区别 区别 均数的置信区间 医学参考值范围 大多数正常人”的某项解剖、生理、生 化指标的波动范围 正态分布法:双侧95%的参考值范 围为(X -1.96S, X 1.96S) 偏态分布法: 按一定的置信度(1F)估计的总体均数所 意义 在的区间范围 未知:(X -ta2,eX,X +切2,保) 计算 er未知
22、而n较大: 公式 _ (X -Z:/2Sx,X Z:/2Sx) 二已知:(X -Z ./2-X ,X Z.J2-X ) 用途用于总体均数的估计或假设检验 单侧下限95%的参考值范围为.P5 单侧上限95%的参考值范围为:::F95 判断观察对象的某项指标正常与否,为 临床诊断提供参考 二、案例辨析题 该学生误用医学参考值范围的公式来计算总体均数的95%置信区间,正确计 算公式为:(X -乙/2Sx,X 乙./2Sx),二者的主要区别在于,计算医学参考值范 围时应该用“标准差”,计算置信区间时应该用标准误。根据置信区间的公式算 得2005年该市7岁男孩身高的95%置信区间为(122.01, 12
23、2.99)。 三、最佳选择题 1. C 2. E 3. E 4. A 5. E 6. A7. E 8. B 四、综合分析题 1.解:由于该样本为小样本,故用公式 X二.S估计总体均数 95%置信区 间为(8.27, 10.03)mm/h ;用公式X _2.797SX估计总体均数 99%置信区间为 (7.96, 10.34)mm/h。 输出结果 Descriptives Statistic Std. Error 红细胞沉降率 Mean 9.1481 .42563 95% Confidence Interval for Mean Lower Bound 8.2697 Upper Bound 10.
24、0266 5% Trimmed Mean 9.1795 Median 9.4288 Variance 4.529 Std. Deviation 2.12816 Minimum 5.01 Maximum 12.68 Range 7.67 Interquartile Range 2.73 Skewness -.250 .464 Kurtosis -.429 .902 Descriptives Statistic Std. Error 红细胞沉降率 Mean 9.1481 .42563 99% Confidence Interval for Mean Lower Bound 7.9576 Upper
25、 Bound 10.3386 5% Trimmed Mean 9.1795 Median 9.4288 Variance 4.529 Std. Deviation 2.12816 Minimum 5.01 Maximum 12.68 Range 7.67 Interquartile Range 2.73 Skewness -.250 .464 Kurtosis -.429 .902 2 解:抽样误差为1.82;由于该样本为大样本,故用公式XZSx估计 正常人ET含量的95%置信区间为(77.43, 84.57)ng/L。 输出结果 Descriptives Statistic Std. Err
26、or 血浆内皮素 Mean 80.9891 1.82033 95% Confidence Lower Bound 77.3771 Interval for Mean Upper Bound 84.6010 5% Trimmed Mean 80.8639 Median 79.5837 Variance 331.362 Std. Deviation 18.20334 Minimum 34.02 Maximum 129.20 Range 95.17 Interquartile Range 21.75 Skewness .182 .241 Kurtosis .140 .478 3解:由于两样本均为小样
27、本,故用公式X 士to.05/2wSx估计总体均数95%置 信区间,肺心病组血液二氧化碳分压的 95%置信区间为(7.86,13.10)kpa;慢性支 气管炎合并肺气肿组血液二氧化碳分压的 95%置信区间为(5.41 , 6.83)kpa。 由于方差不齐,应当选择方差不齐时的结果。两组患者的血液二氧化碳分 压差值的95%置信区间为(1.66, 7.05)kpa,该区间不包含0,可以认为肺心病患者 与慢性支气管合并肺气肿患者的均数不同,肺心病患者较高。 输出结果 Descriptives 组别 Statistic Std. Error 二氧化碳压 肺心病组 Mean 10.4782 1.2656
28、4 95% Lower Confidence Interval for Bound 7.8600 Mean Upper Bound 13.0964 5% Trimmed Mean 10.2266 Median 10.3473 Variance 38.444 Std. Deviation 6.20035 Minimum 1.59 Maximum 24.30 Range 22.71 Interquartile Range 7.13 Skewness .615 .472 Kurtosis -.030 .918 慢性支气管炎合并肺气肿组 Mean 6.1228 .33809 95% Lower Con
29、fidence Interval for Bound 5.4151 Mean Upper Bound 6.8304 5% Trimmed Mean 6.1266 Median 6.0160 Variance 2.286 Std. Deviation 1.51198 Minimum 2.93 Maximum 9.25 Range 6.32 Interquartile Range 1.78 Skewness -.081 .512 Kurtosis .192 .992 Group Statistics 组别 N Mean Std. Deviation Std. Error Mean 二氧化碳压 肺心
30、病组 24 10.4782 6.20035 1.26564 慢性支气管炎合并肺气肿组 20 6.1228 1.51198 .33809 Independent Samples Test Levenes Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. Mean Difference Std. Error Difference 95% Confidence Interval of the Differe nee Lower Upper 二氧 Equal 化碳 压 variances assum
31、ed 17.431 .000 3.061 42 .004 4.35547 1.42290 1.48394 7.22700 Equal variances not assumed 3.325 26.238 .003 4.35547 1.31002 1.66387 7.04706 第八章 t检验 【习题解析】 一、思考题 1 理论根据是小概率事件和小概率反证法。 P值表示H。成立时,出现等于及大 于(或等于及小于)现有样本统计量的概率。P 0.05则表示在H。成立的前提下, 得到现有样本统计量的概率为小概率事件,所以拒绝 H 0。 2. t检验中是选择单侧检验还是双侧检验,需要根据专业知识来确定。
32、例如,根 据专业知识能确定未知总体均数不会大(小)于标准值% (单样本t检验),则可 用单侧检验,否则,采用双侧检验。 3 配对t检验的应用条件是资料为配对设计,且数据差值服从正态分布。 4. 理论上讲应取得大一些,如0.10或0.20,目的是减少犯II型错误的概率; 在实际应用中,常取:=0.10。 5. 变量变换的目的在于使变换后的资料满足正态分别或方差齐性等条件,便于 进一步的统计分析。 6. 可以,大样本两组均数的 Z检验是两组均数比较t检验的近似。 二、案例辨析题 该医生的分析结果是错误的。正确作法应是分别将甲、乙两药各自治疗前后 的血沉值作差值,比较两组差值的均值是否有差别,具体步
33、骤如下: (1)正态性检验 分别对甲、乙两种药物治疗前后的血沉差值 dd2进行正态性检验。 甲药: Zskew - 0.005 0.687 : 1.96ZKurT. 3 6 0 1. 3 3 4 1. 9 6 乙药: Zskew =0.369 0.687 : 1.96 ZkurT0. 2 3 2 1. 3 341.96 故,甲药、乙药两组资料的差值di、d2均服从正态分布 (2)方差齐性检验 1)建立检验假设,确定检验水准 H。:二2,两差值总体方差相等 出:二:厂雳,两差值总体方差不等 :=0.10 2)计算检验统计量 S2 (较大) S (较小) 2 1.932 1.8142 = 1.13
34、4 比二耳 _1 =10 _1 = 9,v2 二 n2 _1 =10 _1 =9 3)确定P值,作出统计推断 查F界值表(附表4),得P 0.10,按:=0.10的水准,不拒绝H。,差异不 具有统计学意义,尚不能认为两差值总体方差不等。 (3)以差值dd2为资料,作两组均值t检验 1)建立检验假设,确定检验水准 Ho :叫2,即甲、乙两种药物的疗效无差别 Hi :叫,即甲、乙两种药物的疗效有差别 :-=0.05 2)计算检验统计量 5.8 - 3.2 9 1.93229 1.8142 10 10-2 :3.10 ;) v = ri门2-2=18 3)确定P值,作出统计推断 查t界值表(附表3)
35、,得0:P ,按=0 水准,拒绝H。,接受比, 差异具有统计学意义,可认为甲、乙两种药物的疗效有差别。由于乙种药物治疗 前后血沉值的差值较大(均数为5.8),故乙药物治疗效果要好于甲药。 输出结果 Descriptive Statistics g N Skewness Kurtosis Statistic Statistic Std. Error Statistic Std. Error 甲药 d Valid N (listwise) 10 10 -.005 .687 -.360 1.334 乙药 d Valid N (listwise) 10 10 .369 .687 -.232 1.334
36、 Group Statistics g N Mean Std. Deviation Std. Error Mean d 甲药 10 3.2000 1.93218 .61101 乙药 10 5.8000 1.81353 .57349 Independent Samples Test Leones Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of
37、 the Difference Lower Upper d Equal variances .006 .938 -3.103 18 .006 -2.60000 .83799 -4.36055 -.83945 assumed Equal variances not assumed -3.103 17.928 .006 -2.60000 .83799 -4.36105 -.83895 1.E 最佳选择题 2.C 3.C 4.B5.E6.E7.C 四、综合分析题 1.解:本题应进行单样本t检验,可按如下步骤完成: (1) 资料的正态性检验 ZSKEW = 0.312 0.564 : 1.96,ZKU
38、RT = 1.247 1.091 : 1.96 故资料服从正态分布。 (2) 单样本t检验 1) 建立检验假设,确定检验水准 H。:=72,即该山区成年男子的脉搏与一般成年男子脉搏无差别 H1:、72,即该山区成年男子的脉搏与一般成年男子脉搏有差别 :-=0.05 2) 计算检验统计量 由原始资料计算得: = 73.69, S =2.983,于是 73-72.27 SxS n 2.983 16 v = n -1=16-1=15 3) 确定P值,作出统计推断 ,按:=0(5水准,拒绝H。,接受H1, 查t界值表(附表3),得02: P05 差异有统计学意义,可以认为该山区成年男子脉搏与一般成年男
39、子脉搏有差别 输出结果 Descriptive Statistics N Skewness Kurtosis Statistic Statistic Std. Error Statistic Std. Error x Valid N (listwise) 16 16 .312 .564 1.247 1.091 On e-Sample Statistics N Mea n Std. Deviation Std. Error Mea n x 16 73.69 2.983 .746 On e-Sample Test Test Value = 72 t df Sig. (2-tailed) Mea n
40、 Differe nee 95% Co nfide nee In terval of the Differe nee Lower Upper x 2.263 15 .039 1.688 .10 3.28 2. 解:本题应采用配对t检验,完成步骤如下: (1)分别作甲、乙两药治疗前后差值d2的正态性检验 由案例辨析题中的结论可知,资料d2均服从正态分布 (2)对甲、乙两药分别作配对t检验 甲药: 1) 建立检验假设,确定检验水准 H。: 打=0,即甲药治疗前后血沉值无差别 H1:打=0,即甲药治疗前后血沉值有差别 :=0.05 2) 计算检验统计量 -d132 d 13.20 n 10 、。一匚
41、)2 Sd n -1 -1.93 3.20 5.25 0.61 t d d1d13.20 SdSSd1n 1.93 .10 v = n -1 = 9 3)确定P值,作出统计推断 查t界值表(附表3),得P ::: 0.001,按=0.05水准,拒绝H0,差异有统计 学意义,即甲药降低血沉有效。 乙药: 1)建立检验假设,确定检验水准 H0 :%2 =0,即乙药治疗前后血沉值无差别 Hi :%2 =0,即乙药治疗前后血沉值有差别 :-=0.05 2)计算检验统计量 二冬 5.80 10 Sd 、df-C d2)2 n n -1 = 1.81 丄dd 2 t SdSd2 Sd . n 1.8110
42、 580=10.13 3)确定P值,作出统计推断 查t界值表(附表3),得P : 0.001,按=0.05水准,拒绝H。,差异有统计 学意义,即乙药降低血沉有效。 输出结果 Paired Samples Statistics g Mean N Std. Deviation Std. Error Mean 甲药Pair治疗前 8.70 10 2.406 .761 1治疗后 5.50 10 3.100 .980 乙药Pair治疗前 9.60 10 1.838 .581 1治疗后 3.80 10 1.317 .416 Paired Samples Test g Paired Differences
43、t df Sig. (2-tailed) Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper 甲药Pair治疗前- 1治疗后 3.200 1.932 .611 1.818 4.582 5.237 9 .001 乙药Pair治疗前- 1治疗后 5.800 1.814 .573 4.503 7.097 10.114 9 .000 3解:本题资料为抗体滴度数据,一般服从对数正态分布,宜采用成组设计的 两小样本几何均数比较的t检验。 (1) 将原始数据取常用对数值后分别记为X
44、!、X (2) 正态性检验 用SPSS统计软件算得变量X!、X2的正态性检验结果 Xi : Zskew =0.104 0.661 :: 1.96 Zkurt0.641 1.2791. 96 X2 : Zskew =0.216/0.717 c1.96 Zku rt1. 04 1 1.4001. 96 故,X1,X2两组资料均服从正态分布 (3) 方差齐性检验 1) 建立检验假设,确定检验水准 Ho :2 -拧,两总体方差相等 H北匚;,两总体方差不等 匚-0.10 2)计算检验统计量 Qi =11,X1 = 2.79, S, = 0.45; n2 = 9, X2 = 2.27, S2 = 0.2
45、3,于是 F*(较大)=应=383 S;(较小)0.232. V1 = n1 T = 11 T = 10, V2 二门2 T = 9 T = 8 3) 确定P值,作出统计推断 查F界值表(附表4),得P 2C时,Poisson分布资料可作为正态分布处理。 、案例辨析题 不正确。溶液中的细菌数可以认为服从Poisson分布,当其“单位容积”所 含细菌数X 50时,可采用正态近似法估计总体均数的 (仁)置信区间。但本 例溶液的“单位容积”为10ml,应先用正态近似法估计出该溶液每10ml所含细 菌数的95%置信区间,再除以10即得到每1ml所含细菌数的95%置信区间。由 式(10.16河得,每10
46、ml该溶液所含细菌数的95%置信区间为651.96 650,故 每1ml该溶液所含细菌数的95%置信区间为61.96 650/10。 三、最佳选择题 1. A 2. C 3. B 4. E 5. C 6. E 7. E 8. C 四、综合分析题 1. 解:本例可认为治疗有效人数X服从二项分布,根据研究目的,选用单侧检 验。其假设检验步骤为: (1)建立检验假设,确定检验水准 H0:二=0.85,该药新剂型的疗效等于常规剂型 H1:二0.85,该药新剂型的疗效优于常规剂型 单侧二=0.05 (2)计算概率 本例,n = 20,二=0.85, k = 19, P = P(X _19) = P(19
47、)P(20) 20! 19!(20 -19)! 0.8519(1一0.85)心9 20! 20!(20 -20)! 0.8520(1 一0.85)也0 = 0.1368 0.0388 =0.1756 (3) 作出统计推断 由结果可见P 0.05,按=0.05水准,不拒绝H。,差异无统计学意义,尚 不能认为该药新剂型能增加疗效 2. 解:本例中,乳腺癌患病人数可认为服从 Poiss on分布,两个样本的观察单位 数不相等,以10000人为一个单位,则口=2,压=1。设甲、乙两地妇女乳腺癌 的患病率分别为和二2,其假设检验步骤为: (1) 建立检验假设,确定检验水准 H0:二1 =二2,两地妇女乳
48、腺癌患病率相等 H1:二1 二2,甲地妇女乳腺癌患病率高于乙地 单侧=0.05 (2) 计算检验统计量 41 Z = 2 L =1.095 41 15 22 12 (3) 作出统计推断 查t界值表(附表3二,得0.10 : P 020,按=0.05水准,不拒绝H0 差异无统计学意义,尚不能认为甲地妇女乳腺癌的患病率高于乙地。 第十一章2检验 【习题解析】 、思考题 1. 2检验的基本思想:在H。成立的条件下,推算出各个格子的理论频数 T,然 后利用理论频数T和实际频数A构造2统计量, 2八丁,反映实际频 数与理论频数的吻合程度。若无效假设 H。成立,则各个格子的A与T相差不应 该很大,即2统计
49、量不应该很大。A与T相差越大,2值越大,相对应的P值 越小,当P,则越有理由认为无效假设不成立,继而拒绝H。,作出统计推 断。由于格子越多,2值也会越大,因而考虑 2值大小的意义时,应同时考虑 格子数的多少(严格地说是自由度的大小),这样2值才能更准确地反映A与T 的吻合程度。 2检验可用于:独立样本两个或多个率或构成比的比较,配对设计两样本 率的比较,频数分布的拟合优度检验,线性趋势检验等。 2. 对不同设计类型的资料,2检验的应用条件不同: (1) 独立样本四格表的2检验 1) 当n 一40,且T 一5时,用非连续性校正的2检验。 2) 概率法 2 2 2 八(A -T)或 2 =(ad
50、- be) n T 或一 (a + b)(c + d)(a+c)(b十d) 2 八(A-T -0.5) -T (adb c nb) n 2 _ (a b) (c d) (a c) (b d) 当n 一 40,且有1 T ::: 5时,用连续性校正的2检验或用四格表的确切 3) 当n : 40或T C列联表,在比较各处理组的平均效应有无 差别时,应该用秩和检验或Ridit检验。 (3) 配对四格表的2检验 1) 当 b c 一40 时,2 =(b 一 c)。 b +c 2) 当b+cc40时,需作连续性校正,=(b_dT)。 b + c 3. 四格表的Z检验和$检验的联系,体现在:能用四格表 Z
51、检验进行两样本率 比较的资料,都可以用 2检验。四格表的双侧Z检验与2检验是完全等价的, 两个统计量的关系为Z2=E2,相对应的界值的关系为Zo205/ 2 = E0.05,1。 4. 拟合优度2检验是根据样本的频数分布检验其总体是否服从某特定的理论分 布。按照该理论分布计算的频数称为理论频数;从样本观察到的频数称为实际频 数。利用2检验,推断实际频数与理论频数的吻合程度。 5. 2检验的理论是基于 2分布,但是只有在大样本时检验统计量才近似服从 2分布,才能使用 2检验公式。如四格表资料,若 n 一40,且有1乞T : 5时, 尚可以校正检验统计量使其近似服从2分布;当n : 40时,这种近
52、似性就很差, 2检验就不适用了,只能用确切概率法。 二、案例辨析题 该研究的试验设计和统计分析方法均存在不合理的地方。 试验设计方面:样本含量偏小。该研究者在临床试验设计之初,就应该严格 按照临床试验设计要求,进行样本含量的估计,以保证足够的检验效能。此外, 由于急性细菌性下呼吸道感染,某些症状疗效的判断可能易受主观因素的影响, 因此应采用盲法。 统计分析方面:由于样本含量小于 40,不能采用2检验,应采用四格表的 确切概率法。具体步骤为: 1. 建立检验假设,确定检验水准 Ho :二1二二2,即两种抗生素治疗急性细菌性下呼吸道感染的有效率相同 H1 :,即两种抗生素治疗急性细菌性下呼吸道感染
53、的有效率不同 :-=0.05 2. 计算概率:在周边合计不变的条件下,以最小行、列合计所对应的格子 为基础,其取值的变动范围为从0到最小周边合计。本例中,将甲药治疗无效对 应的格子的取值从0增至10,可得到11个四格表,并按第1个格子的值由小到 大排列,结果见下表。 表11-4 Fisher确切概率法计算用表 序号i有效无效R 2 16 5 0 9 15 1 3 6 8 14 2 4 7 7 13 3 5 8 6 12 4 6 9 5 11 5 7 10 4 10 6 8 11 3 9 7 9 12 2 8 8 10 13 1 7 9 11 14 0 6 10 0.00107 0.01199
54、0.06397 0.18191 0.29105 0.26680 0.13860 0.03898 0.00533 0.00027 4. E 5. D 6. A 7. E 8. B 9. B 10. C (1) 资料整理后的表格为 表11-5 A、B两种抗生素治疗单纯性尿路感染的疗效 组别 有效 无效 合计 有效率(%) 抗生素A 37 5 42 88.10 抗生素B 29 13 42 69.05 合计 66 18 84 78.57 分组变量*治疗效果 Crosstabula t ion 治疗效果 Total 有效 无效 分组 A药组 Cou nt 37 5 42 变量 % withn分组变量 8
55、8.1% 11.9% 100.0% B药组 Cou nt 29 13 42 % withn分组变量 69.0% 31.0% 100.0% Total Cou nt 66 18 84 % withn分组变量 78.6% 21.4% 100.0% Chi-Square Tests Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 4.52屮 1 .033 Continuity Correction a 3.465 1 .063 Likelihood Ratio 4.
56、655 1 .031 Fishers Exact Test .061 .030 Linear-by-Linear Association 4.471 1 .034 N of Valid Cases 84 a Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The rinimum expected count is 9. 00. 2. 解: (1) 资料整理后的表格为 表11-6两种CT对煤工尘肺肺气肿的检查结果 螺旋CT HRCT 合计 有 无 有 73 2 75 无 7 14 21
57、 合计 80 16 96 :-0.05 2)计算检验统计量 本题b c = 9 : 40,应采用配对四格表2检验的校正公式: 2 _(b_c -1) 二(b+c) (2一7-1)2 十78 (2 7) =1 3)确定P值,作出统计推断 查2界值表(附表9),得P 0.05,按=0.05水准,不拒绝Ho,差异无统 计学意义,尚不能认为两种CT煤工尘肺肺气肿的检出率有差异 输出结果 螺旋CT检查结果*高分辨率CT检查结果Crosstabula t bn Count 高分辨率CT检查结果 Total 肺气肿 无肺气肿 螺旋CT 肺气肿 73 2 75 检查结 果 无肺气肿 7 14 21 Total
58、 80 16 96 Chi-Square Tests Value Exact Sig. (2-sided) McNemar Test N of Valid Cases 96 .180a a. Binom ial distribution used. 3. 解:本题资料为分类资料,欲比较 3种方案治疗单纯性肥胖的有效率有无差 异,宜选用独立样本R C列联表的2检验。具体步骤为: 1)建立检验假设,确定检验水准 H。:二1 =二2二二3,即3种方案治疗单纯性肥胖的有效率相同 Hi : 3种方案治疗单纯性肥胖的有效率不全相同 - =0.05 2)计算检验统计量 最小理论频数T二9.33,故直接将数据
59、带入独立样本 R C列联表2检验的 公式: =n( A nRnc -1) = 120 ( 352 40 92 52272 + 40 2840 92 132 40 28 302 40 92 102 40 28 -1) = 4.565 :=(R-1C(- 1) -( 3 1)(=2 1 3)确定P值,作出统计推断 查2界值表(附表9),得0.10 : P : 0.25,按:=0.05水准,不拒绝H。,差 异无统计学意义,尚不能认为 3种方案治疗单纯性肥胖的有效率不同。 输出结果 方案 * 疗效 Crosstabula t b n 疗效 Total 有效 无效 方案 甲方案 Count 35 5 4
60、0 % within 方案 87.5% 12.5% 100.0% 乙方案 Count 27 13 40 % within 方案 67.5% 32.5% 100.0% 丙方案 Count 30 10 40 % within 方案 75.0% 25.0% 100.0% Total Count 92 28 120 % within 方案 76.7% 23.3% 100.0% Chi-Square Tests Value df Asymp. Sig. (2-sided) Pears on Chi-Square 4.565s 2 .102 Likelihood Ratio 4.811 2 .090 Li
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度版权维权合同2篇
- 2024年度花店绿植租赁合同3篇
- 居间工程设计2024年度合作协议5篇
- 《小儿支气管肺炎》课件
- 《手卫生规范管理》课件
- 2024电子商务平台知识产权保护合同2篇
- 2024版库房货物保管服务承包协议3篇
- 2024年度建筑工程质量保修检测合同3篇
- 工厂代加工的合同
- 《天狼指标功能介绍》课件
- 机械设计基础知识点总结
- 落实三会一课制度
- 新概念英语第二册
- 福禄克Tix系列 红外热像仪使用说明书_图文
- 农田砂石机耕道施工方案及方法
- 空心胶囊工艺验证知识讲解
- 彩色学生电子小报手抄报模板昆虫小报
- 船舶火灾及灭火中的注意事项
- 《费曼学习法》PPT课件
- 篮球球性练习教案
- (项目管理)高速公路PPP项目运营方案
评论
0/150
提交评论