医学统计学课后习题答案_第1页
医学统计学课后习题答案_第2页
医学统计学课后习题答案_第3页
医学统计学课后习题答案_第4页
医学统计学课后习题答案_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学名词解释:

第一章绪论答案

观察单位(或个体)之间的差异。体中随机抽取的部分观察单位。抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。p计量资料:由一群个体的变量值构成的资料称为计量资料。资料。。料。1.×2.×3.×4.×5.√6.√7.×单选题:1.C 2.E 3.D 4.C 5.D 6.B第二章计量资料统计描述及正态分布答案名词解释:平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分称为标准状态分布。参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指填空题:

标范围称为指标的正常值范围。计量,计数,等级设计,收集资料,分析资料,整理资料。u4. 5.

(变量变换)标准正态分布、0、168.27% 95% 99%均数、标准差全距、方差、标准差、变异系数8.9.全距 R10.检验水准、显着性水准、0.05、 0.01(0.1)11.80%90%95%99%95%12.95%99%集中趋势、离散趋势中位数同质基础,合理分组均数,均数,μ,σ,规律性标准差是非题:1.×2.√3.×4.×5.×6.√7.√8.√9.√10.√11.√12.√13.×14.√15.√16.×17.×18.×19.√20.√21.√1.B 2.D 3.C 4.A 5.C 6.D 7.E 8.A 9.C 10.D11.B12.C13.C14.C15.A16.C17.E18.C19.D20.C21.B22.B23.E24.C25.A26.C27.B28.D29.D30.D31.A32.E33.D34.A35.D36.D37.C38.E39.D40.B41.C42.B43.D44.C45.B问答题:均数﹑几何均数和中位数的适用范围有何异同?不同点:表2-5.表2-5均数,几何均数和中位数的相异平均数 意 义 应用场合均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布几何均数 平均增减倍数 ①等比资料;②对数正态分布资料中位数 位次居中的观 ①偏态资料;②分布不明资料;③分布一端或察值水平 端出现不确定值中位数与百分位数在意义上﹑答:1)50P即中位数。多个百分位数结合使用,可更全面地描述总体或50样本的分布特征。计算:中位数和百分位数均可用同一公式计算,即Px=L+(i/f)(n·x%-Σf)x L可根据研究目的选择不同的百分位数代入公式进行计算分析。更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。同一资料的标准差是否一定小于均数?答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。变异大,标准差就大,有时比均数大;变异小,标准差小。测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?样本含量的大小,样本含量越大,标准差越稳定。分组的多少分布形状的影响,偏态分布的标准差较近似正态分布大随机测量误差大小的影响研究总体中观察值之间变异程度大小正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示方法不同,正N(μ,σ2)N(0,1)

,lgXσ2 )表示。lgX应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。医学中参考值范围的含义是什么?确定的原则和方法是什么?(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)数据绝大多数人的波动范围。原则:①抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越可100原则。前提。③判定是否要分组(如男女、年龄、地区等)确定正常值范围。④决定取双侧范围值还是单侧范围值。⑤选择适当的百分范围⑥确定可疑范围⑦估计界值方法:①百分位数法:P=L+(i/f)(n·x%-Σf)x x L②正态分布法(对数正态分布):百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。对称分布资料在“均数±1.9695%的观察值吗?计算题:10130~49(mmol/L)测定结果如下:4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.216.515.185.774.795.125.205.104.7040743.504.694.384.896.255.324.504.633.614.444.434.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.865.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.043.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05(1)编制频数分布表,简述其分布特征。①找出最大值、最小值求全距(R):全距=最大值-最小值=7.22-2.70=4.50(mmol/L)②求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L)③分组段,划记(表1-1)表2-6某地101例30~49岁健康男子血清总胆固醇值划记表组段(mmol/L)划记频数2.5~13.0~83.5~94.0~234.5~255.0~175.5~96.0~66.5~27.0~7.51合计101由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。2-710130~49(mmol/L)X、s血清总胆固醇值组中值X频数ffXfX2累计频数累计频数(实际)2.5~2.7512.757.56310.00993.0~3.25826.0084.50090.08913.5~3.75933.75126.563180.17824.0~4.252397.75415.438410.40594.5~4.7525118.75564.063660.65355.0~5.251789.25468.563830.82185.5~5.75951.75297.563920.91096.0~6.25637.50234.375980.97036.5~6.75213.5091.1251000.99017.0~7.57.2517.2552.5631011.0000478.252242.315注:Xu为组段上限值XsCV。由上计算表1-2可见:XfX/f478.25/101=4.735(mmol/L)2342.313(478.25)2342.313(478.25)2/1011011CV=s/x100%=0.882/4.735100%=18.627%M,XMM=L+(i/f

)(n50%-Σf)50 L=4.5+(0.5/25)(10150%-41)=4.69(mmol/L)本题算术均数为4.735(mmol/L),与中位数4.69(mmol/L)很接近,这也是资料服从正态分布的特征之一。P2.5P97.5X±1.96sP=3.0+(0.5/8)(1012.5%-1)=3.095(mmol/L)2。5P=6.5+(0.5/2)(10197.5%-98)=6.619(mmol/L)97.5X1.96=4.735±1.960.882=3.01~6.46(mmol/L)S用百分位数法求得101例30~49岁健康男子血清总胆固醇值95%分布范围3.095~6.619(mmol/L),与正态分布法求得的95%分布范围3.01~6.46(mmol/L)基本一致。X1X1.96X2.58范围内的实际频数与理论分布是否基本一致S S S(表1-3)表2-8某地101例30~49岁健康男子血清总胆固醇值理论分布与实际分布比较Xus血清总胆固醇实际分布理论分布X3.85~5.62人数 %72 71.29%68.27X1.96s3.01~6.4697 96.0495.00X2.58s2.46~7.01100 99.0199.00由上表,XX1.96sX2.58s范围内,实际分布与理论分布基本一致。现测得一40若按95%30~49的人血清总胆固醇值比他高?95%406.993(mmol/L),95%范围以外,故属于异常u=(X-μ)/σ=(6.993-4.735)/0.882=2.56ф(2.56)=ф(-2.56),1ф(-2.56)=0.0052估计该地30~49健康男子中约有0.52%的人血清总胆固醇值比他高。2.某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑制抗体滴度资料如表2-9第(1)(2)栏。表2-9 平均滴度计算表抗体滴度人数f滴度倒数X1lgX1flgX1(1)(2)(3)(4)(5)=(2)×(4)1:8280.90311.80621:166161.20417.22471:325321.50517.52571:6410641.806218.06181:12841282.10728.42881:25622562.40824.81651:51215122.70932.7093合计3050.5730(1)试计算其平均滴度。由表1-4得,G=lg-1(50.5730/30)=lg-11.6858=48.5该站30名麻疹易感儿童经气溶胶免疫一个月后,测得血凝抑制抗体平均滴度为1:48.50表2-10平均滴度计算表抗体滴度 人数f 滴度倒数X(1)(2)(1)(2)(3)(4)(5)=(2)(4)1﹕8280.90311.80621﹕166161.20417.22471﹕325321.50517.52571﹕6410641.806218.06181﹕12841282.10728.42881﹕25622562.40824.81651﹕51215122.70932.7093合计3050.5730

lgX1

flgX1(2)有人发现本例用抗体滴度稀释倍数和直接用滴度(原书误为倒数)算得对数值的标准差相同,为什么?表2-11滴度对数值计算表抗体滴度X2

人数f lgX2

flgX21﹕82-0.9031-1.80621﹕166-1.2041-7.22471﹕325-1.5051-7.52571﹕6410-1.8062-18.06181﹕1284-2.1072-8.42881﹕2562-2.4082-4.81651﹕5121-2.7093-2.7093合计30-50.57301)1-4:slgx=lg-10.4444=2.782312)1-5:slgx=lg-10.4444=2.78232直接用抗体滴度的对数lgx与稀释倍数的对数lgx计算标准差是相等的,因为由上表2 1lgx=lg1-lgX=-lgxlgx-lgx2 1 1 1 1和直接用滴度算得对数值的标准差是相同的。502-12,何者的代表性较好?并作计算。表2-1250例链球菌咽峡炎患者的潜伏期的中位数计算表潜伏期(小时)病例数f累计频数12~1124~7836~111948~113060~772~584~496~2108~1202合计 50本例目测频数分布为偏态分布,长尾拖向右侧,故为正偏态,宜用中位数及几何均数表示其平均水平。如上表,经计算中位数,几何均数、算术均数分别为:M=54.55(小时),G=54.08(小时),X=58.56(小时)显然,算术均数受长潜伏期MGMG19742382-13:2-13238发汞值 人数f 组中值X fX fX2 累计频数 累计频率(μmol/kg)1.5~202.550.0125.00208.403.5~664.5297.01336.508636.105.5~606.5390.02535.0014661.347.5~488.5408.03468.0019481.509.5~1810.5189.01984.5021289.0811.5~1612.5200.02500.0022895.8013.5~614.587.01261.5023498.3215.5~116.516.5272.2523598.7417.5~018.50.00.0023598.7419.5~21.5320.561.51260.75238100.00合计2381699.014743.502481.5%,长尾拖向右侧,呈极度正偏态。计算均数和中位数M合适?XfX/f=1699/238=7.139(μmol/kg)M=L+(i/f

)(n50%-Σf)50 L=5.5+2/60(23850%-86)=6.6(μmol/kg)XM其原因因为本例呈正态分布,均数计算结果受到少X料的集中趋势较好,它不受两端较大值和极小值的影响.选用何种指标描述其离散程度较好?选用四分位数间距描述其离散程度较好.(4).估计该地居民发汞值的95%参考值范围本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大,n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范围较为合适.P=L+(i/f)(n95%-Σf)95 95 L=11.5+(2/16)(23895%-212)=13.2625(μmol/kg)第三章均数的抽样误差与t检验答案填空题:1.标准误2.0.05,0.01假设检验,(显着性检验)两总体均数不同(越有理由说明有统计学意义)自由度大小一是准确度、二是精度抽样误差、样本均数、总体均数总体均数估计、假设检验第二类错误(Ⅱ型错误)β是非题:1.√2.×3.×4.×5.√6.√7.×8.√9.×10.√11.√12.×13.√14.√15.√16.√17.√18.√19.×20.×21.×22.×单选题:1.A 2.E 3.D 4.E 5.E 6.E 7.D 8.A 9.D 10.D11.D 12.B 13.E 14.D 15.D 16.E 17.B 18.C 19.C 20.D21.C问答题:标准差和标准误有何区别和联系?表3-6标准差与标准误的区别标准差(α或s) 标准误(ax或sx)意义上 描述一组变量值之间的离散趋势 描述样本均数间的离散趋应用上 ①s越小,表示变量值围绕 ①sx越小,表示样本均数与均值分布越密集,说明均数 总体均数越接近,说明样本的代表性越好。 均数推断总体均数可靠性越大。,②可用Xus估计变量值分②可用Xt sx估计总体,a av布范围 均数可信区间与n的关系 n越大,s越趋于稳定 n越大,sx越小(2)联系①二者均是表示变异度大小的统计指标。n②标准误xn

与标准差大小成正比,与抽样例数n的平方根成反比。③当n一定时,同一份资料,标准差越大,标准误也越大。可信区间和参考值范围有何不同?X±1.96s95%的变布也就越散。而可信区间是指在可信度为)时,估计总体参数可能存在的范围。即从同一总体中随机抽样,当n一定时,每抽一次即可得一个样本均值,以Xta,vsx95%可信区间,类似的随机抽样进行一百次,平均有959555%标准误越大,可信区间则越大。假设检验和区间估计有何联系?假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比假设检验提供更多的PαPP<0.05H0,理论依据是什么?P<0.05,Ho,HoP<0.05,它是小概率事件,即在一次0.05。5.t检验和方差分析的应用条件有何异同?(1)相同点:在均数比较中,t组总体方差齐且各随机样本间相互独立,尤在小样本时更需注意。(1)不同点:t检验仅用于两组资料的比较,除双侧检验外,尚可进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。怎样正确使用单侧检验和双侧检验?根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有探索性质时,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出效率高,但应慎用。第一类错误与第二类错误的区别及联系何在?了解这两类错误有何实际意义?(1)假设检验中Ⅰ、Ⅱ型错误的区别。Ⅰ型错误是拒绝了实际上成立的Ho,也称为“弃真”错误,用α计推断时,根据研究者的要求来确定。Ⅱ型错误是不拒绝实际上不成立的Ho,也称为“存伪”错误,用β表示。它只能与特定的H结合起来才有意义,一般难以确切估计。

1Ⅰ、Ⅱ型错误的联系。①当抽样例数一定时,α越大,β越小;反之,α越小,β越大。②统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,可适当增加样本含量。③根据研究者要求,nα水平来控制β大小。了解两类错误的实际意义。①可用于样本含量的估计。②可用来计算可信度(1-α),表明统计推断可靠性的大小。③可用于计算把握度(1-β),来评价检验方法的效能等。④有助于研究者选择适当的检验水准。⑤可以说明统计结论的概率保证。某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:表3-7: 健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算性别例数均数标准差标准值变异系数(%)标准误红细胞数男3604.660.584.8412.450.0306(×1012/L)女2254.180.294.336.940.0182血红蛋白男360134.57.1140.25.280.3742(g/L)女255117.610.2124.78.670.6387说明女性的红细胞数与血红蛋白量的变异程度何者为大?CV=S/x×100%=0.29/4.18×100%=6.49%RBCCV=S/x×100%=10.2/117.6×100%=8.67%HB由上计算可知该地女性血红蛋白量比红细胞数变异度大n分别计算男﹑女两项指标的抽样误差。n见上表最后一栏,标准误计算公式sx

s/ 。试估计该地健康成年男﹑女红细胞数的均数。健康成年男子红细胞数总体均数95%可信区间为:X±1.96Sx=4.66±1.96×0.0306=4.60~4.72(1012/L)其中n=360故近似按υ=∞。同理健康成年女子红细胞数总体均数954.14~4.22(1012/L)该地健康成年男﹑女间血红蛋白含量有无差别?Ho:μ =μ男 女H:μ ≠μ1 男 女7.22/3607.22/36010.22/255u=(X1

X )/(sx2

x)117.6)/2

=22.83按υ2,P<0.0005,α=0.05Ho,H1以认为男女间血红蛋白含量不同,男高于女。将20(mm/小时)如下表,问:甲,乙两药是否均有效?甲,乙两药的疗效有无差别?表3-8 甲,乙两药治疗前后的血沉━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号 1 2 3 4 5 6 7 8 9 10甲━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前10136111078859治疗后693101042533差 值4431036326━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号 1 2 3 4 5 6 7 8 9 10乙━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前9109138610111010治疗后6353358274差 值37410512936━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━经计算得:甲药d =3.2000(mm/h) 乙药 d =5.0000(mm/h)S=1.9322(mm/h) Sd

=2.9810(mm/h)S=0.6110(mm/h) Sd d

=0.9428(mm/h)n=10 n=10Ho:μH

=0 Ho:μ=0d d≠0 H:μ≠01 d 1 dα=0.05 α=0.05t =d/S(甲药)

=3.2000/0.6110=5.237dt =d/S=5.0000/0.9428=5.303(乙药) d=9,tP<0.001,按α=0.05Ho,H1甲、乙两药均有效。甲,乙两药的疗效有无差别?由表中资料分别求得治疗前后差值(见表3-8),再作两组比较。H甲乙两药疗效相同0:H甲乙两药疗效不同 α=0.051:=18,t0.20>P>0.10,按α=0.05Ho,尚不能认为甲乙两药疗效有差别。将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如 下问两组的平均效价有无差别?标准株(11人)1002004004004004008001600160016003200水生株(9人)100100100200200200200400400由题知:该资料服从对数正态分布,故得:标准株 水生株n=11 n=9Xlgx =2.7936 Xlgx =2.26761 2Slgx =0.4520 Slgx =0.23551 2两组方差齐性检验:H20: 1 2H21: 1 2 =0.05F=S

2/S大

20.45202/0.235523.684小V=10 V=8 F =4.301 2 0.05(10,8)3,P>0.05,按α=0.05Ho,可以认为两总体方差齐。两组均数比较;H两总体几何均数相等0H两总体几何均数不等1α=0.05t0.01>P>0.005,按α=0.05Ho,H1体病人的血清用标准株和水生株作凝溶试验,前者平均抗体效价高于后者3-9表3-9某地健康成人的第一秒肺通气量(FEV1)(L)FEV 人 数1男女2.0~142.5~383.0~11233.5~27334.0~36204.5~26105.0~1025.5~306.0~6.510合计118100统计描述。11812.0~6.5,4.0~4.5组段内,以中间频数分布最多,两侧逐渐减少,左右基本对称,其频数分布可见上表和下10012.0~2.5,3.5~4.03-93-1。4040男女30201002.0 2.5 3.03.54.0 4.55.05.5 6.06.5图3-1 某地健康成人第一秒肺通气量(FEV)(L)分布1由上表和图可见,男性分布范围较宽,右侧尾部面积向外延伸两个组段,高峰位置高于女性,向右推移一个组段。计算集中与离散趋势指标,并对两组进行比较。Ho:1H11α=0.05男性:n=118

=4.2373 s=0.69021 1女性:n=100 X2=3.7250 s2=0.6258u=(X1

X )/sxx2 1

(X1

X )/S2/S2/ns2/n1 1 2 20.690220.69022/1180.62582/100=5.624查t界值表,v=∞,得P<0.001,按α=0.05水准,拒绝Ho,接受H,故可认为1男女间第1秒肺通气量均数不同,男高于女。95%195%Xu

0.05

s=4.2373-1.6450.6902=3.16(L)95%1195%参考范围下限为:Xu

0.05

s=3.7250-1.6450.6258=2.69(L)即可认为有95%的女性第1秒肺通气量不低于2.69(L)某医师就表3-10资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前,(接 后两月)血清抗体(黄疸出血型)的变化。表3-10 328例血清抗体滴度及统计量抗体滴度的倒数0 2040801603206401280Xssx免疫前人数211 2719242519376.1111.76.17免疫后人数2 16577675542523411.9470.525.90t=(411.91-76.1)/t=(411.91-76.1)/25.926.172=12.6>3,查tP<0.01,说明接种后血清抗体有增长。试问:统计处理上是否妥当?统计处理上不妥当,因为:①在整理资料过程中,未按配对设计整理,而是拆开对子按成组设计整理,失去原设计的意义。②统计描述指标使用不当,血清浓度是按倍比稀释,不适合计算算术均数、标准差、因为有零值,也不宜计算几何均数。对现已整理好的资料,可计算中位数表示平均水平,用四分位数间距表示离散趋势。③假设检验因本资料不宜计算均数,故对均数进行t检验当然是不妥当的。6.15295%区间估计。滴度倒数12481632641282565121024合计人 数0017103133422431152XX1gx=1.85965n=152,1.85965=72.3995%lg-1(Xlgx+1.96Slgx/√n)=lg-1(1.85965+1.96×0.44245/√152)=lg-1=61.5~85.1191得表白细胞总数(×109/L),问该药是否对患者的白细胞总数有影响?表3-11 9例慢性苯中毒患者治疗前后的白细胞总数病人号治疗前治疗后d116.04.21.824.85.4-0.635.06.3-1.343.43.8-0.457.04.42.663.84.0-0.276.05.90.183.58.0-4.594.35.0-0.7H该药对患者的白细胞总数无影响,即μ=00 dH该药对患者的白细胞总数有影响,即μ≠01 dα=0.05求得(前—后)差值di

经计算得:d =0.3556 Sd

=1.9951 n=9dt=0/(s / n)0.3556/(1.9551/ 9)0.534dd=8P>0.5,α=0.05Ho,该药对患者的白细胞总数有影响。(2)同样得治疗后血小板比治疗前每人平均增加37.8×109/L,并算得t=4.1,问该药是否对患者的血小板有影响?H该药对患者的血小板无影响,即μ=00 dH该药对患者的血小板有影响,即μ≠01 dα=0.05d=37.8 t=4.1 =8

2,t0.005>P>0.002,按α=0.05Ho,H1综合上述结果能否提出进一步研究意见/综合上述结果,提出以下建议:t95%可信区间,结合专业知识,分析治疗前后指标差数有无实际意义。②如有可能扩大样本,追踪观察该药对苯中毒患者的远期疗效第四章 方差分答案处理组总体方差相等(方差齐性)总变异、组内变异、组间变异 SS总=SS组间+SS组内q(Newman-Keuls)V=SS+SS是非题:1.× 2.√ 3.× 4.√ 5.×单选题:1.B 2.D 3.E 4.B 5.C 6.A 7.C 8.C计算题:2-4别?表4-1: 某湖水不同季节氯化物含量(mg/L)∑Х春夏春夏秋冬22.619.118.919.022.822.813.616.921.024.517.217.616.918.015.114.820.015.216.613.121.918.414.216.921.520.116.716.221.221.219.614.8∑167.9159.3131.9129.3588.488883220.9919.9116.4916.168.393548.513231.952206.272114.1111100.84niX∑Х2ijS2

.5298 8.5555 4.5098 3.4712 5.0166 i 多组均数间比较:变异来源SS表1:v方差分析表MSF总变异281.63531组间变异141.170347.0579.380组内变异140.465285.017FP<0.01,0.05H0,接受H1,氯化物含量不同或不全相同。各组均数间两两比较H0:μ=μA BH1:μ≠μA Bα=0.05

表2 四个样本均数顺序排例组别春夏秋冬X20.9919.9116.491位次1234表3 四组均数两两比较q检验对比组两均数之差组数q值P值144.8346.099<0.01134.5035.682<0.01121.0821.364>0.05243.7534.735<0.01233.4224.319<0.01340.3320.417>0.05P>0.05,按α=0.05Ho4<0.01,按α=0.05Ho,H1,量高于秋冬两季。4-2否会影响生存日数?表4-2各组大鼠接种后生存日数伤寒百日咳对照568769871098101091110912111012111014121116∑∑Хij9284112288ni10101030Xi9.28.411.29.6∑X2ij88673213062924si4.4002.9335.7334.3553解Ⅰ:假定生存日数服从正态分布(1)方差齐性检验:Ho:三总体方差齐即2221 2 3H:三总体方差不等或不全相等。1α=0.05s2s2(n/(Nk)9(4.4+2.933+5.733)/(30-3)=4.3553c i i=0.9461v=2,9,X20.75>P>0.50,按α=0.05Ho,可认为三组资料总体方差齐。(2)三组均数比较(表4-5)Ho:H:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全1相等α=0.05C=(∑∑Χ

)2/n=2882/30=2764.8ijSS总

2-C=2924-2764.8=159.2ijSS组间

)2/ni-Cij=[922+842+1122]/10-2764.8=41.6SS=SS-SS=159.2-41.6=117.6组内 总 组间表4-5 方差分析表变异来源SSvMSF总变异159.229组间变异41.6220.84.776组内变异117.6274.35564,0.05>P>0.01,α=0.05Ho,接受H1大白鼠感染脊髓灰质炎病毒后,在接种伤寒或百日咳菌苗对生存日数有影响。(3)均数间多重比较:Ho:H1α=0.05伤寒与对照组比较4.3556(1/104.3556(1/101/10)=2/0.933338=2.1428v=27,0.05>P>0.02,α=0.05Ho,接受H1苗组较对照组生存日数减少。百日咳与对照组比较v=27,2,0.01>P>0.005,按α=0.05Ho,H1为接种百日咳菌苗组较对照组生存日数减少。8440,45,90,135糖浓度(mmol/L)(1)4组血滤液方差齐性检验:Ho:不同放置时间血滤液所含血糖浓度总体方差相等,即22221 2 3 4H:不同放置时间血滤液所含血糖浓度总体方差不等或不全相等1α=0.05方差齐性检验方法同本例X2=1.16847v=k-1=4-1=3,9,X20.90>P>0.75,按α=0.05Ho,表4-3放置不同时间血滤液所含血糖浓度(mmol/L)受试者编号 放置时间 受试者小计0 45 90 13515.275.274.494.6119.6425.275.224.884.6620.0335.885.835.385.0022.0945.445.385.275.0021.0955.665.445.384.8821.3666.226.225.615.2223.2775.835.725.384.8821.8185.275.115.004.4419.82ΣΧ 44.84 44.19 41.39 38.69 169.11ijn 8 8 8 8 8iX 5.6050 5.5238 5.1738 4.8363 5.2847i∑X2ij

252.1996 245.0671 215.0527187.5585 899.8779s2 0.1245 0.1389 0.1302 0.0634 0.1143i(2)配伍组设计方差分析:处理:Ho:不同放置时间血滤液所含血糖浓度相同H:不同放置时间血滤液所含血糖浓度不同或不全相同相同1α=0.05配伍:Ho:8位受试者血液所含血糖浓度相同H:81α=0.05С=(ΣΣⅩ

)2/n=169.112/32=893.6935ijSS=ΣΣⅩ2-С=899.8779-893.6935=6.1844总 ij1SS =(X )2C放置时间 b ij=(44.842+44.192+41.392+38.692)/8-893.6935=2.98524SS =1/k(X )2C受试者 ij=1/4(19.642+20.032+22.092+21.092+21.362+23.272+21.812+19.82)-893.6935=2.79093SS=SS-SS -SS误差 总 放置时间 受试者=6.1844-2.98524-2.79093=0.40832方差分析表变异来源SSvMSF总变异6.184431放置时间2.9852430.9950851.189受试者2.7909370.3987020.510误 差0.40823210.01944查F界值表F0.05(3,21)=3.07F0.05(7,21)=2.49F0.01(3,21)=4.87F0.01(7,21)=3.64P<0.01,α=0.05Ho,接受H1不同放置时间、不同受试者间血滤液所含血糖浓度不同或不全相同。照组均数间两两比较。①Ho:放置45分钟与0分钟血滤液所含血糖浓度相同H:放置45分钟与0分钟血滤液所含血糖浓度不同1α=0.05=0.0812/0.06971=1.16476v=n-k=32-4=28,2,t0.40>P>0.20,按α=0.05Ho,450②Ho:放置90分钟与0分钟血滤液所含血糖浓度相同H:放置90分钟与0分钟血滤液所含血糖浓度不同1α=0.05=0.4312/0.0697=6.1853v=28,P<0.001,α=0.05Ho,接受H1900③Ho:1350H:放置135分钟与0分钟血滤液所含血糖浓度不同1α=0.05=0.7687/0.0697=11.0265v=28,查附表P<0.001,α=0.05Ho,接受H1故可认为放置135分钟较0分钟血滤液所含血糖浓度减少。某医师为研究人体肾上腺皮质3HSD (羟基类固醇脱氢酶)活性在四个季节中否有差别,采用分光光度计随机测定了部分研究对象,数据见表2.8,请做统计分析.表4-4 四个季节的人体肾上腺皮质3HSD活性季节 n X S春季420.780.13夏季400.690.22秋季320.680.14冬季360.580.20解:本题仅给出分析思路及主要结果1. 采用完全随机设计资料的方差分析: X由公式X n 可推得 X由方差公式可推得

X2

(X)2n s2(n计算SS SS SS总 组间 组内SS=5.365,SS =0.777SS=4.588总 组间 组内列出方差分析表方差分析表变异来源SSvMSF总变异5.365149组间变异0.77730.25908.248组内变异4.5881460.0314(4)确定P值,判断结果P<0.01,在=0.05Ho,H,可以认为四个季节人1体肾上腺皮质3HSD (羟基类固醇脱氢酶)活性不同或不全相同.2.进一步作均数间的多重比较分析(略)第五章相对数答案填空题比重和分布,频率与强度率消除混杂因素对结果影响率,构成比,相对比率的抽样误差δx是非题:1.√ 2.× 3.√ 4.× 5.√ 6×. 7.× 8.× 9.× 10.×11.×单选题:1.D 2.E 3.A 4.D 5.A 6.B 7.D 8.A 9.D 10.D11.B 12.E 13.A 14.C 15.E 16E. 17.E 18.B 19.A 20.A21.C 22.D计算题:5-1(1)~(4)作初步分析。表5-1不同体重,孕周,产次的围产儿死亡情况分析因素分组出生数死亡数死亡构成比(%)死亡率(%)(1)(2)(3)(4)(5)(6)体重(g)1000~10291123451.18119.912500~193261112946.835.844000~5373481.998.93合计2089252411100.0011.54孕周(周)<3818178206050.55113.3238~189937177143.469.3242~140132445.9917.41合计2221284075100.0018.35产次(次)1133290194062.8014.5525159673923.9214.32372562598.3835.6941786822.6545.91≥5954692.2372.33合计1948823089100.0015.85先就上述资料计算了上表(5)~(6)栏两类指标。2500g2500g203812亡率也逐渐升高。1000~2500g加强产前保护。表5-2填补空白数据,见下表( )内。表5-2某地各年龄组恶性肿瘤死亡情况年龄人口数死亡总数其中恶性恶性肿瘤死亡恶性肿瘤死年龄别死(岁)肿瘤死亡数占总死亡的(%)亡率(1/10万)亡率(%0)(1)(2) (3)(4)(5)=(4)/(3)6)=(4)/(2)(7)0~82920 (138)42.90(4.82)(1.644)20~(46638) 63(12)19.0525.73(1.351)40~28161 17242(24.42)(149.142)(6.108)60~(9371)(342)32(9.63)(341.479)(36.496)合计167090 7159012.59(53.863)(4.279)根据最后(5)(6)(7)三栏结果作简要分析由表中第1/4;20~岁组次之,占岁组恶性肿瘤死亡人数最多,但仅占岁组恶性肿瘤死亡占总死2.90%由表中第60~341.479/10栏可知:年龄别死亡率以4036.496‰。试估计“0~”岁年龄组恶性肿瘤死亡率和年龄别死亡率的可信区间。0~4,查poissonu1.0~10.295%可信区间为:(1.0/82920~10.2/82920)=(1.206~12.301)/10万0~岁组年龄别死亡率的可信区间,按式:试比较“20~”与“40~”岁组恶性肿瘤死亡率有无差别。Ho:20~与40~岁组恶性肿瘤死亡率相等,即π=π1 2H:20~与40~岁组恶性肿瘤死亡率不相等,即π≠π1 1 2α=0.05本例:n=28161 x=42 n-x=281191 1 1 1n=46638 x=12 n-x=466262 2 2 2合计: 74799 54 74745X2=37.07X2P<0.005α=0.05H20~40~1岁组恶性肿瘤死亡率有差别。试就表5-3资料分析比较甲乙两医院乳腺癌病人手术后的五年生存率表5-3 甲乙两医院乳腺癌病人手术后五年生存率标化(甲+乙医院合计为标准)腋下淋巴结转移标准病例数甲医院原生存率(%) 预期生存人数乙医院原生存率(%) 预期生存人数NiPi NiPiPi NiPi(1)(2)(3) (4)=(2)(3)(5) (6)=(2)(5)无34577.77 268.3171.67 247.26有79363.38 502.6050.60 401.26合计 1138(∑Ni)64.24 770.91(∑NiPi) 67.10 648.52甲医院乳腺癌手术后五年标化生存率'

Ni i

770.91×100%= ×100%=67.74%N 1138乙医院乳腺癌手术后五年标化生存率'

Ni i

648.52×100%= ×100%=56.99%N 1138因为甲乙两医院有无腋下淋巴结转移的病型构成不同,故标化后,甲医院乳腺癌手术后五年生存率高于乙医院,校正了标化前甲医院低于乙医院的情况。2004015020人。(1)该乡男性感染率是否高于女性?Ho:男女性的钩虫感染率相同,即π =π男 女H:男性的钩虫感染率高于女性,即π >π1 男 女单侧α=0.05P=40/200=0.2 P=20/150=0.13331P=(X+X)/(n

2)=60/350=0.1714C 1 PPP/nCC11/n)2

1 2PP1 2(0.1714(10.1714)(1(0.1714(10.1714)(1/2001/150)

1.6385tυ0.10>P>0.05,按α=0.05Ho,能认为该乡男性钩虫感染率高于女性。(2)若对该乡居民作驱钩虫治疗,需要按多少人准备药物(全乡人口男7253人,女7109人)?计算该乡钩虫感染率的95%可信区间:=(13.19~21.09)%14362×13.19%=1894(人) 14362×21.09%=3029(人)至少需要按1894人,最多按3029人准备药物。28398%,4090.3%,6010.2%4.5%(P<0.01以上分析是否妥当,试加评述。表5-4 男、女年龄组高血压病例分布男性女性年龄组——————————————————————————————受检人数病例数发病率(%)受检人数病例数发病率(%)20~33351.571240.630~30141.314296.340~5176412.41852714.650~5769316.061914.860~1212100.0合计173917810.21100494.5答:该分析不正确。因为:8%,60100%,60由于男女性受检人数的年龄构成不同,不能直接比较两总患病率,对男女合计进行50~30~40~比较各年龄组的患病率,而不宜使用标准化。447011624~2992.2%,合一般规律”。母亲年龄(岁)212324252627282930313233合计畸形儿例数 121419241819133111116% 0.861.712.116.420.715.516.411.2 2.60.860.860.86100.00以上结论是否合理?为什么? 以上结论不合理,不能以比代率。若要达到作者的目的,应计算产妇年龄别畸形儿发生率。某年龄(组)畸形儿发生率=某年龄组先天性畸形的胎婴儿数100%该年龄组活产死产死胎数1971~19815-5,5-51971~1981年份发病率(1/10万)绝对增长量累计 逐年发展速度(%)定基比 环比增长速度(%)定基比 环比197120.52— —100 100— —19726.31-14.21-14.2130.7530.75-69.25-69.2519731.87-18.56-4.449.1129.64-90.89-70.3619743.07-17.451.2014.96164.17-85.0464.1719751.08-19.44-1.995.2635.18-94.74-64.8219761.38-19.140.306.73127.78-93.2727.7819772.29-18.230.9111.16165.94-88.8465.9419782.31-18.210.0211.26100.87-88.740.8719792.47-18.050.1612.04106.93-87.966.9319802.76-17.760.2913.45111.74-86.5511.7419812.94-17.580.1814.33106.52-85.676.52本资料从1971年到1974年,发病率呈下降趋势,1975年开始呈上升趋势,故以1975年为基期计算。662.94/1.08

118.2%平均增长速度=平均发展速度-1=1.182-1=18.2%1971,1017.58/101971~197519751981118.218.2%。5-6表5-6某工厂肺癌发生率分组 某厂 一般人群人数 肺癌人数 肺癌发生率(1/万)吸烟70054.5不吸烟Ho:μ300=μo11.5H:μ>μo1单侧α=0.05μo=n1

=700×0.00045=0.3151μo

π=300×0.00015=0.0452 2吸烟者的肺癌发生人数X≥5累计概率:P=1-[p(0)+p(1)+p(2)+p(3)+P(0)=e-μ=e-0.315=0.7298P(1)=P(0+1)=P(0)×μ/(0+1)=0.7298×0.315/1=0.2299P(2)=P(1+1)=P(1)×μ/(1+1)=0.2299×0.315/2=0.0362P(3)=P(2+1)=P(2)×μ/(2+1)=0.0362×0.315/3=0.0038P(4)=P(3+1)=P(3)×μ/(3+1)=0.7298×0.315/4=0.000299α=0.05Ho,接受H,故可认为某工厂吸烟的肺癌发生率明显高于一般人群1不吸烟组:Ho:μ=μoH:μ>μo1单侧α=0.05X≥1P=1-P(0)P(0)=e=e-0.045=0.956P=1—0.956=0.044,按α=0.05Ho,H1肺癌发生率高于一般人群。5-75-7甲,乙两厂某工种某病患病率工龄(岁)工人数甲厂患者患病率(%)工人数乙厂患者患病率(%)<3400123.0010011.00≥31001010.004007218.00合计500224.405007314.60从表中可以清楚看到≥3,<333工人为主。这种情况下不能直接比较总患病率,应按不同工龄组进行比较30%,101,8本例π=0.30,1-π=0.7,n=1010(1)康复1人及以下的概率P(X≤1)=P(X)P(0)0P(0)=0.710=0.0282510!P(1)=

0.7(101)0.30.12106P(x≤1)=0.02825+0.12106=0.1493(2)康复8人及以上的概率。P(x≥8)=10p(X)p)p9)1010)P(8)=(

8)nxx()x= 8)!

0.7(108)0.380.0014467P(x+1)=P(X)×nK X1 1P(9)=p(8)108 0.3 0.000137881 10.3P(10)=0.310=0.000005905则P(x≥8)=P(8)+P(9)+P(10)=0.0015930%110.14931,880.00159 96385395%可信区间nP=85,nq=11,5,n=96>50,395%可信区间。=0.85540.0637=(82.17~94.91)%5015000这种反应生率?Ho:50数为μoHμ>μo1单侧α=0.05n=50,πo=1/5000=0.0002,μo=nπo=50×0.0002=0.01,50X≥1P=1-P(0) P(0)=ee0.010.99P=1-0.99=0.01P=0.01α=0.05,拒绝Ho,接受H11ml10146146试估计该检样菌落数的95%可信区间。X=146(个),X>50,用正态近似法求该检样本菌落数的95%的可信区间为:146XX±uaX

146

122.32~169.68(个)102236Ho:两组发病率相同,即μ=μ1 2Hμ≠μ1 1 2α=0.05本例1

36人 2

=22人1122

36

1.838322362,tυ0.1>P>0.05,在α=0.0522361822102Ho:两市已婚妇女宫颈癌患病率相等,即μ=μ1 2H:两市已婚妇女宫颈癌患病率不相等,即μ≠μ1 1 2α=0.05X =82/10000=0.0082,1

=102/20000=0.00512X XX /nX /nX /n1 1 2 20.0082/100000.0051/20000

0.00820.0051=2.9899本题也可以万人为单位,计算更为简单:8251/8251/2

2.98992,tυ0.005>P>0.002,在α=0.05H1颈癌患病率高于乙市。观察某种防治细菌性痢疾(菌痢)3-6措施有效?表5-8两组人群菌痢发病率的比较(1979年)分组人数菌痢例数(无菌痢数)发病率(‰)试验组41182140975.1对照组521772514513.8合计93359392429.96Ho:π=π1 2H:π≠π1 1 2单侧αP(1P(1P)(1/n1/n)12CC12

PP41181/5217)

4.2042,tυP<0.005,按α=0.05Ho,H1为实验组和对照组的菌痢发病率有差别,实验组的发病率低于对照组,即该措施有效。把某肿瘤新发病例按住址点在一张地图上,又将地图划分成许多面积相等的小方0,1,2,……PossionX2P<0.05,就可认为此病在人群中的分布不随机,可能有聚集性。你认为如何?PoissonX2P<0.05α=0.05拒绝Ho,接受H,可认为此资料不服从Poisson分布,也即可以认为此病在人群1中不呈随机分布,再综合考虑环境(地形、地貌)遗传等资料,结合专业知识确定有无聚集性。50005%101010设:k=每组混合样本例数;P=粪检血吸虫卵阳性率;q=阴性率=1-p;N=全部受检人数;N/k=混合样本数,即组数计算每组平均检验次数。概率 检验次数混合样本内粪检 q.q.q…q=qk 1全部为阴性混合样本内粪检 1-qk k+1至少有1例阳性一组平均检验次数=(qk×1)+(1-qk)(k+1)=k-kqk+1 (1)计算全部检验期望数。全部检验期望数=(N/k)(k-kqk+1)=N(1-qk+1/k) (2)本例已知:N=5000,K=10,P=0.05,q=1-p=0.95,代入试全部受检期望数=5000×(1-0.9510+1/10)=2506.32比一般逐人检查减少工作量:5000-2506.32=2493.68,减少工作量的百分比为:2493.68/5000=49.87%。某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,1/105-9,95%可信区间。表5-9某县三类乡百白破疫苗接种率调查结果类 别 人 数 抽样人数 接种率好73717230.8174较好1489914780.6969差93089300.3022合计305783131本题为求按比例分配的分层抽样中总体率的可信区间,首先计算接种率及其标准误。p=[ΣΝi

]/Ν=1/31578[7371×0.8174+14899×06969+9308×0.3022]i=19221.0461/31578=0.608685 sp73717371723/7371)[0.81740.1826/(72329308930/9308)[0.30220.6978/(9302

N2ni

/N)[(pi

(1pi

)/(ni

/N=0.00752001,一般认为服从二项分布。因n=3131,法计算其可信区间。95%CI:P±1.96sp=0.608635+1.96×0.007520=(0.5939,0.6234)125(3)1010居民感染率村民组12345678910合计人 数1381561761841942152743293503702386感染人数41485670758690101109121797本例采用整群抽样作总体率的点估计和区间估计。按正态近似原理计算:已知:K=125,k=10点估计:p=(K/Nk)(Σα)i=(125/30000/10)×(797)=0.3321=0.0335595%?可信区间:P±1.96sp=(0.2663,0.3979)99%可信区间:P±2.58sp=(0.2455,0.4187)第六章χ2检验合理并组确切概率法(精确3.n≥40 1≤T<5是非题:1.√ 2.√ 3.× 4.× 5.× 6.√ 7.√单选题:1.A2.A3.B4.D5.A6.E7.C8.E9.A10.B11.D12.D13.B14.A15.E16.C17.D18.C19.A20.A21.E问答题:X2X2间的相关关系;③频数分布的拟合优度检验。对资料的设计类型和应用条件。1)四格表的X2检验:(AT)2基本公式X2 T

T>5n>40专用公式X2

(adbc)2n(ab)(cd)(ac)(bd)X2

1<T<5n>40(adbcn/2)2n(ab)(cd)(a(adbcn/2)2n(AT0.5)2(AT0.5)2T<1n<40双侧检验。双侧检验。双侧检验取两侧累积概率,单侧检验只取一侧累积概率。行×列(R×C)X2基本公式与四格表基本公式相同。X

A2n(nnR

X2。适用条件①行×列表不宜有1/5以上的格子的理论频数小于5,或有一格理1。②当多个样本率(或构成比)X2X2联表,X2X2检验:R×CR×C(行×列)R×C(行×列)行×列表适用条件①相同。2×2列联表或配对资料X2检验,检验两个处理有无差别。(b(bc)2

bc b+c>40(bc(bc1)2

b

b+c<40检验两种处理间有无相关,公式同四格表所用公式(AT)2频数分布拟合优度的X2公式X2 T适用条件遇有理论频数小于5时,可与相邻组合并。X2检验的基本思想是什么?X2检验的基本思想是实际数与理论编数的吻合程度,它是根据检验假设来确定的,如作两样本率的比较,我们先假设两组的总体率相同,均等于两组合计的总率,如X2P<XP>X3、四表格资料在何种情况下需要进行校正?为什么?在1≤T<5n≥40时,需要计算校正X2X2时是用一种连续概率分布(X2分布)F.Yates(A-T)0.5,负0.5,X2值降低,校正后的概率更接近确切的概率。4、行X列表X2检验的注意事项有哪些?X2X1/55,1。对理论数频数大小有三种处理方法:②删去上述理论频数太小的行或列③将太小理论频数所在行或列与性质相近的邻行邻列的实际频数合并。后两法可能会损失信息,也会损失样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。当多个样本率(或构成比)X2体率(或总体构成比)之间总的来说有差别,但不能说明它们彼此见都有差别,或某两个间有差别,实际工作中,常常还需要知道各组间比较的情况,若要进一步解X2的概率,可采用以下方法:①改变显着水准后的两两比较法(Brunden法)基于这种思想。Brundenα调整为αα’=α/2(K-1) (9.10)KX2X2α值比较,从而作出推断,也就是说,若取α=0.05,K=6(则α’=0.005),

=3.84为界值,而要

0.05(1)=7.88X2Pα’比较而得出结0.05(1)论。②改变显着界值的两两比较法:a,a9.1X2值与相应的界值相比即可作出结论。K×2表分割为非独立的四格表的显着界值K23a45633.105.485.158.4843.004.486.484.786.539.3353.053.995.237.234.405.707.359.8863.033.944.706.158.054.505.406.558.4510.00计算题:1.某医师用甲、乙两药治疗某病,结果如下表,问甲、乙两药疗效有无差别?表6-7甲、乙两药疗效比较计算表药物治愈数未治愈数合计甲291140乙69473合计9815113Ho:两药疗效相同,即π=π1 2H:π≠π1 1 2α=0.05T=15×40/113=5.31 且n>40 用公式minX (adbc)2n2 (ab)(cd)(ac)(bd)

=10.88X2P<0.01,按α=0.05Ho,H1两药疗效有差别,乙药疗效较好。期疗效要以夏天无眼药水最好,保健操为次,新医疗法最差”。试对此作分析评价。表6-2 三措施的近期有效率比较矫治方法有效人数无效人数(合计)有效率(%)夏天无眼药水518413537.78新医疗法6263218.75眼保健操5131827.78合计6212318533.51Ho:三组药物近期有效率相等H:三组药物近期有效率不等或不全相等1α=0.05+52 132 4.498v=(263-82X20.2>P>0.1,按α=0.05Ho,尚不能认为三种措施的近期有效率有差别。存在一定的关系?表6-3 某厂职工冠心病与眼底动脉硬化普查结果分析眼底动脉硬化正常冠心病诊断结果可疑冠心病合计0340116357Ⅰ7313692Ⅱ+Ⅲ1002019139合计5134431588注:原表中T =6×31/588=0.3163<1,故将Ⅱ和Ⅲ级合并4,3解法Ⅰ:本题为双向有序分类变量,可设XXY123。计算Spearmanr=0.2988,P<0.05,眼底动s脉硬化程度与冠心病诊断结果存在正相关。解法Ⅱ:列联表X2检验Ho:H1α=0.05732

132

62

1002

202

192

-1=58.13492513 9244 9231 139513 13944 139319,X2P<0.005,按α=0.05Ho,H1为该厂职工冠心病与眼底动脉硬化级别有关。4.表6-4用两种方法检查已确诊的乳腺癌患者120名。甲法检出率为60%,乙法检出 率50%,甲乙两法一致的检出率为35%,问:(1)两种方法何者为优?表6-4甲乙两法检验结果乙法+甲法-合计+421860-303060合计7248120Ho:B=CH1α=0.05b+c=18+30=48>40v=1,9,X20.10>P>0.05,按α=0.05Ho,为检出率有差别(2)两种方法的检出结果是否有关系?Ho:两法的检出结果无关系H:两法的检出结果有关系1α=0.05T1,2min

6048/12024 n>40 用公式=(42301830)212060607248X20.05>P>0.01,按α=0.05Ho,H1甲、乙两法检出结果有关。20%400400疗法效果好?此判断发生错误的概率有多大?Ho:两种疗效法治愈率相同,即0.2H:0.21α=0.05本例n=400 0.2p)/n00 0解之,p0

u)/n0 0/400X=Np=4000.2329=94(人

=0.2329400名患者中至少要有94人治愈才能判断新疗法比一般疗法效果好。此判断可能发生错误的概率为5%某种化学物质经诱发肿瘤试验,实验组15只白鼠中4只发生癌变,对照组10只白 无一发生癌变(表6-5)。问两组发癌率有无差别?表6-5某药物肿瘤治疗试验发癌数 未发癌数合计实验组4 1115对照组0(1.6) 1010合计4 2125Ho:两组发癌率相等,即π=π1 2Hπ≠π1 1 2α=0.05n=25<40,P=(ab)!(cd)!(ac)!(bd)!a!b!c!d!n!周边合计保持不变的四格表有(1)~(5):取︳A-T︳大于等于1.6表的概率和,即P=p(1)+p(5)=0.1076+0.0166=0.1242,按α=0.05Ho,尚不能认为两组的发癌率有差别。100X查(6-6)。欲了解此病法何者较敏感,试设计一整理表,并指出宜作何统计处理?应做配对设计 表6-6佝偻病患儿入院检查登记表编号 生化检验 X光片12..100X6-66-9。表6-9生化检查和X线检查结果生化X合计检查+-+-αcbdα+bc+d合计a+cb+dN若在考虑了两法一致的a,d以后,仍拟比较两法何者较敏感,应做配对资料的X2检验.(bc)2X2

(bc)

(b+c>40)X2

(b+c<40) v=1(bc1)(bc1)23-18),对此有何意见?表6-7用药组和对照组流感患病率比较发病数未发病数合计有效率%服药组5013018072.2未服药组4019023082.6合计 90 320 410 78.05X2=6.63, P<0.05因旨在观察新药的效果,根据服药组有效率低于对照组(未服药)验。应对本项实验观察的易感者暴露条件进行分析是否均衡可比。第七章 秩和检答案填空题非参数统计(秩和检验)不受总体分布的限定,适应范围广,检验效率低于参数检验3.P<0.05 4.n>25是非题:1.√ 2.√ 3.× 4.√单选题:1.A 2.D 3.C 4.D 5.B 6.B 7.E 8.E 9.A 10.D11.C 12.B问答题:参数检验与非参数检验的区别何在?各有何优缺点?参数检验与非参数检验的区别。参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。参数检验与非参数检验的优缺点。参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等级数据、非确定数据(>50mg)不能使用参数检验,而且要求资料的分布型已知和总体方差相等。非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条件的资料用非参数检验,则检验效率低于参数检验。如无效假设是正确的,非参数法与参数法一样好,但如果无效假设是错误的,则非参数检验效果较差,如需检验出同样大小检验的界值表也是有近似的(如配对秩和检验)因此其结果有一定近似性。非参数检验适用那些情况?等级顺序资料。未达到正态或近似正态分布时,宜用非参数检验。未知分布型资料要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。挑选其中有意义者再进一步分析(包括参数统计内容)在这种情况下可用非参数统计方法。同数据不必计算“平均秩次?因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组内,出现相同数据不编平均秩次,该组秩和不受影响。n>10,n-n>10u1 2 1检验还是非参数检验,为什么?两组比较的秩和检验,当n大时,秩和分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论