版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章
1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,
中位数。
均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平
均水平的描述。
几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,
各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使
用几何均数(geometricmean)„几何均数一般用G表示,适用于各变量值之间成倍数关
系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。
中位数和百分位数:
中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用用表
示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈
偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,
是指数据的一端或者两端有不确定值。
百分位数(percentile)是一种位置指标,以Px表示,一个百分位数网将全部观察
值分为两个部分,理论上有X%的观察值比Px小,有(100-X)%观察值比Px大。故百
分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是Bo分位数。
即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。
2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、
及变异系数,尤以方差和标准差最为常用。
极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,
说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如
用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏;2.不稳定。
四分位数间距(inler-quartilerange)就是上四分位数与下四分位数之差,即:Q—
QU-QL,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的
极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述
偏态分布资料的离散程度。
极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反
映资料的离散程度。
方差(variance)和标准差(standarddeviation)由于利用了所有的信息,而得到了
广泛应用,常用于描述正态分布资料的离散程度。
变异系数(coefficientofvariance,CV)亦称离散系数(coefficienlofdispersion),
为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单
位不同或均数相差悬殊的两组或多组资料的离散程度。
3.答:常用的相对数指标有:比,构成比和率。
比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百
分之几,它是对比的最简单形式。其计算公式为比=人)
率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分
率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为:
实际发生某现象的观察单位数一比(Q
可能发生某现象的观察单位总数
构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或
分布,常以百分数表示,其计算公式为:
杓成叱一某一组成部分的观察单位数1。/
同一事物内各组成部分的观察单位总数X0n°
4.答:当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影
响指标水平的重要特征在构成上不同,往往会高估或低估总率。在这种情况下,直
接进行两个总率的比较,会产生错误的结论。此时,必须首先设法消除这种内部构
成上的差别,才能进行比较。统计学上将这种方法称为率的标准化(standardization
methodofrate),即采用统一的标准对内部构成不同的各组频率进行调整和对比的方
法,调整后的率为标准化率,简称为标化率。
5
(1)编制频数分布表并绘制频数分布图,简述这组数据的分布特征;
;累计频组中值
组段频数频率(%)1(%)
10832.52.5109.5
111-108.3310.83112.5
U4~2218.3329.17115.5
U7~3831.6760.83118.5
120-2016.6777.5121.5
123'181592.5124.5
126~75.8398.33126.5
129-13221.67100129.5
合计120100
35.00
30.00
25.00
-
s
u.00
a
n.00
b
a
1uz
10.00
5.00
0.00
108.00111.00114.00117.00120.00123.00126.00129.00132.00135.00
"height(cm)"
(2)计算中位数、均数、几何均数,用何者表示这组数据的集中位置好?
答:
X»(3xl09.5+10xl12.5+22x115.5+38x118.5+20x121.5+18x124.5+7x126.5+2x139.5)/120
=119.4135
用Nlg-'[(lg3xl09.5+lgl0xll2.5+lg22xll5.5+lg38xll8.5+lg20x⑵.5+lgl8xl24.5+Ig7xl26.5+lg2xl39.5)/120]
=119.25125
“4=116.63
用均数较好.
(3)计算极差、标准差,用何者表示这组数据的离散趋势好?
答:极差:22.62
四分位数间距:5.915
标准差:4.380736
用标准差表示较好.
6.答:本例频数分布为偏态分布,长尾拖向x轴正方向,故为正偏态。适宜用中位数
表示其平均水平,中位数为4,四分位数间距为4。
7.40名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。试计算平
均滴度。
抗体滴度1:41:81:161:321:641:1281:2561:512
人数156271045
几何均数
exp((ln(4)+5xln(8)+16xln(l6)+2xln(32)+7xln(64)+10xln(l28)+4xln(256)+5xln(512))/40)
=128
8.答:此医生的分析是不正确的,原因在于:
率.实际发生某现象的观察单位数,比例基数
首先明确率的定义:草一可能发生某现象的观察单位总数
发病率的分子为“某时期内发病人数”,而被观察对象某时期内可能发病多次,所以发病
人数是人次数;分母为“同时期平均人口数”,而按率的定义应为“同时期暴露总人数
该单位抽样检查2839名职工,其中高血压患者中,男性是178例,女性是49例,
共227例,可以计算高血压患者占接受检查所有职工的构成比为7.995773%
至于40岁以上的患者占接受检查总人数的90.3%,也是构成比;60岁以上者占接受检
查总人数的10.2%也是构成比,不能与发病率混为一谈。关于高血压与性别有关的结论
也不妥。因为在接受检查人群中的男女内部构成比是不同的,要进行比较首先要设法消
除内部构成比的差异,即就是率的标准化,然后比较。
第三章
1正态分布与标准正态分布的区别:
正态分布是一簇单峰分布的曲线,口和。可以有任意取值;标准正态分布是一条单峰
曲线,和。有固定的值,|i=0,o=lo
2u=(x-|i)/o=((i-o-|i)/o=-1
查标准正态分布表,得①(-1)=0.1587,所以小于山◎者所占的比例为15.87%。
3医学参考值范围的含义:是根据正常人的数据估计绝大多数正常人某项指标所在的范
围。选定同质的正常人作为研究对象。所谓正常人是指不具有影响所测指标的因素或疾
病的那类同质人群。
确定原则:①选定同质的正常人群作为研究对象
②控制检测误差
③判断是否分组
④单、双侧问题
⑤选择百分界值
⑥确定可疑范围
方法:①正态分布法:适用于服从正态分布或近似正态分布的资料
②百分位数法:适用于不服从正态分布的资料
③对数正态分布法:适用于对数正态分布的资料
4如果资料服从正态分布,那么双侧95%正常值范围为口±1.96c;如果资料不服从正态
分布,那么双侧95%正常值范围就不能用正态分布来做。
51人以下的概率:P(x<l)=P(O)+P(l)=Cio°O.2°O.8lo+Cio1O.21O.89=0.375
8人以上的概率:
88299IIOIO5
P(X>8)=P(8)+P(9)+P(1O)=CIOO.2O.8+CIOO.2O.8+CIOO.2O.8°=7.79X1O
6二项分布的应用条件:
①观察单位只能有互相对立的两种结果之一。
②已知发生某一结果的概率兀不变,其对立结果的概率则为1-兀
③n次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的
观察结果不会影响到其他观察单位的结果。
7二项分布和正态分布之间的关系:随着n的增大,二项分布逐渐逼近正态分布。当mu
较大时,二项分布B(n,©近似正态分布。
举例:病人的治愈与不治愈,理化检验结果的阴性与阳性,个体的发病与不发病等属
于二项分布资料;某地区12岁男孩的身高,某学校同年级女生的体重等属于正态分布。
第四章
1
标准差标准误
不同:
意义上:描述一组变量值的离散程描述样本均数的离散称度
度
应用上:1、标准差越小,说明变量1、标准误越小,说明样本
值围绕均值分布越紧密,均均数和总体均数的差异越
数的代表性越好。小,用样本均数估计总体均
数的可靠性越大。
2、亍±%s估计变量值的分2、用于土古计总体均数
布范围。的可信区间。
与n的关系:n越大,标准差越稳定n越大,标准误越小
相同:
1、都是描述变异度的统计指标
2、<rT=^F=%与巴成正比,与,i成反比;
3、n一定时,同一组资料,标准差越大,标准误也越大。
2a水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结论,是犯I型
错误的最大风险,是事前概率;P值是指由Ho所规定的总体作随机抽样,获得等于大
于现有样本获得的检验统计量值得概率。标明以多大的误差拒绝Ho,是事后概率。
3①配对设计的差值的总体均数的可信区间表达公式:d±tan_iS3
两均数差值的总体均数的可信区间表达公式吊一与土Lv仇一1)5:+12-1)5;+J_、
用+〃2-2〔几丸
②可以用可信区间回答假设检验的问题。可信区间估计与假设检验时统计学中两种重
要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角
度不同。例如:样本均数与总体均数的比较,用可信区间的估计方法,观察由样本信息
估计的总体均数的可信区间是否包含已知的总体均数,即可推断该样本是否来自已知均
数的总体;用假设检验的方法,先假设样本均数代表的总体均数等于某已知的总体均数,
再判断样本提供的信息是否支持这种假设。
4拒绝实际上成立的Ho,这类“弃真”的错误称为I型错误或第一类错误;不拒绝实
际上是不成立的Ho,这类“存伪”的错误称为H型错误或第二类错误。第一类错误的概率
用a表示,第二类错误的概率用P表示。a越大,0越小;反之,a越小,0越大。
拒绝Ho,只可能犯第一类错误,不可能犯第二类错误;不拒绝Ho,只可能犯第二
类错误,不可能犯第一类错误。
由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。
5t检验的应用条件:独立性、正态性、方差齐性。
u检验的应用条件:适用于大样本资料。
t检验和U检验的关系:随自由度的增加,t分布逐渐趋向于标准正态分布。因此U
检验是t检验的一种近似检验方法。当自由度大于50时,近似程度比较满意。
6假设检验的意义就是分辨所研究的样本是否分别属于不同的总体,并对总体做出适当
的结论。
假设检验应注意的问题:
①要有严密的抽样研究计划:要保证样本是从同质总体中随机抽取,除了对比的因
素外,其他影响结果的因素应一致。
②选用的假设检验方法应符合应用条件。
③结论不能绝对化。
④正确理解差别有无显著性的统计意义:
差别有统计意义或有显著性,指我们有很大的把握认为原假设不成立,并非是说
它们有较大差别;差别无统计学意义或无显著性,我们只是认为以很大的把握拒
绝原假设的理由还不够充分,并不意味着我们很相信它。
⑤统计学意义与其他专业上的意义不同。
7Ho:矽肺患者的血红蛋白与健康人相同,即产刖
Hl:矽肺患者的血红蛋白与健康人不同,即降刖
a=0.05
112.59—14.02|
t=S/L
1.63/V10
v=10-1=9,to,o5,9=2.262<t,p<0.05,拒绝H0,接受Hi,差别有统计学意义,可以认
为矽肺患者的血红蛋白与健康人不同。
8Ho:新药与常规药物的疗效没有差别,即R尸因
H1:新药与常规药物的疗效不同,即内丸12
a=0.05——
=1.2823
+2
ntn2~
v=ni+n2-2=20-2=18,to.o5.is=2.1Ol<t,p>0.05,不拒绝H(),差别无统计学意义,尚不能
认为新药与常规药物的疗效不同。
9(1)甲药:
Ho:甲药无效,即内=0
Hi:甲药有效,即因声0
a=0.05
=5.2372
v=16-1=9,to,o5,9=2.262<t,p<0.05,拒绝H0,接受H”差别有统计学意义,可以认
为甲药有效。
乙药:
H():乙药无效,即囱=0
Hi:乙药有效,即田¥0
a=0.05
g2=5.3033
由
v=10-1=9,to.05.9=2.262〈t,p<0.05,拒绝Ho,接受H”差别有统计学意义,可以认
为乙药有效。
⑵Ho:甲乙两药的疗效没有差别,即内=总
Hi:甲乙两药的疗效有差别,即内井12
r=1,/、/-------=1.6022
Z%心)/甲七%%31]
II%+〃广2(九〃J
v=ni+n2-2=20-2=18,to.o5.i8=2.1Ol>t,p>0.05,不拒绝H(),差别无统计学意义,可以认
为甲乙两药的疗效没有差别。
第六章
1不满足正态近似条件,所以采用直接计算概率法。
Ho:加维生素C的治愈率与不加相同,即71=即=0.6
H,:加维生素C的治愈率高于不加维生素C,即兀>兀。
a=0.05
P(X<8)=1-P(X>9)=1-P(X=9)-P(X=1O)=1-CIO9*O.69*O.4I-CIOIO*O.61O*O.4O=0.9536>0.05
不拒绝Ho,差别无统计学意义,可以认为加维生素C的治愈率与不加相同。
2满足正态近似条件,采用正态近似法。
Ho:经健康教育后的高血压患病率与以前相同,即兀=兀。=0.6
国:经健康教育后的高血压患病率比以前降低,即兀<沏
单侧a=0.05
u=I加一叫===4.9453536
J万0。-4o)/"
〃>Uo.o5,单网=1.64
p<0.05,拒绝Ho,接受H”差别有统计学意义,可以认为经健康教育后的高血压患病
率与以前有差别。
3①建立检验假设和确定检验水准
Ho:男女大学生HBV感染对其心理影响相同,即兀|=电
H,:男女大学生HBV感染对其心理影响不同,即兀।加2
检验水准a=0.05
②计算检验统计量
%2-(ad-bd)2*n/(a+b)(c+d)(a+c)(b+d)
=(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=9.651
v=l
③确定p值
查/届值表,得p<0.05
④统计推断
按a=0.05水准,拒绝Ho,接受H”差别有统计学意义,可以认为HBV感染对不同
性别的大学生在心理行为方面的影响不同。
4①建立检验假设和确定检验水准
Ho:两组的治愈率相等,即川=兀2
Hl:两组的治愈率不等,即兀印兀2
检验水准a=0.05
②Fisher精确概率法
序号治愈人数未愈人数缓解率pl与Ipl-p2|概率P(i)
P2
11701.0000.867
2130.133
21610.9410.741
3120.200
31520.8820.615
4110.267
41430.8240.491
5100.333
51340.7650.365
690.400
61250.7060.239
780.467
71160.6470.114
870.533
81070.5880.012
960.600
9980.5290.138
1()50.667
10890.4710.262
1140.733
117100.4120.388
1230.800
126110.3530.514
1320.867
135120.2940.639
1410.933
144130.2350.765
1501.000
P(i)=0.280>0.05
③统计推断
按a=0.05水准,不拒绝Ho,差别无统计学意义,尚不能认为两组治愈率有差别。
5①建立检验假设和确定检验水准
Ho:治疗三种类型病人的有效率相同,即加=畋=兀3
H1:治疗三种类型病人的有效率不等或不全相等。
检验水准a=0.05
②计算检验统计量
=286*(7P+272+1042+422+24^+度-1)=3.6389
199*9887*98199*14687*146199*4287*42
③确定p值
查『界值表,得p>0.05
④统计推断
按a=0.05水准,不拒绝Ho,拒绝H”差别无统计学意义,尚不能认为治疗三种类
型病人的有效率有差别。
6①建立检验假设和确定检验水准
H():该三种人群有相同的血型分布,即兀1=兀2=兀3
Hi:该三种人群的血型分布不等或不全相等。
检验水准a=0.05
②计算检验统计量
=9312*(6792+1342+...+4352-1)=71.180
3720*1883788*1883546*6522
③确定p值
查『界值表,得p<0.05
④统计推断
按a=0.05水准,拒绝Ho,接受Hi,差别有统计学意义,可以认为三种人群的血型
分布不等或不全相等。
7①建立检验假设和确定检验水准
Ho:两种检验方法的结果相同,即总体B=C
Hi:两种检验方法的结果不同,即总体B"
检验水准a=0.05
②计算检验统计量
jM-iy=11364
b+c
③确定p值
查片界值表,得p>0.()5
④统计推断
按a=0.05水准,不拒绝Ho,差别无统计学意义,尚不能认为两种免疫学方法的阳性
率有差别。
第八章
1答:适用于有序分类资料•、偏态分布资料、变异较大或方差不齐的资料、分布型不
明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。
2答:属于非参数检验。
因为参数检验针对的是总体变量服从某种分布,即具有某个已知的函数形式,而
其中的参数是未知的,统计分析的目的就是对这些未知参数进行估计或检验。但本题即
使10,m—ni>10时采用的是u检验,但它比较的是分布而不是参数,所以它还是
属于非差数检验。
3答:有序分类资料可做秩和检验、等级相关分析。
4答:(一)建立检验假设
Ho:两种药的治疗效果总体分布相同;
H1:两种药的治疗效果总体分布不同;
a=0.05;
(-)编秩和求秩和T
两组治疗心绞痛疗效比较
人数合计秩次平均秩和
疗效缓释片普通片范围秩次缓释片普通片
(1)(2)(3)(4)(5)(6)(7)(8)
显效6235971-974930381715
有效18314998-14612221963782
无效51419147-1651567802184
加重347166-172169507676
合计m=88m=8417265218357
(三)计算检验统计量T
由于则取m组的秩和为T,故检验统计量T=T?=8357。
(四)确定P值,做出推断结论
由于m>10,T分布已接近均数为m(N+l)/2,方差为mm(N+l)/12的正态分
布,按书上式(8.3)(8.4)求出现=3.7439
取>2.56,P〈0.0I,按a=0.05水准拒绝Ho,接受H”差异有统计学意义。可以认
为缓释片和普通片治疗心绞痛的疗效有差别。
5答:(一)建立检验假设
Ho:治疗前后HCG值的总体分布相同;
H):治疗前后HCG值的总体分布不同;
a=0.05:
(二)计算检验统计量T
肿瘤患者灌注治疗前后HCG值
病例号治疗前治疗后差值秩次
(1)(2)(3)(4)(5)
1128000021000010700007
2755003300722006
3124502210102404
415000009314999078
510000250075002
69700120384973
7155884825107635
8422391433091
T+=36T=0
本例T+=36,T-=0,任取T+或(T—)作为检验统计量T,本例取T+=36。
(三)确定P值,做出推断结论
由于n<50,查附表9,T界值表。本例n=8,T=36,查附表9,得a=0.05时
的T界值为5-31,T在双侧界值范围外,故P<0.05。按a=0.05水准拒绝H(),接受
H”差异有统计学意义。可以认为肿瘤患者灌注治疗前后HCG值有差别。
6答:(一)建立检验假设
Ho:三种卵巢功能异常患者血清中促黄体素的含量的总体分布相同;
H,三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全相同或全
不相同;
a=0.05;
(-)计算检验统计量T
卵巢功能异常患者血清中促黄体素的含量
卵巢发育不良秩次丘脑性闭经秩次垂体性闭经秩次
(1)(2)(3)(4)(5)(6)
44.10246.71104.597.5
42.50233.3262.755
40.50224.597.511.1416
38.31211.6715.989
35.762010.51141.903
35.12199.4511.52.104
33.60181.7429.4511.5
31.381710.211310.8615
R.1646571
Hi888
按书上式(8.5)求出H=15.4184
(三)确定P值,做出推断结论
由于k=3,每组例数值=9,查附表11,H界值表得P<0.01。按a=0.05水准拒绝
Ho,接受H”差异有统计学意义。可以认为三种卵巢功能异常患者血清中促黄体素的
含量有差别.
7答:(一)建立检验假设
Ho:针刺三个穴位的镇痛效果的总体分布相同;
H.:针刺三个穴位的镇痛效果的总体分布不全相同或全不相同;
a=0.05;
(二)计算检验统计量T
针刺三个穴位的镇痛效果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 健身房楼宇对讲施工合同
- 2025年南京货运从业资格考试题目和答案
- 通信设备研发员聘用合同范文
- 广告公司创意总监聘用合同
- 2024版承包快递合同
- 高端住宅区买卖合同范本
- 港口维修班组施工合同
- 美甲师团队管理协议
- 博物馆墙纸安装协议
- 考古研究所租赁合同
- 2024年工业废水处理工(初级)技能鉴定考试题库(含答案)
- 2024新沪教版英语初一上单词表(英译汉)
- 人教版八年级上册生物期末必刷15道识图题
- 期末专题复习-任务型阅读 2023-2024学年 外研版英语八年级上学期期末真题备考
- 配电室设备安装工程施工方案
- 组织学与胚胎学智慧树知到期末考试答案章节答案2024年中南大学
- SY-T 6966-2023 输油气管道工程安全仪表系统设计规范
- 2024巴西市场中轻度手游洞察报告
- 兽医微生物学(浙江农林大学)智慧树知到期末考试答案2024年
- 医院科室合作共建方案
- 学生公寓管理员培训
评论
0/150
提交评论