




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学方法医学知识医学统计学方法医学知识 terminologystatistical description统计描述statistical inference统计推断parameter estimation参数估计Frequency distribution频数分布frequency table频数表arithmetic Mean, average算术平均值standard deviation标准差variance方差range极差,全距,范围geometric mean几何平均值median中位数normal distribution正态分布reference range参考值范围2医
2、学统计学方法医学知识 统计分析包括统计描述和统计推断两大部分。统计描述(statistical description)是用统计指标、统计表和统计图描述资料的分析规律及其数量特征;统计推断(statistical inference) 包括总体参数估计和假设检验两个内容。 参数估计:是用样本统计量估计总体参数所在范围。 假设检验:是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否成立。 3医学统计学方法医学知识统计分析包括统计描述和统计推断两大部分。3医学统计学方法医学第一节 数值型变量资料的统计描述例9.12002年某市150名2029岁正常男子的尿酸浓度(mol/L) ,资料见
3、表9-1。如何进行统计描述?4医学统计学方法医学知识第一节 数值型变量资料的统计描述4医学统计学方法医学知362.6359.7285.9300.2333.6334.0288.8338.5341.9344.63375298.3364.2367.1338.1316.9332.7324.0282.6369.8398.7338.7308.9392.1368.7352.6378.2346.1278.6318.3323.2322.6382.1322.6309.6352.0372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8358.8405.9362
4、.7316.3338.7402.6379.4329.6354.6331.4349.6419.5324.6329.8357.8312.0313.6338.7328.6291.3329.7361.8392.4414.9319.7327.6395.8358.9289.4366.2387.4298.4408.7389.8362.5354.9352.7316.6348.9348.7401.6334.6308.9367.0345.6401.6357.1304.6338.5388.2355.8329.4321.1320.4313.5339.8409.4387.4378.5392.0352.7376.2388
5、.4344.6308.6347.0428.7369.1311.4376.3349.4289.2366.8371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.4357.5348.5346.8406.6357.6338.7341.6349.8289.4366.2357.5298.4336.8387.5342.3366.7387.6332.7324.0表9-12002年某市150名2029岁正常男子的尿酸浓度(mol/L)5医学统计学方法医学知识362.6359.7285.9300.2333.6334.0统计描述的内容:一、制频数(分布) 表(
6、表9-2)和频数分布图(图9-1) 频数表的用途(1) 揭示资料的分布特征和分布类型(2) 便于发现某些特大或特小的可疑值(3) 便于进一步计算统计指标和统计分析处理二、计算统计指标(1) 计算平均值代表一组资料的平均水平;(2) 计算标准差-反映资料的离散程度。三、绘制统计表和统计图6医学统计学方法医学知识统计描述的内容:6医学统计学方法医学知识一、编制频数分布表:制表步骤:(1)求极差或全距(range):R=Xmax Xmin本例, R=428.7278.6150.1(mol/L)。(2)决定组数、组段数和划分组距(class interval):根据样本含量的多少确定组数,一般设815
7、组。组段数=取整(极差/组数)。本例:组段数=取整(150.1/10)=15.0115划分组距:每组段的起点和终点分别称为下界和上界。组距:本组内的上界和下界之差。组段的划分27028530031533034536037539040542043512345678910117医学统计学方法医学知识一、编制频数分布表:制表步骤:组段的划分27028530(3)列频数表:按上述组段序列制成表的形式,采用划记法或计算机将原始数据汇总,得出各组段中所包含的观察例数,即为频数,如表9-2的第 (2)栏。将各组段及其相应的频数列成表格,即为频数表(frequency table),如表9-2。所绘的图形见图
8、9-1。表9-22002年某市150名2029岁正常男子的尿酸浓度的频数分布尿酸浓度(mol/L)频数频率(%)27021.3328596.00300117.333152214.673302416.003452718.003602013.333751510.00390117.3340585.3342043510.67合计150100.008医学统计学方法医学知识(3)列频数表:按上述组段序列制成表的形式,采用划记法或计算资料的分布类型: 对称分布或正态分布;2. 偏态分布:高峰在左侧或右侧;3. 不规则分布:分布很散,无明显高峰9医学统计学方法医学知识资料的分布类型:9医学统计学方法医学知识二
9、、计算平均值代表平均资料的平均水平1.平均值的种类:(一) 算术均值(arithmetic mean,average):常用 表示样本均值,希腊字母表示总体均值。适用于对称分布的数值型变量资料。其计算方法有: 直接法: i (I=1,2,n)为第i个观察对象的观察值 加权法: i 为第i组的组中值, fi 为第i组的例数:10医学统计学方法医学知识二、计算平均值代表平均资料的平均水平 加权法: 表9-2分组资料加权法计算平均值及标准差用表尿酸浓度(mol/L)组中值(xi)频数(fi)fi xifi xi2270277.52555.0154012.5285292.592632.5770006.
10、3300307.5113382.51040119.0315322.5227095.02288138.0330337.5248100.02733750.0345352.5279517.53354919.0360367.5207350.02701125.0375382.5155737.52194594.0390397.5114372.51738069.0405412.583300.01361250.0420435427.51427.5182756.3合计15052470.018518738.011医学统计学方法医学知识表9-2分组资料加权法计算平均值及标准差用表尿酸浓度(m(二) 几何均值(geo
11、metric mean,G)适用条件: 等比级数资料. 原始观察值呈偏态分布、但数据经过对数变换后呈正态分布或近似正态分布的资料。如医学实践中某些疾病的潜伏期、抗体滴度、平均效价等。其计算方法有:直接法: i 为第i个观察对象的观察值加权法: i 为第i组的组中值(或观察值), fi 为第i组例数:12医学统计学方法医学知识(二) 几何均值(geometric mean,G)加权法抗体滴度(i)人数fi滴度倒数Xilg10(Xi)filg10(Xi)(1)(2)(3)(4)(5)=(2)(4)1:2.532.50.39791.19371:5.075.00.69904.89301:10.0141
12、0.01.000014.00001:20.0620.01.30107.80621:40.0440.01.60216.4084合计3434.3013表9-4 某地34名儿童接种麻疹疫苗后血清血凝抑制抗体滴度血清血凝抑制抗体的几何平均滴度为1:10.206。X=(2.53+5.0 7+10.014+20.0 6+40.0 4)/34=13.6 (算术平均滴度为1:13.6)13医学统计学方法医学知识抗体滴度(i)人数fi滴度倒数Xilg10(Xi)filg(三) 中位数(median, M): 将观察值按大小排序后,位次居中的观察值。M=X(P=50%)在全部观察值中小于M的观察值个数与大于M的观
13、察值个数相等。由于M不受个别特小或特大观察值的影响,适用于分布不规则或分散度很高的资料.3个观察值:1,3,5. M=3; 4个观察值:1,3,5,7. M=4.直接法: 设n 为观察值的个数,有公式(9-5)及(9-6)频数表法: i 为第i组的组中值(或观察值), fi 为第i组例数:L:中位数组段下限值,fL:小于L的累计频数,i:中位数组距.14医学统计学方法医学知识(三) 中位数(median, M): 频数表法: i 尿铅值(mmol/L)人数f累计频数f累计频率(%)(1)(2)(3)(4)=(3)n027278.7725548126.30509517657.1475552317
14、5.001003927087.661252129194.481501230398.381755308100.00 合计308表9-5 308名6岁以下儿童尿铅值的频数分布(中位数计算)L: 中位数组段下限值,fL:小于L的累计频数,i: 中位数组距,f50%:中位数组频数.L=50, fL=81, i=25f50%=9515医学统计学方法医学知识尿铅值(mmol/L)人数f累计频数f累计频率(%)(1)三、计算标准差-反映资料的离散程度。数值变量数据的频数分布有集中趋势和离散程度两个主要特征,只有两者相结合,才能全面地认识事物。反映资料的离散程度的统计量(统计指标)有:(一) 全距(range
15、)或极差:R=Xmax Xmin全距是一组观察值中最大值与最小值之差。(二) 四分位数间距(quartile interval): Q=X75%X25% , Q包括了全部观察值中间的一半.(三) 方差(variance)和标准差(standard deviation)16医学统计学方法医学知识三、计算标准差-反映资料的离散程度。16医学统计学方法医例有3组同龄男孩的体重()测量值如下,其平均体重都是30 () ,试分析其离散程度。分组观察值()全距 R QS甲组262830323430843.16乙组2427303336301264.74丙组262930313430822.92丙组*乙组*甲组
16、*体重232425262728293031323334353637()17医学统计学方法医学知识例有3组同龄男孩的体重()测量值如下,其平均体重都是30标准差的简化计算方法:数学上可证明:故标准差的计算公式又可写成:直接法: X为观察值 加权法:Xi为组中值 表9-3 尿酸浓度(mol/L)分组资料加权法计算平均数及标准差用表n=fi =150(fixi)= 52470.0(fixi2 )=18518738.018医学统计学方法医学知识标准差的简化计算方法:故标准差的计算公式又可写成:表9-3 标准差的应用:(1)表示观察值的变异程度(离散程度): 在两组(或几组)资料均数相近、度量单位相同的
17、条件下,标准差大,表示观察值的变异度大,即各观察值离均数较远,均数的代表性较差。(2)结合均数描述正态分布的特征和估计医学参考值范围。(3)结合样本含量n计算标准误。19医学统计学方法医学知识标准差的应用:19医学统计学方法医学知识四分位数间距的计算(interquartile range,Q):中位数计算公式: 25%位数计算公式: 75%位数计算公式尿铅值(mmol/L)人数f累计频数f累计频率(%)(1)(2)(3)(4)=(3)n027278.7725548126.30509517657001003927087.661252129194.48150123039
18、8.381755308100.00 合计30820医学统计学方法医学知识四分位数间距的计算(interquartile range,四分位数间距(interquartile range,Q)计算公式:Q = X75% X25% X0% X25% X50% X75% X100% | Q | 0 48.15 69.21 100.0 175X1 Xn21医学统计学方法医学知识四分位数间距(interquartile range,Q) 描述性统计量归纳反映资料的集中趋势的指标反映资料的离散情况指标适用的资料类型1. 算术平均数方差及标准差对称分布,特别是正态或近似正态分布资料。2. 几何平均数几何标准
19、差适用于对数正态或近似对数正态分布资料3. 中位数 四分位数间距或百分位数分布不规则的资料,分散程度大的资料22医学统计学方法医学知识描述性统计量归纳反映资料的集中趋势的指标反映资料的离散情况指变异系数(coefficient of variation,CV): 若比较度量单位不同或均数相差悬殊的两组(或几组)观察值的变异度,则需用变异系数为相互比较的指标。不属于描述性统计指标,是一个比较用的统计指标。从变异系数比较,体重的变异程度大于身高的变异程度。变异系数的特点:描述的是相对离散程度,没有单位。适用于:(1) 比较单位不同的多组资料的变异度。 (2) 比较均数相差悬殊的多组资料的变异度。例
20、9-10 某地25岁男子100人的调查结果如下:问题:哪一个指标的变异度大些?23医学统计学方法医学知识变异系数(coefficient of variation,第二节 正态分布和医学参考值范围一、正态分布(normal distribution)24医学统计学方法医学知识第二节 正态分布和医学参考值范围24医学统计学方法医学知识医学统计学方法医学知识培训课件(一)正态分布的图形可以设想,如果观察例数逐渐增多,组段数也不断增多,就会形成一条光滑曲线图9-2(3)。称为正态分布曲线。这条正态分布曲线的特点为:高峰位于中央均数所在处、两侧逐渐降低;左右对称; 曲线在无穷远处与横轴相交。把服从正态
21、分布的变量表示为: XN(,2)正态分布曲线由两个参数确定:平均数,称位置参数,决定平均数所在的位置;方差2,称形状参数,决定曲线的高低宽窄。26医学统计学方法医学知识(一)正态分布的图形正态分布曲线由两个参数确定:26医学统计服从正态分布的变量X的概率密度函数f(X)为式中,为总体均数;为总体标准差;=3.14159为圆周率;e为自然对数的底(e2.71828), X为变量。表示为:uN(0,1),即平均值为0、方差为1的正态分布。为实际应用方便,将一般正态分布转换为标准正态分布。转换公式为: u =(X-), u称为标准正态变量。服从标准正态分布的变量u的概率密度函数f(u)为27医学统计
22、学方法医学知识服从正态分布的变量X的概率密度函数f(X)为式中,为总体均A. 正态分布 B. 标准正态分布图9-3 正态分布与标准正态分布的面积与纵高按式(9-16),根据X的不同取值,绘出正态分布(normal distribution)的图形(图9-3A)。按式(9-16),根据u的不同取值,绘出标准正态分布(standard normal distribution)的图形(图9-3B)。Xu28医学统计学方法医学知识A. 正态分布 B. 图9-4 正态曲线与标准正态曲线的面积分布二、正态曲线下面积的分布规律:用积分法求得。表9-6 正态分布和标准正态分布曲线下面积(概率)分布规律对照 正
23、态分布 标准正态分布 面积(概率) %左侧界值右侧界值左侧界值右侧界值中间部份两侧尾部和 1.0 +1.0 1.0 +1.0 68.27 31.73 1.96 +1.96 1.96 +1.96 95.00 5.00 2.58 +2.58 2.58 +2.58 99.00 1.00 29医学统计学方法医学知识图9-4 正态曲线与标准正态曲线的面积分布二、正态曲线下面为了省去计算的麻烦,编制成了“标准正态分布曲线下的面积”(表9-8)。表中列出了左侧概率:(-,-u);右侧概率:(u,+)=(-,-u) ,(-,u)=1(-,-u) 通过查表可求出正态曲线下某区间的面积,进而估计该区间观察例数占总
24、例数的百分数或变量值落在该区间的概率。查表时应注意:当, 已知时,先将观察值X变换为u值u=(X-)/,再查表;当,未知、但n足够大时,可以用样本均数 和样本标准差s分别代替和,进行u变换u=(X- )/s求得u的估计值后再查表;曲线下对称于0的区间面积相等,如 (-,-1.96)= (1.96,)曲线下横轴上的总面积为100或1。 30医学统计学方法医学知识为了省去计算的麻烦,编制成了“标准正态分布曲线下的面积”(表三、医学参考值范围的估计参考值范围(reference range)的意义参考值是指正常人体或动物的各种生理常数,正常人体液和排泄物中某种生理生化指标或某种元素的含量,以及人体对
25、各种试验的正常反应值等。由于存在个体变异,各种数据不仅因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动的范围,即医学参考值范围,亦称医学正常值范围。31医学统计学方法医学知识三、医学参考值范围的估计31医学统计学方法医学知识制订医学参考值范围时须注意:从同质总体中随机抽样。根据研究目的确定同质总体的标准。排除患有影响所研究指标的疾病和有关因素的同质人群。需要有一定的样本含量。n100例。控制测量误差。判断是否需要分组确定参考值范围。如不同性别,不同年龄组,甚至不同民族。确定是取单侧还是取双侧参考值。确定适当的百分数范围。80%,90%,95%,99%。范围过窄,即诊断标
26、准过严,会增加漏诊;范围过宽,即诊断标准过松,会增加误诊; 根据资料分布类型选择统计学方法估计参考值范围。32医学统计学方法医学知识制订医学参考值范围时须注意:32医学统计学方法医学知识表9-7 三种参考值估计方法的适用对象和95%参考值范围的计算资料类型统计方法双侧界限值单侧上界值单侧下界值正态或近似正态分布正态分布法 对数正态或近似对数正态分布对数正态分布法不规则分布百分位数法 例9-11,表9-22002年某市150名2029岁正常男子的尿酸浓度资料。X=350.24 (mol/L), S=32.97(mol/L).用正态分布法双侧95%的参考值范围的上下界限值为: 下界: 350.24
27、1.9632.97=285.62 (mol/L), 上界: 350.24 +1.9632.97=414.86 (mol/L)即2029岁男性尿酸浓度95%参考值范围:285.62414.86 (mol/L)33医学统计学方法医学知识表9-7 三种参考值估计方法的适用对象和95%参考值范围例9-12,例9-7表9-5,308名6岁以下儿童尿铅值资料。用百分位数法计算单侧95%参考值范围的上界值。即X95%尿铅值(mmol/L)人数f累计频数f累计频率(%)(1)(2)(3)(4)=(3)n027278.7725548126.30509517657001003927087
28、.661252129194.481501230398.381755308100.00 合计308L=150: 95%组段下限值fL=291:小于L的累计频数i=25: 95%组的组距f95%:=12:95%组频数故6岁以下儿童尿铅值单侧95%参考值范围为: 153.33(mmol/L)34医学统计学方法医学知识例9-12,例9-7表9-5,308名6岁以下儿童尿铅值资料本章小节资料类型描述性统计量95%参考值范围的计算对称分布,特别是正态或近似正态分布资料算术平均数方差及标准差正态分布法: 根据正态分布规律双侧: 单侧上界:单侧下界:适用于对数正态或近似对数正态分布资料几何平均数几何标准差对数
29、正态分布法:双侧:单侧上界: 单侧下界:分布不规则的资料,分散程度大的资料中位数 四分位数间距或百分位数百分位数法:按排序的位置清点位次双侧: X2.5% X97.5%单侧上界: X95.0%单侧下界:X5.0%35医学统计学方法医学知识本章小节资料类型描述性统计量95%参考值范围的计算对称分布,The end36医学统计学方法医学知识The end36医学统计学方法医学知识 第九章 第一讲练习题 实习九 数值变量资料的统计分析(1) pp.379-382 内容 (一) 选择题:1,2,3,9,10。 (二) 思考题:1,2,6。 (三) 应用题:1,2,3。37医学统计学方法医学知识 第九章
30、 第一讲练习题37医学统计学方法医学知识u.00.01.02.03.04.05.06.07.08.09-3.0.0013.0013.0013.0012.0012.0011.0011.0011.0010.0010-2.9.0019.0018.0018.0017.0016.0016.0015.0015.0014.0014-2.8.0026.0025.0024.0023.0023.0022.0021.0021.0020.0019-2.7.0035.0034.0033.0032.0031.0030.0029.0028.0027.0026-2.6.0047.0045.0144.0043.0041.004
31、0.0039.0038.0037.0036-2.5.0062.0060.0059.0057.0055.0054.0052.0051.0049.0048-2.4.0082.0080.0078.0075.0073.0071.0069.0068.0066.0064-2.3.0107.0104.0102.0099.0096.0094.0091.0089.0087.0084-2.2.0139.0136.0132.0129.0125.0122.0119.0116.0113.0110-2.1.0179.0174.0170.0166.0162.0158.0154.0150.0146.0143-2.0.0228.0222.0217.0212.0207.0202.0197.0192.0188.0183-1.9.0287.0281.0274.0268.0262.0256.0250.0244.0239.0233-1.8.0359.0351.0344.0336.0329.0322.0314.0307.0301.0294-1.7.0446.0436.0427.0418.0409.0401.0392.0384.0375.0367-1.6.0548.0537.0526.0516.0505.0495.0485.0475.0465.0455-1.5.0668.0655.0643
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Unit3 Weather(教学设计)四年级英语下册同步备课系列(人教PEP版)
- 机器人控制策略与运动学分析考核试卷
- 核辐射测量在核安全监管中的应用考核试卷
- 信托业务与保险产品的结合与创新考核试卷
- 有机污染物降解药剂研究考核试卷
- 建筑保温材料耐久性考核试卷
- 森林保护与社区参与的良好实践考核试卷
- 学校消防安全知识培训考核试卷
- 五年级体育上册 第十七课小篮球教学实录
- 主管年度绩效任务计划
- 2024年07月江苏银行招考笔试历年参考题库附带答案详解
- 2023中华护理学会团体标准-注射相关感染预防与控制
- 医院诊断证明书word模板
- 珍珠的质量分级及评估
- 麦肯锡——建立成功的财务管理体系(1)
- 评审会专家意见表
- 国际标准ISO13920
- OOS、OOT调查SOP参考模板
- 高层住宅采暖施工方案有地暖
- 《社戏》原文删除部分(共4页)
- 考试通用答题卡
评论
0/150
提交评论