版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物医学研究的统计方法第2章统计描述讲授内容第一节定量资料的统计描述第二节定性资料的统计描述第三节统计表和统计图生物医学研究的统计方法第2章教学目的和要求了解频数分布表的编制方法及应用;掌握定量资料集中趋势和离散趋势常用的统计描述指标及应用;掌握率、频率的概念及应用;能根据资料的特征,选择合适的统计表或统计图进行描述。生物医学研究的统计方法第2章一、频数表与频数分布图二、集中趋势的统计描述三、离散趋势的统计描述生物医学研究的统计方法第2章定量资料的统计描述【例1】某地2008年100名8岁男童身高资料(cm)生物医学研究的统计方法第2章问题1:该100名8岁男童的平均身高是多少?问题2:最高身高是多少?最低身高是多少?身高的分布范围是多少?问题3:身高在132~136cm占多大比例?问题4:如何用一个直观的统计图来描述身高的分布规律?分布是否对称?生物医学研究的统计方法第2章
【解析】此问题涉及如何对定量资料进行统计描述?问题1集中趋势问题2离散趋势问题3,4频数分布表和频数分布图生物医学研究的统计方法第2章(二)频数表的编制方法:1.求MAX、MIN、R
R=MAX-MIN
R=143.3-116.2=27.1(cm)2.求“组段”数,组段和组距
(1)“组段”数一般为10-15个;
(2)组距一般为R/10取整;
(3)第一组段要包括MIN,最末组段包括MAX,并同时写出上下限。
本例i=R/10=2.71→33.列表划计生物医学研究的统计方法第2章生物医学研究的统计方法第2章
图3.1某市100名8岁男童身高(cm)的频数分布身高(cm)频数对称分布生物医学研究的统计方法第2章偏态分布正偏负偏频数分布高峰位于中部,左右两恻的频数大体对称。高峰偏于右侧,长尾向左侧延伸,则为负偏态。高峰偏于左侧,长尾向右侧延伸,则为正偏态2.便于发现某些特大或特小的可疑值。3.当样本含量足够大时,以频率作为概率的估计值。4.作为陈述资料的形式。生物医学研究的统计方法第2章
二、集中趋势指标概念:集中趋势是指一组定量资料集中位置的特征值,说明这种变量值大小的平均水平,常用平均数描述。包括算术均数、几何均数、中位数、百分位数等。
生物医学研究的统计方法第2章(一)均数:1.概念:均数是算术均数的简称,指n个性质相同的定量数据之和除以n所得的结果。总体均数用希腊字母μ表示,样本均数用表示。生物医学研究的统计方法第2章均数的计算(1)直接法:适用于观察值的个数较少时。生物医学研究的统计方法第2章(2)加权法:适用于样本例数较多时或者频数表资料。
生物医学研究的统计方法第2章各组段的频数组中值(下限+上限)/2[例2]计算例1中100名8岁男童的平均身高。生物医学研究的统计方法第2章(二)几何均数G
1.概念:对n个性质相同的定量数据分别取对数变换后,按算术均数计算,然后再求其反对数所得的结果,叫几何均数。生物医学研究的统计方法第2章
2.计算(1)直接法:适用于观察值个数较少时。生物医学研究的统计方法第2章方法:将n个观察值(X1,X2,X3,……Xn)直接相乘再开n次方。
公式:
G=或G=lg-1((lg1+lg10+lg100+lg1000+lg10000)/5)=lg-1((0+1+2+3+4)/5)=lg-12=100即:平均滴度为1:100。较好地代表了观察值的平均水平。生物医学研究的统计方法第2章(2)加权法用于样本量较大的频数表资料。可用下式计算:G=lg-1(ΣflgX/Σf)例3.3有95名麻疹易感儿童,接种麻疹疫苗一个月后,血凝抑制抗体滴度见表3.4。试求平均滴度。生物医学研究的统计方法第2章生物医学研究的统计方法第2章几何均数的应用场合几何均数适用于经对数转换后成对称分布的资料,或者说是等比资料,如抗体的滴度,血清效价等。
生物医学研究的统计方法第2章(三)中位数和百分位数
1.概念:(1)中位数(median):把一组变量值从小到大排列,位于中间位置的变量值叫中位数,用M表示。(2)百分位数(percentile):为一种位置指标,一个PX将总体或样本的全部观察值分为两部分,理论上有X%的观察值比它小,(100-X)%的观察值比它大,P50分位数即是中位数。
生物医学研究的统计方法第2章2.计算方法:(1)直接由原始数据计算中位数n为奇数时n为偶数时生物医学研究的统计方法第2章生物医学研究的统计方法第2章(2)用频数表计算中位数及百分位数步骤:
生物医学研究的统计方法第2章按所分组段,由小到大计算累计频数和累计频率根据公式计算中位数及其它百分位数生物医学研究的统计方法第2章Px
所在组段的组距Px
所在组段的下限Px
所在组段的频数∑fL
为小于
L
的各组段累计频数计算中位数时,X=50,即M=P50。生物医学研究的统计方法第2章例3.3有164例沙门氏菌食物中毒病人的潜伏期(小时)见表3.5,求该潜伏期的中位数、百分位数P5和P95。
P5、M、P95分别位于第一、第三和第五组段。所在组段下限值L分别为:0、24、48。所在组频数分别为21、44、12,L前累计频数分别为0、79、146。由公式得:P5=L+i/f5(n·5%—ΣfL)=0+12/21(164×5%—0)=4.7(小时)M=L+i/fm(n/2—ΣfL)=24+12/44(164/2—79)=24.8(小时)P95=L+i/f95(n·95%—ΣfL)=48+12/12(164×95%—146)=57.8(小时)生物医学研究的统计方法第2章3.应用(1)中位数(median):可用于任何分布的资料集中趋势的统计描述,但更常用于偏态分布资料、分布的一端或两端无确定数值时集中趋势的描述。生物医学研究的统计方法第2章(2)百分位数:A、用于描述数据某一百分位的位置,最常用的是P50,即中位数;也可用两个百分位数的结合来描述一组资料的分布特征。B、用于确定参考值范围:WBC95%参考值范围:P2.5—P97.5过高过低均异常肺活量95%参考值范围:P5过低异常尿铅95%参考值范围:P95过高异常。生物医学研究的统计方法第2章(四)众数(mode):是一组数据中出现频率最高的那个数;一组数据的众数可以是1个,也可能有多个。生物医学研究的统计方法第2章中位数、算术均数和众数的关系
生物医学研究的统计方法第2章众数中位数算术均数众数中位数算术均数算术均数中位数众数正偏态分布对称分布负偏态分布(一)、极差(Range,R)计算:R=极大值-极小值意义:反映观察值变异度的大小。优点:简单明了缺点:1、R只考虑最大值和最小值之差,不能反映组内其它观察值的变异度;2、?样本例数越多,抽到极大值和极小值的可能性越大,故样本例数悬殊时不易比较极差。生物医学研究的统计方法第2章三、离散趋势指标(二)、四分位数间距(Quartile,Q)计算:Q=QU-QL=P75-P25意义及特点:类似R值,但比其稳定,考虑了中间50%观察值的变异度。缺点:未考虑全部观察值的变异度。生物医学研究的统计方法第2章生物医学研究的统计方法第2章例有164例沙门氏菌食物中毒病人的潜伏期(小时)见表3.5,求该潜伏期的四分位数间距。
P25=L+i/f25(n·25%—ΣfL)=12+12/58(164×25%—21)=16.14(小时)P75=L+i/f75(n·75%—ΣfL)=24+12/44(164×75%—79)=36(小时)Q=P75-P25=36-16.14=19.86(小时)即该潜伏期的四分位数间距为19.86小时。生物医学研究的统计方法第2章常用的变异指标
(三)、方差(Variance)概念:1总体方差:一组性质相同的定量数据中的每一个与其总体算术均数的差的平方和除以数据个数,所得的结果叫做总体方差。2样本方差:一组性质相同的定量数据中的每一个与其样本算术均数的差的平方和除以数据个数与1的差值,所得的结果叫做样本方差。生物医学研究的统计方法第2章离均差平方和:总体方差:样本方差:生物医学研究的统计方法第2章
n-1为自由度(degreeoffreedom),表示随机变量能自由取值的个数。
如有一四个(n=4)数据的样本,受到的条件限制,在自由确定4、2、5三个数据后,第四个数据只能是9,否则。因而这里的自由度=n-1=4-1=3。推而广之,任何统计量的自由度=n-限制条件的个数。生物医学研究的统计方法第2章离均差平方和常用SS或lxx表示意义及特点:克服了R值的不足,考虑了每个变量值的离散情况并消除了N的影响。其单位是原度量单位的平方。例7-9从表7-6中3组男孩体重资料分别求出方差。
表7-6三组同龄男孩体重(kg)
生物医学研究的统计方法第2章生物医学研究的统计方法第2章甲组乙组丙组常用的变异指标(四)、标准差(Standarddeviation)概念:方差的单位为原单位平方,不便使用。为了应用的方便,对总体方差开平方——标准差。生物医学研究的统计方法第2章样本标准差总体标准差标准差的计算(1)直接法:用于样本量较小的资料例3.6:计算有10名学生数学成绩的标准差。生物医学研究的统计方法第2章生物医学研究的统计方法第2章(2)加权法:用于样本量较大的频数表资料。例3.7以表3.3的资料为例,计算其标准差。生物医学研究的统计方法第2章生物医学研究的统计方法第2章标准差的应用:(1)表示变量分布的离散程度;(2)概略估计正态分布资料的频数分布;?(3)结合样本含量,计算标准误;(4)结合均数,计算变异系数。生物医学研究的统计方法第2章常用的变异指标(五)、变异系数(Coefficientofvariation,CV)概念:又叫变异度或离散系数,是同一组资料的标准差与均数之比。计算:生物医学研究的统计方法第2章应用:CV为相对数,无单位,主要用于比较度量衡单位不同或均数相差悬殊的资料的变异度。其数值越小,说明观察值的变异度越小,均数的代表性越好。生物医学研究的统计方法第2章例7-11某地7岁男孩身高的均数为123.10cm,标准差为4.71cm;体重的均数为22.29kg,标准差为2.26kg。试比较身高、体重何者变异度大。生物医学研究的统计方法第2章身高体重
由此可见,7岁男孩体重的变异度大于身高的变异度或者说身高比体重稳定。
如由表2.5资料可见,虽然儿童身高的标准差随着年龄的增大而增大。但不同年龄儿童身高的均数相差较大,在比较身高的变异度时,不能只看标准差的大小。若从变异系数分析,就可看出6岁以下儿童随年龄增加其身高的变异度逐渐减小。表2.5某地不同年龄儿童身高(cm)的变异度生物医学研究的统计方法第2章
总结
上述变异指标中,标准差是反映观察值离散趋势的最佳指标,而极差则是最简明指标。服从一定分布的资料,其标准差和极差之间存在着一定的数量化关系。生物医学研究的统计方法第2章
定性资料的统计描述第二节前面已讲过,统计中的变量有两种类型,即:定量变量和分类变量。定量变量其变量值是定量的,表现为数值的大小;而分类变量是定性的,对其观察结果的统计处理,应先按分析要求,分类汇总观察单位数,即绝对数,再进一步计算其相对数。生物医学研究的统计方法第2章【案例3.1】
某年甲乙两地发生麻疹流行,甲地发病人数为300人,乙地发病人数为250人,甲地发病人数比乙地多50人,能否据此认为甲地麻疹发病比乙地严重呢?
生物医学研究的统计方法第2章【案例解析3.1】甲乙两地麻疹发病人数300人,250人是计数资料,对于该类资料的整理,一般是先根据某种属性(即发病,未发病)分组,然后得到每组的观察单位数(绝对数)。尽管甲地发病的绝对数比乙地多50人,但并不能就肯定地说甲地麻疹发病比乙地严重,需借助相对数进行描述。生物医学研究的统计方法第2章一相对数的概念
包括率、构成比、相对比和动态数列,由于它是两个有联系的指标之比,因而叫作相对数。生物医学研究的统计方法第2章二常用的相对数(一)率(rate),又称频率指标概念:表示在一定条件下,发生某现象的观察单位数与可能发生某现象的观察单位数之比。公式:作用:说明某现象发生的频率或强度。生物医学研究的统计方法第2章式中的K为比例基数,可以为100%、1000‰、10000/万、100000/10万等。选择K的要点:(1)根据习惯用法以便于比较,如治愈率、某病病死率、人工流产率等用百分率;出生率、婴儿死亡率等用千分率;(2)使算得的率至少保留1~2位整数。生物医学研究的统计方法第2章如果【案例3.1】中甲地人口为30000,乙地人口为10000,则:生物医学研究的统计方法第2章甲地麻疹发病率=乙地麻疹发病率=乙地麻疹发病率高于甲地,所以认为乙地麻疹发病比较严重。(二)构成比(constituentratio),构成指标。概念:表示某一现象内部各组成部分所占的比重或分布。公式:作用:表示某一事物内部各组成部分所占的比重。
生物医学研究的统计方法第2章
表3-1某地1955年和1956年疟疾的构成
生物医学研究的统计方法第2章构成比的特征:(1)各组成部分的构成比之和为100%。(2)某一部分构成比增大或减小,必然使其它部分产生相应的变化。生物医学研究的统计方法第2章注意区别率和构成比:虽然两者均为两个指标之比,但意义却完全不同。率反应了某项指标的平均强度或平均水平,它具有数值变量中平均数的含意,如甲地麻疹发病率为1%,也可认为该地每个人患麻疹的平均可能性为1%。构成比表示某一现象内部各组成部分所占的比重或分布,不能反应该现象的平均强度或平均水平。生物医学研究的统计方法第2章生物医学研究的统计方法第2章?(三)相对比(relativeratio)概念:是2个有联系的同类指标之比,说明二者的对比水平。公式:作用:说明A为B的若干倍或百分之几。生物医学研究的统计方法第2章例3.2某市1977~1979年肺癌死亡率城区为19.39/10万,郊区为9.99/10万,二者的相对比为19.39/9.99=1.94,即城区肺癌死亡率为郊区肺癌死亡率的1.94倍。
生物医学研究的统计方法第2章
计算相对比的指标既可是相对数,也可是两个绝对数或平均数。
如我们可计算出甲乙两地麻疹发病人数之比为300/250=1.25。生物医学研究的统计方法第2章三应用相对数时应注意的问题1.计算相对数的分母不易过小。2.分析时不能以构成比代替率。
生物医学研究的统计方法第2章3.对观察单位不等的几个率,不能直接相加求其平均率。
如:n1=40X1=20P1=50%n2=60X2=20P2=33.3%
显然:P≠(P1+P2)/2而是:P=(X1+X2)/(n1+n2)×比例基数=40%4.资料的对比应注意同质。5.对样本率的比较应遵循随机抽样,要作假设检验。生物医学研究的统计方法第2章某文章作者根据下表资料,认为沙眼在20-岁组的患病率最高,以后随着年龄的增大而减少。你同意吗?说明理由。
某医院门诊沙眼病人年龄构成比
生物医学研究的统计方法第2章在下表中,作者列出了12种心理问题,原作者根据各行数据与总患者人数50计算出12个相对数,并称之为“百分比”,对吗?
表2病人术前术后常见的心理问题(N=50)生物医学研究的统计方法第2章
统计表和统计图第三节统计表
概念统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。统计表的结构统计表的基本结构包括:表号、标题、标目、线条、数字、以及备注统计表的种类
简单表复合表
生物医学研究的统计方法第2章生物医学研究的统计方法第2章生物医学研究的统计方法第2章表1甲、乙两地1980年HbsAg阳性率生物医学研究的统计方法第2章表2目标人群的人口学特征统计表的绘制原则
总原则:(1)重点突出,简单明了。不要包罗万象,要使人看过后能明白表格所要表达的主要内容。(2)主谓分明,层次清楚。避免层次过多或结构混乱。
生物医学研究的统计方法第2章基本要求
1.标题(title)
标题一般写在表格的上方,内容应包括时间、地点、主要事件,不要过于简练,要求用最少的文字说清楚。2.标目(heading)
横标目要按时间前后或数量大小和事情的重要性等顺序排列,纵标目有单位的要注明单位。注意标目的层次要清楚,不要太多、太复杂。3.线条
统计表中只有横线,无竖线和斜线。4.数字
一律用阿拉伯数字。同一列的小数位数应一致,且位次对齐。表格中不应有空格,暂无记录或未记录用“···
”(点号)表示,无数据用“—”表示,这两种情况都不能填“0”。5.备注
不应写在表中,在数字上角用“*”号标出,文字叙述写在表的下方。生物医学研究的统计方法第2章思考题指出表7-28的缺陷,并作改进。生物医学研究的统计方法第2章生物医学研究的统计方法第2章例7-30指出表7-30的缺陷,并作改进。生物医学研究的统计方法第2章生物医学研究的统计方法第2章生物医学研究的统计方法第2章统计图直条图(barchart)
1.概念:用等宽直条的长短来表示各个相互独立的指标大小的图形。2.适用资料:相互独立的资料。3.分类:分为单式和复式两种。单式适用于只有一组观察资料(见图1),复式适用于有若干组观察资料(见图3)生物医学研究的统计方法第2章直条图(barchart)
4.绘制要点:⑴坐标轴:横轴为观察项目,纵轴为数值,纵轴坐标一定要从0开始。⑵直条的宽度:各直条应等宽,等间距,间距宽度和直条相等或为其一半。复式直条图在同一观察项目的各组之间无间距。⑶排列顺序:可以根据数值从大到小或按时间顺序排列。生物医学研究的统计方法第2章生物医学研究的统计方法第2章做图图1某医院3种葡萄球菌对两种抗生素的耐药率百分条图(percentagebarchart)1概念:以长条面积为100%,用长条内各段面积所占的百分比来表示各部分在全体中所占的比例
2适用资料:构成比资料。3应用:描述各部分的百分构成。百分条图(percentagebarchart)
4绘制要点:⑴标尺:一定要有标尺,画在图的上方或下方。全长为100%,分成10格,每格10%。⑵分段:按各部分所占百分比的大小排列,在图上标出百分比。⑶图例:在图外要附图例说明。⑷多组比较:若要比较的事物不止一个时,可以画几个平行的百分条图,以示比较。各条图的排列顺序相同,图例相同。生物医学研究的统计方法第2章圆图(piechart)
1概念:以一个圆面积为100%,用圆内各扇形面积所占的百分比来表示各部分所占的构成比例
2适用资料:构成比资料。3应用:描述各部分的百分构成。
4绘制要点:ⅰ每3.6o为1%,用3.6乘以百分数即为所占扇形的度数。用量角器画出。ⅱ从相当于时钟12点或9点的位置开始顺时针方向绘图。ⅲ每部分用不同线条或颜色表示,并在图上标出百分比,下附图例说明。ⅳ当比较不同资料的百分构成时,可以画两个相等大小的圆,在每个圆的下面写明标题,并用相同的图例表示同一个构成部分。生物医学研究的统计方法第2章圆图线图(linediagram)
概念:以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况
适用资料:连续性资料。绘制要点:ⅰ坐标轴:横轴表示时间或组段,纵轴表示频数或频率。纵轴坐标可以不从0开始,因此在看图时要注意纵轴的起点坐标。ⅱ数据点画在组段中间位置。相邻的点用直线连接,不要用平
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年购房协议:房屋买卖双方权利与义务明确3篇
- 2025年精密车床项目合作计划书
- 2024年环保科技研发增资股权收购合同3篇
- 2024建设工程施工安全生产协议
- 2024提供证券投资咨询服务协议书
- 二零二五年中草药市场调研与分析服务合同2篇
- 二零二五年光纤通信线路巡检维护合同3篇
- 2025版菜鸟驿站物流园区合作开发合同3篇
- 2024年版翻译服务居间合同3篇
- 课题申报书:大语言模型驱动的课堂生成性分析及其实现路径研究
- 低浓度颗粒物的测定重量法方法验证报告
- 百家姓全文拼音版A4打印
- 日本签证在职证明
- 专家论证挖孔桩专项施工方案
- IPC标准解析学习课程
- 麻花钻钻孔中常见问题的原因和解决办法
- 博士研究生综合素质及科研能力综合考评评分表
- 外墙真石漆购销合同
- 氟化物测定方法
- 艺体教研组活动记录
- (最新整理)锅炉过热蒸汽温度控制系统方案
评论
0/150
提交评论