版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章
定量资料的统计分析
1统计分析的内容统计描述:是用统计表、统计图、统计指标来描述资料的分布规律及其数量特征。▲
把握资料的基本特征;▲
为统计分析打下基础。统计推断:在医学科学研究中通常应用抽样研究的方法,即对总体中随机抽取的部分观察单位(样本)进行研究,然后用样本信息推断总体特征,即统计推断。2第一节定量资料的统计描述一、频数分布表和频数分布图二、集中趋势的统计描述三、离散趋势的统计描述1.连续性变量的频数表的编制
例4.2在某市2005年进行的小学生体质评价研究中,测定了120名9岁男孩的肺活量(L),资料如下,根据该资料制作频数表。1.7061.3261.6321.8762.1611.6841.5331.1751.8671.6762.0911.8471.2131.2770.989
2.2351.6651.2891.7241.5481.6081.8901.7331.7961.2031.7361.4501.6331.5551.352…1.2911.7961.6471.4151.8730.9961.9361.5261.4241.5891.6701.0561.9691.4812.4062.1231.9881.5121.0301.8861.9301.7251.3741.6541.6631.4381.6451.2141.1841.735你能看出资料有什么规律?56编制步骤:①确定全距(range)
全部观察值中最大值与最小值之差,用符号R表示。又称极差。本例极差:R=2.406-0.980=1.417(L)。②划分组段确定组数:根据观察单位的多少及其全距来定,组数不宜太多或者太少。确定组距:一般采用等距分组,组距=R/组数。本例i=R/12=1.417/11=0.129≈0.130确定各组段上下限:每个组段的起点称为该组的下限(lowlimit),终点称为上限(upperlimit)。第一组段必须包含最小值。最后一个组段上限必须包含最大值,并且同时写出其下限与上限。其它组段上限值忽略。注意各组段不能重叠。8根据这些数据编制成的频数表能显示出这组数据分布的特征10图4.12005年某市120名9岁男孩肺活量频数分布
12集中趋势:高峰组段的位置离散趋势:观察值的分布范围142)频数分布的类型对称分布:集中位置在正中,左右两侧大体对称。偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布*分布类型不同,采用的统计方法不同负偏态分布15频数分布高峰(集中位置)位于中部、两边低、左右对称。1.对称分布:实例图4.22004年我国麻疹患者的年龄分布2.正偏态分布:集中位置偏向数值小的一侧,高峰偏于左侧,长尾向右延伸。17图4.3某市219名乳腺癌患者术后康复期生存质量评分的分布
频数评分集中位置偏向数值大的一侧,高峰偏于右侧,长尾向左延伸。3.负偏态分布:18二、集中趋势的描述
描述一组同质观察值的平均水平或中心位置的常用的指标有算术均数、几何均数、中位数等。201、算术均数,mean适用条件:单峰对称分布,特别是正态或近似正态分布的定量资料。符号:表示样本均数,希腊字母表示总体均数。21(2)频数表法(加权法)
当观察值个数较多时,可先把原始资料分组,列出频数表,计算均数时将各组频数乘以相应组的组中值,逐个相加求和,除以总例数。X1,X2,,Xk:频数表资料中各组段的组中值;f1,f2,,fk:相应组段的频数。23表4.2120名9岁男孩肺活量均数的计算肺活量组段(1)频数f(2)组中值x(3)fx(4)=(2)(3)0.980~51.0455.2251.110~51.1755.8751.240~71.3109.1701.370~141.43520.091.500~191.56529.735............24
均数的应用范围及条件:1.均数反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本进行比较。2.均数适用于单峰对称分布,尤其是正态分布资料,这时均数位于分布的中央,能反映观察值的集中趋势,即其平均水平。也可用于近似正态分布。26适用于数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料。如医学实验中的抗体滴度;食品中农药含量;疾病的潜伏期等。计算方法有:直接法和频数表法。2、几何均数,geometricmean,G27直接法由原始变量值直接计算几何均数。设变量值为X1,X2…Xn,几何均数G为:282.频数表法(加权法)当资料中出现相同观察值的个数较多时,或资料为频数表资料,则用加权法计算几何均数。变量及频数如下,符合几何均数的适用条件:X1,X2,…Xk
f1,f2,…fk
则几何平均数G为:
30例4.5
某医院预防保健科用流脑疫苗为75名儿童进行免疫接种,1个月后测定其抗体滴度如表4.3所示,求平均滴度。31
其血凝抗体滴度的平均滴度为1:27.35。
抗体滴度(1)滴度倒数X(2)lgX(3)人数f(4)flgX(5)1:41:8480.60210.9031492.40848.12791:161:321:641:1281:2561632641282561.20411.50511.80622.10722.40822120125425.286130.102021.674410.53609.6328合计-
-75107.7676表4.375名儿童的平均抗体滴度计算表32应用注意事项:适用资料:①经对数变换后呈正态或近似正态分布的资料;②用于等比资料;注意:根据对数的性质:零与负数没有对数1)变量值不能有0;2)变量值不能同时有正值与负值。33一组观察值从小到大排列,位次居中的观察值即中位数,是一个位置指标。符号:P50或M3.中位数(median)
34中位数计算方法直接法:将观察值由小到大排列,按下式计算。35例某病患者9名,其发病的潜伏期(天)为:3,4,4,5,6,7,7,9,11,求中位数。本例n=9,为奇数,按式(9.6)得:(天)若在该例基础上再继续观察,在第20天又发现1例患者,则n=10,为偶数,按式(2.7)得:=(X5+X6)/2=(6+7)/2=6.5(天)36(2)频数表法
L为P50所在下限;i为该组的组距;fM为该组频数;为比该组段略小的组段的累计频数。37①求n/2;②计算累计频数;③两者比较确定M所在组;④根据公式计算。计算步骤38评分频数累计频数累计频率(%)频率范围0~220.910~0.9130~241.830.92~1.8340~373.201.84~3.2050~11188.223.21~8.2260~304821.928.23~21.9270~6311150.6821.93~50.6880~6017178.0850.69~78.0890~10048219100.0078.09~100.00表4.4219名乳腺癌患者康复期生存质量评分例4.8为研究乳癌患者术后康复期生存质量的状况,某医院对219名术后康复期乳癌患者进行了生存质量测定,结果如表4.4,求平均评分。39M=
=70+10/63(219×50%-48)
=79.76(分)4041三、离散程度的描述
集中趋势是数据分布的一个重要特征,但单有集中趋势指标还不能很好地描述数据的分布规律。而且还要看数据的变异散程度。42盘编号甲乙丙14404804902460490495350050050045405105055560520510合计250025002500均数500500500例:采甲、乙、丙三人的耳垂血,然后进行红细胞计数,每人数5个计数盘,得结果如下(万/mm3)甲乙丙离散程度:反映一群变量值的变异程度或参差不齐的程度。◆离散程度大,均数的代表性差,◆离散程度小,均数的代表性好。44常用的指标(1)极差(range)(2)四分位数间距(quartileinterval)(3)方差和标准差(varianceandstandarddeviation)(4)变异系数(coefficientofvariation)451、极差/全距,range
R=Xmax-Xmin优点:简单明了缺点:1)只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度2)样本含量越大,抽到较大或较小观察值的可能性越大,则全距可能越大,因此样本含量悬殊时不宜用全距。462、四分位数间距,inter-quartilerange
常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
1)百分位数(percentile):是指将观察值从小到大排列后处于第x百分位置上的数值,亦是位置指标,用Px表示。Px表示将全部观察值分为两部分,有x%的观察值比Px小,有(100–x)
%的观察值比Px大。P50即中位数。472)四分位数(quartile,Q):特定的百分位数,把一组观察值分为四等份。下四分位数:QL=P25上四分位数为:QU=P75四分位数间距:QU-QL小大P0P25
P50
P75
P100QLQUM48直接法:(自学)
频数表法:见教材P48,例4.1149评分频数累计频数累计频率(%)频率范围0~220.910~0.9130~241.830.92~1.8340~373.201.84~3.2050~11188.223.21~8.2260~304821.928.23~21.9270~6311150.6821.93~50.6880~6017178.0850.69~78.0890~10048219100.0078.09~100.00表4.4219名乳腺癌患者康复期生存质量评分QU=80+10/60(219×75%-111)=88.88(分)Q=QU-QL=88.88-71.07=17.81QL=70+10/63(219×25%-48)=71.07(分)例4.1350四分位数间距越大,变量值的变异程度或离散程度越大;四分位数间距比极差稳定,但仍未考虑每个观察值的变异;四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。四分位数间距的意义513.方差和标准差为了全面考虑每个观察值的变异情况,克服全距和四分位数间距的缺点,引入了“方差”52
为了衡量每个变量值的变异,先选择一个数值作为比较标准;谁合适呢?均数最有代表性。
甲乙丙53(1)方差,variance衡量每个观察值相对均数的偏差,构造出综合描述资料离散程度的指标。方差说明观察值的变异程度,方差越大,观察值得变异程度较大,反之,观察值得变异程度较小。54在实际工作中,总体均数μ往往是未知的,故只能用样本均数作为总体均数μ的估计值,用样本例数n代替N,这样计算的结果通常比实际的σ2低。英国统计学家提出用n-1代替n来校正,这就是样本方差s2。式中的n-1称为自由度(degreeoffreedom)是统计学中的一个常用术语,用υ表示。
55自由度例:有一个4个数据的样本,在自由取值4、2、5三个数据后,第四个数据只能是956(2)标准差,standarddeviation因方差的度量单位是原度量单位的平方,故将方差开方,恢复成原度量单位,得总体标准差σ。标准差大,表示观察值的变异度大;标准差小,表示观察值的变异度小。57样本标准差(s):58标准差的计算直接法加权法59直接法甲组:88910111212n=760(2)加权法当相同观察值的个数较多时,或资料为频数表资料,可用加权法计算标准差,其公式为:其中X为各组段的组中值,f为相应的频数。61例4.16计算例4.2中120名9岁男孩肺活量资料的标准差。我们常用标准差描述一组对称资料的离散趋势。624.变异
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水利工程取水口施工方案
- 德育工作总结与社会适应能力培养
- 2024年俱乐部会籍转让与确认协议
- (2024版)5G技术研发与技术服务合同
- 养老院合同变更及纠纷处理制度
- 2024年万达文化旅游城租赁合同
- 风电项目基础设施混凝土施工方案
- 化工厂安全生产标准化操作方案
- 技术部知识共享制度
- 农贸市场生鲜配送收费方案
- 高危儿规范化健康管理专家共识解读
- 第13课《纪念白求恩》课件2024-2025学年统编版语文七年级上册
- 食品安全的规章制度和食品操作流程
- 《义务教育体育与健康课程标准(2022年版)》解读
- 部编版三年级上册语文第七单元大单元教学设计
- NB-T 10435-2020 电动汽车快速更换电池箱锁止机构通.用技术要求
- 03SG610-1建筑结构隔震构造详图
- 软木底生产工艺流程
- 高边坡专项施工方案专家已评审
- 氧气吸入操作评分标准(中心供氧)
- 2024年深圳公司试用期员工劳动合同范文(二篇)
评论
0/150
提交评论