医学统计学个体变异_第1页
医学统计学个体变异_第2页
医学统计学个体变异_第3页
医学统计学个体变异_第4页
医学统计学个体变异_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学个体变异第一页,共七十一页,2022年,8月28日研究数据的收集、整理、分析的一门学科。

Statisticsisthesciencedealingwiththecollections,analysis,interpretationandpresentationofmassesofnumericaldata.(Webster国际大词典)Statisticsisthescienceandartofdealingwithvariationindatathroughcollection,classificationandanalysisinsuchawayastoobtainreliableresult.统计学是什么?

WhatisStatistics?2第二页,共七十一页,2022年,8月28日医学统计学医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。3第三页,共七十一页,2022年,8月28日医学研究的三个步骤1.研究设计3.结论2.资料分析统计学推断专业推断结合假设实验或调查获得数据运用医学统计学的起点,也是高质量地完成整个研究的重要基础。在数据分析的基础上,应用统计学处理的结果,进行统计学推断;同时,依据相应的专业知识,作出专业性的结论。在研究设计基础上,通过实验(试验)或调查,将所得数据进行统计学处理的过程。4第四页,共七十一页,2022年,8月28日第一种分类(三类资料)(1)定量资料(quantitativedata)(2)定性资料(qualitativedata)(3)等级资料(rankeddata,ordinaldata)

5第五页,共七十一页,2022年,8月28日

数值变量资料(numericalvariable)

分类资料(categoricalvariable)

第二种分类(两类资料)6第六页,共七十一页,2022年,8月28日数学上的分类连续性资料(continuousdata)离散型资料(discretedata)

7第七页,共七十一页,2022年,8月28日一些重要的基本概念

1.同质和异质2.变异3.总体与样本4.随机5.参数和统计量6.频率和概率7.抽样误差8第八页,共七十一页,2022年,8月28日医学统计学思维归纳型思维推理型思维从样本到总体从个别到一般9第九页,共七十一页,2022年,8月28日个体变异(individualvariation)因为变异,世界才变得如此丰富多彩!第十页,共七十一页,2022年,8月28日Outline个体变异频数分布表和频数分布图

频数图和频数表的信息资料的统计描述描述集中趋势的指标:平均数描述离散趋势的指标:变异度正确应用总结11第十一页,共七十一页,2022年,8月28日个体变异个体变异(individualvariation)是同质观察对象间表现出的差异。变异是生物体在一种或多种、已知或未知的不可控因素作用下所产生的综合反映。就每个观察单位而言,其观察指标的变异是不可预测的,或者说是随机的(random)。就总体而言,个体变异是有规律的。12第十二页,共七十一页,2022年,8月28日个体变异是统计学应用的前提个体变异抽样误差统计推断13第十三页,共七十一页,2022年,8月28日例1:个体变异的表现某地所有20岁健康男生的血红蛋白某地所有20岁健康男生和女生的血红蛋白江苏和西藏所有20岁健康男生的血红蛋白

某地所有20岁健康男生和女生的白细胞计数√√ΧΧ14第十四页,共七十一页,2022年,8月28日个体变异生物体的变异是普遍存在的,是客观事实,无法准确预测。这种变异是有规律的,是可以认识的。15第十五页,共七十一页,2022年,8月28日HeterogeneityorIndividualvariation?Thereare1.23%differentchromosomesbetweenhumanandjocko.(Science,2002)16第十六页,共七十一页,2022年,8月28日例2:乱七八糟的原始数据某市1997年12岁男童120人的身高(cm)资料如下。

142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144.0145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154.0147.7152.3146.6132.1145.9146.7144.0135.5144.4143.4137.4143.6150.0143.3146.5149.0142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.917第十七页,共七十一页,2022年,8月28日频数分布原因:由于个体变异的存在,医学研究中某指标在各个体上的观察结果不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布(distribution)。现状:医学研究得到的原始数据(rawdata)往往是庞大的、混乱的。解决:频数分布的基本思想:将原始数据按照一定的标准划分为若干各组,合计各组的频数,得到频数分布表;在将频数表绘制成频数分布图。18第十八页,共七十一页,2022年,8月28日频数表的编制①找出极大值和极小值,并计算极差R

此例R=160.9-125.9=35②依R分组,确定组数组距组段,常取8-15组,用1/10R取整作组距。这里取4③计算频数19第十九页,共七十一页,2022年,8月28日计量资料的频数、频率分布组段频数频率

124~ 1 0.0083128~ 2 0.0167132~ 10 0.0833136~ 22 0.1834140~ 37

0.3083144~ 26 0.2167148~ 15 0.1250152~ 4 0.0333156~ 2 0.0167160~ 1 0.0083合计 120 1.000020第二十页,共七十一页,2022年,8月28日计量资料的频数分布

xFreq.124~1*128~2**132~10**********136~22**********************140~37*************************************144~26**************************148~15***************152~4****156~2**160~1*Total12021第二十一页,共七十一页,2022年,8月28日124~128~132~136~140~144~148~152~156~160~#################################################################################################################$$$$###计量资料的频数分布22第二十二页,共七十一页,2022年,8月28日计量资料的频数分布图23第二十三页,共七十一页,2022年,8月28日计量资料的频数分布图图某市120名12岁男童身高的频数分布124132140148156164010203040人数身高(cm)24第二十四页,共七十一页,2022年,8月28日定性资料的频数分布血型 频数 频率(%)O 205 40.43A 112 22.09B 150 29.59AB 40 7.89合计 507 100.00表507名傣族人血型的频数分布25第二十五页,共七十一页,2022年,8月28日分类资料的频数分布图OABAB26第二十六页,共七十一页,2022年,8月28日EXCEL制作的频数图血型人数图507名傣族人血型的频数分布27第二十七页,共七十一页,2022年,8月28日EXCEL制作的频率图血型比例图507名傣族人血型的频率分布28第二十八页,共七十一页,2022年,8月28日频数分布与频率分布频数(率)分布用于表达观察指标的分布规律。分布规律:变异规律。29第二十九页,共七十一页,2022年,8月28日频数分布所提供的信息频数分布图用以表示数据的分布规律考察分布的类型对称分布非对称分布skewness

(偏态分布)左偏态(负偏态)右偏态(正偏态)“偏”是偏离的意思,表示个别观察值偏离均数较远,而不是“集中位置偏”;“正偏”是指个别数据偏在均数右侧,其与均数之差为“正”;“负偏”是指个别数据偏在均数左侧,其与均数之差为“负”;正偏分布的偏度系数为正,负偏分布的偏度系数为负。30第三十页,共七十一页,2022年,8月28日124132140148156164010203040人数身高(cm)频数(率)分布实例(对称分布)31第三十一页,共七十一页,2022年,8月28日图239人发汞含量的频数分布13579111315171921发汞含量(umol/kg)706050403020100人数频数(率)分布实例(偏态分布1)正(右)偏态分布32第三十二页,共七十一页,2022年,8月28日图某城市892名老年人生存质量自评分的频数分布0102030405060708090100自评分4003002001000人数频数(率)分布实例(偏态分布2)负(左)偏态分布33第三十三页,共七十一页,2022年,8月28日图102名黑色数瘤患者的生存时间频数分布151015202530354045生存时间(月)403020100人数频数(率)分布实例(偏态分布3)正(右)偏态分布34第三十四页,共七十一页,2022年,8月28日图某地1990~1992年男性死亡年龄分布

0510152025

303540

455055606570758085死亡年龄(岁)25002000150010005000频数(率)分布实例(偏态分布4)35第三十五页,共七十一页,2022年,8月28日偏态,正偏态和负偏态分布不对称者称为偏态分布。偏态分布又分为正偏分布和负偏分布。所谓正偏分布是指分布的长尾在峰的右侧,又称右偏分布;所谓负偏分布是指分布的长尾在峰的左侧,又称左偏分布。36第三十六页,共七十一页,2022年,8月28日定量资料的描述图形描述 频数(率)分布图趋势图……定量资料的统计指标描述

集中位置:算术均数、加权平均数、几何均数、中位数、百分位数离散程度:极差、四分位数间距、标准差、方差、变异系数37第三十七页,共七十一页,2022年,8月28日描述集中位置的指标平均数(Average)算术均数和加权均数(MeanandWeightedMean)几何均数(GeometricMean)中位数和百分位数

(MedianandPercentile)38第三十八页,共七十一页,2022年,8月28日集中位置的描述----平均数(1)算术均数(arithmeticmean,mean)

简称均数(mean),是用得最多的统计描述指标。39第三十九页,共七十一页,2022年,8月28日总体均数thepopulationmean样本均数thesamplemeanμ40第四十页,共七十一页,2022年,8月28日例:11名五岁女童身高值(cm)分别为:112.9,99.5,100.7,101.0,112.1,118.7,107.9,108.1,99.1,104.8,116.5,求平均身高。41第四十一页,共七十一页,2022年,8月28日加权均数(weightedmean)

均数是加权均数的一个特例加权均数42第四十二页,共七十一页,2022年,8月28日均数的应用:1、均数能全面反映全部观察值的平均数量水平,应用甚广。2、最适于对称分布资料,对于偏态资料,均数不能较好地反映其集中趋势。3、在描述正态分布资料方面有重要意义43第四十三页,共七十一页,2022年,8月28日平均数(2)几何均数(geometricmean,G)44第四十四页,共七十一页,2022年,8月28日几何均数例1:10,1:20,1:40,1:80,1:16045第四十五页,共七十一页,2022年,8月28日几何均数的应用:1.等比资料,如抗体平均滴度2.对数正态分布资料Remember!46第四十六页,共七十一页,2022年,8月28日使用几何均数时的注意点:1)观察值不能有0。2)观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。Becareful!47第四十七页,共七十一页,2022年,8月28日平均数(3)中位数(median,M)指将一组观察值从小到大按顺序排列,位次居中的观察值,常用M表示。中位数计算方法:48第四十八页,共七十一页,2022年,8月28日例:某病患者5人,其潜伏期分别为2,3,5,8,20,求中位数?n=5,M=x3=5(天)例:8名新生儿身长(cm)依次为50,51,52,53,54,55,58,求中位数?n=8,M=(x4+x5)/2=(53+54)/2=53.5(cm)中位数例49第四十九页,共七十一页,2022年,8月28日中位数例9例正常人的发汞值:

1.1,1.83.54.24.8

5.65.97.110.5

9例正常人的发汞值:

1.1,1.83.54.24.85.65.97.1>16

10例正常人的发汞值:

1.1,1.83.54.24.85.65.97.110.5>16

M=4.8

M=4.8

M=(4.8+5.6)/2=5.250第五十页,共七十一页,2022年,8月28日中位数例对于某项风险较高的新手术术后的生存时间进行跟踪,共调查了7人,6人死亡之前分别生存了5天、6天、10天、16天、25天、29天,还有一人术后30天随访时仍存活。本资料属于“开口”资料。本例数据已经按从小到大的升序排列,n=7,为奇数,其中位数为16天。51第五十一页,共七十一页,2022年,8月28日平均数(3)百分位数(percentile)是一个位置单位,以Px表示,一个Px将总体或样本的全部观察值分为两部分。理论上有x%的观察值比它小,有(100-x)%的观察值比它大.X%

PX(100-X)%50%分位数就是中位数25%,75%分位数称四分位数(quartile)

52第五十二页,共七十一页,2022年,8月28日中位数和百分位数的应用1、中位数和百分位数的计算对资料分布没有特殊要求。偏态分布;分布不规则或未知分布;一端或两端有不确定数据(开口资料)

2、样本含量较少时不宜用靠近两端的百分位数来估计频数分布范围;因为在例数较少时,靠近两端的百分数不够稳定。3、中位数比均数具有较好的稳定性。但是,由于只采纳了数据的相对大小的信息,不够精确。53第五十三页,共七十一页,2022年,8月28日平均数应用的注意事项同质的资料计算平均数才有意义。算术均数适用于:单峰对称分布的资料几何均数适用于:对数变换后单峰对称的资料中位数和百分位数适用于:偏态分布资料,分布类型未知的资料,有极端值和不确定值的资料54第五十四页,共七十一页,2022年,8月28日例3只用平均数描述资料的弊病甲组2629303134乙组2427303336丙组2628303234丙乙甲三组儿童体重的离散程度均数30kg55第五十五页,共七十一页,2022年,8月28日描述离散趋势的指标变异度极差(Range)四分位数间距(interquartilerange)方差(Variance)标准差(StandardDeviation)变异系数(

coefficientofvariation)56第五十六页,共七十一页,2022年,8月28日全距(range),极差R=max-min优点:简单方便缺点:不灵敏

除了最大、最小值,不能反应组内其他数据的变异。

不稳定

两样本例数相差旋殊,不适用全距比较变异度。离散程度的描述指标(1)57第五十七页,共七十一页,2022年,8月28日四分位数间距:quartileP75上四分位数P25

下四分位数QUQL离散程度的描述指标(2)58第五十八页,共七十一页,2022年,8月28日MinQLMQUMax极差四分位数间距59第五十九页,共七十一页,2022年,8月28日

总体方差σ2=

在样本中,μ未知,常用替代,

S2=方差(variance)离散程度的描述指标(3)60第六十页,共七十一页,2022年,8月28日总体标准差σ=样本标准差

n-1:自由度(degreeoffreedom)任何统计量的自由度

=变量数-限制条件的个数离散程度的描述指标(4)标准差(standarddeviation)61第六十一页,共七十一页,2022年,8月28日甲组2629303134乙组2427303336丙组2628303234

极差方差标准差甲组88.50 2.92乙组1222.50 4.74丙组810.00 3.16离散度比较62第六十二页,共七十一页,2022年,8月28日排除了平均水平的影响,并取消了单位。因此变异系数常用于:比较度量衡单位不同的两组或多组资料的变异度比较均数相差悬殊的两组或多组资料的变异度离散程度的描述指标(5)变异系数(coefficientofvariation,CV)63第六十三页,共七十一页,2022年,8月28日某地100名20岁男子身高:平均=166.06cm, 标准差=4.95cm体重:平均=53.72

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论