




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
定量数据的统计描述,深大医学部周颖香港大学医学博士后2016.9.14,医学统计学,第一节频数分布,【例】抽样调查某地120名1835岁健康男性居民血清铁含量(mol/L),试编制此血清铁资料的频数分布表。,表120名健康男性居民血清铁含量频数分布表,频数表(frequencytable)的编制,a、计算全距(range,R):是一组数据的最大值与最小值之差。RMax-Min,b、确定组数与组距样本量在100例左右,组数选择815之间,一般取10组左右。组距全距/组数,c、确定组限第一组段必须包括最小值,最后一组段必须包括最大值。最后一组段包括最大值,且一般情况下应包含该组段上限,其余各组段区间左闭右开。,d、计算各组段频数(frequency):即计算各组段内观察值的个数。,e、计算各组段频率(percent):即计算各组段频数与总观察值个数之比,用百分数表示。,f、计算累计频数(cumulativefrequency)和累计频率(cumulativepercent):累计频数是由上至下将频数累加;累计频率是由上至下将频率累加。,频数表(frequencytable)的编制,频数分布的目的和用途,目的:了解数据的分布范围、集中位置以及分布形态等特征,以便根据资料分布情况选择合适的统计方法。,用途:作为陈述资料的形式;便于观察数据的分布类型;便于发现数据中特大或特小的可疑值;当样本量大时,可用各组段的频率作为概率的估计值。,图120名健康男性居民血清铁含量频数分布图,【例】抽样调查某地120名1835岁健康男性居民血清铁含量(mol/L),试编制此血清铁资料的频数分布表。,直方图(histogram),直方图,是以垂直条段代表频数分布的一种图形。,频数,由纵轴标度,组限,由横轴标度,组距,条段的宽度,直方图(histogram),对称分布(symmetricdistribution),偏态分布(skeweddistribution),右偏态分布(right-skeweddistribution),左偏态分布(left-skeweddistribution),第二节集中趋势的统计指标,平均数(average),是描述一组观察值集中位置或平均水平的统计指标,常作为一组数据的代表值用于分析和进行组间的比较。,常用的有算术均数、几何均数、中位数、百分位数等。,概述,1、直接法,n为样本量,X为个体观察值。,【例】测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。,算术均数,算术均数,【例】120名健康男性居民血清铁含量的频数分布表,试求其算术均数。,f为组段的频数,n为总频数,X为组段的组中值。X=(组段上限+组段下限)/2,2、加权法(频数表法),f为组段的频数,n为总频数,X为组段的组中值。X=(组段上限+组段下限)/2,算术均数,【例】120名健康男性居民血清铁含量的频数分布表,试求其算术均数。,算术均数,算术均数(arithmeticmean),等于一个变量所有观察值的和除以观察值个数。,总体均数用希腊字母表示,样本均数用符号表示。,算术均数适用于对称分布的资料,如分布均匀的小样本数据或近似正态分布的大样本数据。,算术均数用了到每个观察值!易受极端值的影响,并且受极大值的影响大于受极小值的影响。,几何均数,医学研究中有一类特殊资料按照倍数关系变化,比如细菌计数,抗体滴度。几何均数适用于取对数后近似呈对称分布的资料,尤其是右偏态分布数据。医学研究中常用于比例数据。,【例】52例慢性肝炎患者的HBsAg滴度数据表,试求其几何均数。,几何均数,几何均数(geometricmean,G),等于一个变量所有n个观察值的乘积的n次方根。,【注】计算几何均数的观察值不能小于或等于0,因为无法求对数。,几何均数,1、直接法:,【例】某医院测得10个某种传染病人的白细胞计数(103),测定值为:11,9,35,5,9,8,3,10,12,8。计算这10个观察值的几何均数。常用于血清学和微生物学中!,几何均数,2、加权法(频数表法),【例】52例慢性肝炎患者的HBsAg滴度数据表,试求其几何均数。,f为组段的频数,X为组段的组中值,n为总频数。,中位数,中位数(median,M),是在按大小顺序排列的变量的所有观察值中,位于正中间的一个或两个数值。,中位数的确定取决于它在数据序列中的位置,因此对极端值不敏感。,当数据呈偏态分布、或频数分布两端无确定数值,均宜采用中位数描述集中趋势。,中位数,n为奇数时,MX(n+1)/2n为偶数时,M(Xn/2+Xn/2+1)/2,1、直接法,【例】某药厂观察9只小鼠口服高山红景天醇提物(RSAE)后在乏氧条件下的生存时间(分钟)为:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。,【例】101名正常人血清肌红蛋白含量(g/ml)的频数分布表。试求其中位数。,M=X(101+1)/2=X51;根据累计频数,X51位于组段35,40)按公式,M=35+(0.510142)/235,2、频数表计算法,L、iM、fM分别为M所在组段的下限、组距和频数,n为总频数,fL为所在组段之前各组段的累计频数。,中位数,百分位数,百分位数(percentile),是一个位置指标,它将一组变量值排列后划分为若干相等部分的分割点数值。用Px表示,X用百分数表示。,表示在按照升序排列的数据中,其左侧(Px)的观察值个数在整个样本中所占百分比为X%,其右侧(Px)的观察值个数在整个样本中所占百分比为(100X)%。,L、i、fx分别为所在组段的下限、组距和频数,n为总频数,fL为所在组段之前各组段的累计频数。,【例】101名正常人血清肌红蛋白含量(g/ml)的频数分布表。试求其百分位数P25%、P50%、P75%。,百分位数,百分位数,百分位数不论资料分布类型均可计算,在实际工作中常用于确定医学参考值范围(.);在假设检验中用作拒绝或不拒绝检验假设的界值。,百分位数并非由全部观察值综合计算得来,因此,它不如均数和标准差精确;然而中间部分的百分位数因不受资料中个别极端数据的影响,具有较好的稳定性。,小结,第三节变异程度的统计指标,两人五天高血压甲162145178142186Mean=162.6乙164160163159166Mean=162.4,甲和乙均数差不多,是不是以为着他两情况差不多?,概述,两人五天高血压甲162145178142186Mean=162.6乙164160163159166Mean=162.4,波动大变异指标越大,观察值之间差异愈大,说明变异程度越大;反之亦然。,常用的有极差、四分位数间距、方差、标准差和变异系数。,概述,变异指标又称离散指标,用以描述一组计量资料各观察值之间参差不齐的程度。,变异指标越大,观察值之间差异愈大,说明变异程度越大;反之亦然。,常用的有极差、四分位数间距、方差、标准差和变异系数。,概述,极差,极差(range,R),等于一个变量所有观察值中最大值与最小值之间的差值。,RMaxMin,两人五天高血压甲162145178142186Mean=162.6乙164160163159166Mean=162.4,R甲=186-142=44R乙=166-159=7,极差,缺点:没有利用观察值的全部信息,不能反映其它数据的离散度;各样本含量大小悬殊时,不宜比较其极差;极差的抽样误差也较大,所以不够稳定,抽到很大值?,极差仅适用于对未知分布的小样本资料作粗略的分析。,四分位数间距,四分位数,是统计学对特殊的三个百分位数P25%、P50%和P75%的统称。,四分位数间距(quartilerange,Q),等于第三四分位数与第一四分位数之间的差值。,QP75%P25%,分割点1分割点2分割点3四分位值1(Q1)四分位值2(Q2)四分位值3(Q3),四分位数间距,【例】101名正常人血清肌红蛋白含量(g/ml)的频数分布表。试求其四分位数间距。,缺点:没有利用观察值的全部信息,不能反映其它数据的离散度;,四分位数间距仅用来描述大样本偏态资料的变异情况。,四分位数间距,方差,方差(variance),是描述一个变量的所有观察值与总体均数的平均离散程度的指标。,总体方差用2表示,样本方差用S2表示。,1、看每个观察值偏离判平均数的平均差距;2、正负抵消,取绝对值,再平均,3、干脆平方,便于数学处理;,方差,1、直接法:,2、频数表法,f为组段的频数,X为组段的组中值。,标准差,方差是平方后的单位,为了统计方便,将方差取平方根,还原成与原始观察值单位相同的变异量度:标准差(standarddeviation,S),是描述一个变量的所有观察值与均数的平均离散程度的指标。,总体标准差用表示,样本标准差用S表示。,标准差,1、直接法:,2、频数表法,f为组段的频数,X为组段的组中值。,C组的标准差最小,B组的最大。意味着C组数据的离散趋势最小,B组的最大。,A组B组C组,【例】A组:26,28,30,32,34;B组:24,27,30,33,36;C组:26,29,30,31,34。试用标准差说明三组数据的离散状况。,标准差,方差或标准差属同类变异指标,它们多用来描述均匀分布或近似正态分布的资料,大、小样本均可,其中以标准差的应用最广,通常与均数结合使用。比如在许多医学研究报告中常用的形式表达资料。,变异系数,变异系数(coefficientofvariation,CV),是一个度量相对离散程度的指标。,CV是无量纲的指标,可以用来比较几个量纲不同的指标变量之间的离散程度的差异,或比较量纲相同但均数相差悬殊的变量之间的离散程度的差异。,【例】根据体格检查,15名大学生的体重(kg)和身高(cm)的数据。体重:65,62,50,78,65,45,51,74,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度天津市护师类之儿科护理主管护师每日一练试卷A卷含答案
- 2025山东省财金投资集团有限公司招聘19人笔试参考题库附带答案详解
- 纳税评估工作总结(10篇)
- 2025年南方航空乘务招聘(西安站)笔试参考题库附带答案详解
- 2025年中铁特货物流股份有限公司招聘(75人)笔试参考题库附带答案详解
- 防性侵课件和教案
- 南宁市良庆区发展和改革局招聘考试真题2024
- 安庆市皖河控股有限公司招聘考试真题2024
- 共同养宠的食物福利研究试题及答案
- 七年级体育 耐久跑教学设计1 人教新课标版
- 2024-2025学年二年级语文下册统编版第三单元基础达标卷(单元测试)(含答案)
- DB37T 4834-2025高速公路集中养护工作指南
- 2025年土木工程业务能力试题及答案
- 城区建筑垃圾处理资源再利用设备采购 投标方案(技术方案)
- 2025年开封大学单招职业倾向性测试题库含答案
- 全国川教版信息技术八年级下册第二单元第2节《制作文创作品》教学设计设计
- DG-TG08-12-2024 普通中小学建设标准
- 实时数字孪生数据同步技术-深度研究
- Unit 4 History and traditions Project 说课稿 -2024-2025学年高中英语人教版(2019)必修第二册
- 《浅谈A企业消防安全管理中存在的问题及完善对策研究》6300字(论文)
- 秦汉考古Uooc课程答案
评论
0/150
提交评论