《医学统计学》课件02章 计量资料的统计描述_第1页
《医学统计学》课件02章 计量资料的统计描述_第2页
《医学统计学》课件02章 计量资料的统计描述_第3页
《医学统计学》课件02章 计量资料的统计描述_第4页
《医学统计学》课件02章 计量资料的统计描述_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计量资料的统计描述2022/7/28计量资料的统计描述2主要内容:频数表集中趋势离散趋势正态分布医学参考值范围2022/7/28计量资料的统计描述3第一节 频数分布频数表的绘制、直方图频数分布的特点频数分布的类型频数分布的用途2022/7/28计量资料的统计描述4 频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。 频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。2022/7/28计量资料的统计描述5 频数表编制计算极差(全距):极差(R)=最大值-最小值确定组数、组距:组距=R/组数, 医学上组数一般在8-15组确定组限:组限下限

2、上限)计算组中值划记记数2022/7/28计量资料的统计描述62022/7/28计量资料的统计描述72022/7/28计量资料的统计描述8直方图(Histogram) 直观、形象地表示频数分布的形态和特征。2022/7/28计量资料的统计描述9频数分布的两个特征:集中趋势 集中位置的描述,即大多数数值落在什么位置,是现象共性的反映,是现象规律性的数量上的表现。离散趋势 离散趋势是描述一组数据的变异程度或偏离集中位置的程度(参差不齐的程度)2022/7/28计量资料的统计描述10频数分布的类型:对称分布(正态分布、t分布)与偏态分布(集中位置偏向左的一侧叫正偏态,反之叫负偏态)2022/7/28

3、计量资料的统计描述11频数表的主要用途:揭示分布类型发现可疑值方便进一步统计计算(计算集中趋势指标与离散趋势指标)2022/7/28计量资料的统计描述12第二节 集中趋势我们用平均数(average)来描述集中趋势,平均数是描述一组观察值集中位置或平均水平的统计指标2022/7/28计量资料的统计描述13平均数算术均数几何均数中位数2022/7/28计量资料的统计描述14(一)算术均数(arithmetic mean) 算术均数:简称均数,用于说明一组观察值集中位置或平均水平,是描述计量资料的一种最常用的方法。总体均数用表示,样本均数用 表示。适用资料:对称分布,尤其是正态分布2022/7/2

4、8计量资料的统计描述15算术均数的计算方法:直接法加权法2022/7/28计量资料的统计描述161.直接法 当样本中变量值个数不多时,将变量值相加再除以变量值个数(样本含量),即得均数。 2022/7/28计量资料的统计描述17举例:计算5个同学的平均成绩,93,92,95,94,912022/7/28计量资料的统计描述182.加权法(weighting method): 根据频数表计算均数的一种方法。当变量值个数较多时,可先将原始数据列成频数表,然后再做计算。其中X1、X2Xn分别为各组段的组中值,即本组段的上限与下限之和除以2 2022/7/28计量资料的统计描述19举例:身高频数f累积频

5、数组中值X140111451501516155160203616517011471751801903501852022/7/28计量资料的统计描述20举例:测得10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度用算术均数来计算 :2022/7/28计量资料的统计描述21(二)几何均数(geometric mean, G) 医学研究中有一类比较特殊的资料,如抗体滴度等变量值呈倍数变化的数据,宜用几何均数描述其平均水平。适用资料:对数正态分布,原始数据偏态分布,经对数变换后成正态分布的资料。等比资料,即呈倍数变化的数据。例如抗体滴度。2022/7/28计量资料的统

6、计描述22几何均数的计算方法:直接法加权法2022/7/28计量资料的统计描述231.直接法:写成对数形式 :2022/7/28计量资料的统计描述24举例:如上例:2022/7/28计量资料的统计描述252.加权法:2022/7/28计量资料的统计描述26举例:IgG滴度倒数例数40380221601732096400128012022/7/28计量资料的统计描述27(三)中位数(median, M) 把一组数值按大小顺序排列,位于中间位置上数的值即为中位数。适用资料:任何分布,尤其偏态分布 分布类型不祥 末端无具体值 2022/7/28计量资料的统计描述281.直接法:n 为奇数时,举例:2

7、,4,5,6,7的中位数为5 n 为偶数时,举例:2,4,5,6,7,8的中位数为5.52022/7/28计量资料的统计描述292.频数表法: 其中L、i、f分别为M所在组段的下限、组距和频数, 为M所在组段之前各组段的累积频数。举例:以上面数据为例2022/7/28计量资料的统计描述30表2-4 某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂频数 累积频数累积频率(%) 0.10 27 27 4.30.40169196 31.10.70167363 57.6 M1.00 94457 72.51.30 81538 85.41.60 42580 92.11.90 28608 96.5

8、2.20 14622 98.72.50 4626 99.42.80 3629 99.83.10 1630100.0 合计630 - -2022/7/28计量资料的统计描述31L、iM、fM分别为M所在组段的下限、组距和频数, fL为M所在组段之前各组段的累积频数。2022/7/28计量资料的统计描述32百分位数(percentile)PX将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是百分位的特殊形式。适用:用于任何分布的资料2022/7/28计量资料的统计描述33计算 L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累

9、积频数。计算上例的百分位数P25 、 P75 、 P90。2022/7/28计量资料的统计描述34平均数应用条件:算术均数可以用于对称分布,尤其时正态资料的平均水平的描述几何均数可以用于呈倍数变化的数据;对数正态分布资料中位数应用于任何分布类型的资料2022/7/28计量资料的统计描述35第三节 离散趋势描述离散趋势的指标:极差(全距)四分位间距方差、标准差变异系数2022/7/28计量资料的统计描述36盘编号甲乙丙14404804902460490495350050050045405105055560520510合计250025002500均数500500500 例:设甲、乙、丙三人,采每人

10、的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)甲乙丙2022/7/28计量资料的统计描述37一、极差(全距,R)优点:简便缺点:1. 只利用了两个 极端值 2. n大,R也会大 3. 不稳定12040202022/7/28计量资料的统计描述38二、四分位间距(Q)把数据按顺序排列,取中间50%的观察值的数据范围即为四分位间距Q=P75-P25四分位间距大,说明数据变异越大,反之,说明数据变异程度小。四分位间距较极差稳定,但仍没应用的每一个具体观察值。2022/7/28计量资料的统计描述39三、方差、标准差表示:总体方差2 ,总体标准差 样本方差S 2 ,样本标准差S意义:

11、全面反映了一组观察值的变异程度.(越大说明围绕均数越离散,反之说明较集中在均数周围,均数的代表性越好)2022/7/28计量资料的统计描述40计算:样本方差样本标准差2022/7/28计量资料的统计描述41四、变异系数(CV)适用于均数相差较大或单位不同的几组数据的变异程度的比较特点:消除了单位的影响2022/7/28计量资料的统计描述42各指标适用资料类型*极差:任何分布,但少用四分位间距:任何分布,尤其偏态;末端无具体值方差、标准差:对称分布,尤其正态分布变异系数:单位不同;均数相差较大2022/7/28计量资料的统计描述43第四节 正态分布及应用2022/7/28计量资料的统计描述44正

12、态分布的通俗概念: 如果把数值变量资料编制频数表后绘制频数分布图(又称直方图,它用矩形面积表示数值变量资料的频数分布,每条直条的宽表示组距,直条的面积表示频数(或频率)大小,直条与直条之间不留空隙。),若频数分布呈现中间为最多,左右两侧基本对称,越靠近中间频数越多,离中间越远,频数越少,形成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那我们一般认为该数值变量服从或近似服从数学上的正态分布。一、概念2022/7/28计量资料的统计描述452022/7/28计量资料的统计描述46二、特征 以均数为中心对称,均数处最高;2个参数 N( ,),是位置参数,是变异参数正态曲线下面积:1.96范围内

13、的面积是95%,2.58范围内的面积是99% 2022/7/28计量资料的统计描述47正态分布曲线由两个参数决定,即总体均数和总体标准差。在不变的情况下,函数曲线形状不变,若变大时,曲线位置向右移;若变小时,曲线位置向左移,故称为位置参数。在不变的情况下,函数曲线位置不变,若变大时,曲线形状变的越来越“胖”和“矮”;若变小时,曲线形状变的越来越“瘦”和“高”,故称为形态参数或变异度参数。N(,12)、N(,22)、N(,32) N(1 ,2)、N(2 ,2) 2022/7/28计量资料的统计描述482022/7/28计量资料的统计描述49三、标准正态分布标准正态分布是均数为0,标准差为1的正态

14、分布,对于任何参数和的正态分布,都可以通过一个简单变量变换化成标准正态分布,即 2022/7/28计量资料的统计描述50标准正态分布标准正态分布曲线下对称于0的区间,面积相等,各占50%,即左右各为0.5。标准正态分布曲线的纵坐标与面积关系图u值查表所对应的面积是区间(-,u)所对应的面积,即(u)。若u=-1.96,那么(-1.96)则表示从移到1.96所对应区域的面积,通过查标准正态分布曲线面积分布表得到(-1.96)=0.025。 2022/7/28计量资料的统计描述51四、正态分布的应用见书22页例题3-22022/7/28计量资料的统计描述52第五节 医学参考值范围一、概念医学参考值

15、范围(reference value range)又称正常值范围(normal range),是指正常人的解剖、生理、生化、免疫等各种数据的波动范围。习惯上是确定包括95%的人的界值2022/7/28计量资料的统计描述53二、医学参考值范围的测定方法1.选择足够数量的正常人作为参照样本 一般至少在120例以上2.对选定的正常人进行准确的测定3.决定取单侧范围还是双侧范围值 单侧下限-过低异常 单侧上限-过高异常 双侧-过高、过低均异常 单侧下限异常正常单侧上限异常正常异常正常双侧下限双侧上限异常2022/7/28计量资料的统计描述544.选择适当的百分范围若主要目的在于减少假阳性(确诊病人),

16、参考值范围要取大一些,若目的是减少假阴性(初筛病人)参考值范围要减小一些。正常人病人假阳性率假阴性率2022/7/28计量资料的统计描述55二、医学参考值范围的测定方法5.估计参考值范围的界限 两种方法的比较: 2022/7/28计量资料的统计描述56参考值范围所对应的百分位数参考值范围所对应的正态分布区间2022/7/28计量资料的统计描述57 例3.3 若已算得某地正常成年男子红细胞数的均数为4.781012/L,标准差为0.381012/L,试估计该地成年男子红细胞数的95%参考值范围。 例3.5 见第二章表2-4资料。为该地区50岁60岁女性高血脂诊断与治疗提供参考依据,试估计血清甘油

17、三脂含量的95%单侧参考值范围。 下限:上限:即95%单侧参考值范围为小于2.098mmol/L。2022/7/28计量资料的统计描述581.列频数表时,分组数目一般为( )A、5-10组 B、8-15组 C、10-30组 D、15-20组 E、组数20组B2022/7/28计量资料的统计描述592.表示变量值变异情况的指标常用的指标是( )A、全距 B、标准差 C、方差 D、变异系数 E、以上均是E2022/7/28计量资料的统计描述603.各观察值加同一数后( )A.均数不变,标准差改变 B.均数改变,标准差不变C.二者均不变 D.均改变B2022/7/28计量资料的统计描述614.用均数

18、和标准差可全面描述( )A.正偏态资料 B.负偏态资料 C.正态分布和近似正态分布 D.任何分布C2022/7/28计量资料的统计描述625.一组变量值10,12,9,7,11,100,其平均数是( ) A.9 B.7 C.10.5 D.11 E.16C2022/7/28计量资料的统计描述636.在正态分布条件下表示变量值变异情况的指标最常用的是( )A.标准差 B.标准误 C.变异系数 D.全距 E.百分位数A2022/7/28计量资料的统计描述647.表示血清抗体滴度资料平均水平最常用的指标是( )A. 算术均数 B. 中位数 C. 几何均数 D. 变异系数 C2022/7/28计量资料的

19、统计描述658.某单位普查得男职工的红细胞数的均数为5.0361012/L,标准差为0.4991012/L。其中,标准差反映的是( )A.个体变异 B.抽样误差 C.总体均数不同D.抽样误差和总体均数不同 E.抽样误差或总体均数不同A2022/7/28计量资料的统计描述669.描述变量值集中趋势常用的指标是 ( )A.算术均数 B.几何均数 C.中位数 D.四分位间距 E.A、B、C 均是E2022/7/28计量资料的统计描述6710.比较身高和体重两组数据变异程度大小宜采用( ) A. 方差 B.标准差 C.变异系数 D.四分位间距C2022/7/28计量资料的统计描述6811.某组资料共5例, , ,则均数和标准差分别是( )A.6、1.29B.6.33、2.5C.38、6.78D.6、1.58D2022/7/28计量资料的统计描述6912.正常成年男子的血铅含量系偏态分布资料,对数变换后的成正态分布。欲描述血铅的平均水平,宜用( )A.原始数据的算术均数B.原始数据的几何均数C.原始数据的中位数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论