数值变量资料统计描述课件_第1页
数值变量资料统计描述课件_第2页
数值变量资料统计描述课件_第3页
数值变量资料统计描述课件_第4页
数值变量资料统计描述课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数值变量资料的统计描述与计算器的运用实 习 目 的1.掌握数值变量资料描述性指标的计算 及其适用条件。2.熟悉95%医学参考值范围的计算。3.熟悉95%总体区间的计算复 习根据是否定量,资料被分作不同的类型定量变量资料 (measurement data) 用定量的方法对观察单位进行测量得到 的资料称作计量资料。定性变量资料 (enumeration data) 用定性的方法得到的资料,亦称计数资料等级资料(ranked data) 不能精确测量,仅能根据相对大小分为几 个等级。一个资料我们怎么去对它进行描述? 统计图表 统计指标1、判定分布类型2、制作频数表,频数分布图,确定分布特征3、再进

2、行集中趋势和离散趋势的描述频数表的编制步骤1. 求极差(range) 又称全距。 2. 决定组数、组段和组距 组数 根据研究目的和n确定; 组距 相邻两组段下限值之差,组距=极差/组数 为方便计,组距为极差的十分之一,再略加调整。3. 列出组段: 第一组段的下限必须包含最小值, 最后一个组段上限必须大于或等于最大值。4. 划记计数: 用划记法将所有数据归纳到各组段, 得到各组段的频数。R183.8163.520.31. 对称分布 : 若各组段的频数以中心位置左右两侧大体 对称,就认为该资料是对称分布一、描述频数分布的类型(对称分布、偏态分布)图2.1某大学男大学生身高分布2.偏态分布 1)正偏

3、峰分布(左偏态分布): 频数最多的组段在左侧,这种向左侧偏移 的分布称为正偏态分布。2)负偏峰分布(右偏态分布): 频数最多的组段在右侧,这种向右侧偏移的 分布称为负偏态分布。描述集中趋势的指标统计上使用平均数(average)这一指标体系来描述一组变量值的集中趋势或平均水平。常用的平均数有:算术均数/均数 - mean几何均数 - geometric mean中位数 - median百分位数 - percentile 一、算术均数计算方法1.直接计算法 公式 :例8.2 有9名健康成人的空腹胆固醇测定值(mol/L)为:5.61,3.96,3.67,4.99,4.24,5.06,5.20,4

4、.79,5.93 求算术平均数。 X=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9 =4.83(mol/L)特别适用于对称分布资料2.加权法(利用频数表)公式 :K :频数表的组段数 f :频数 :组中值,其中i=1,2,k。几何均数计算公式:几何均数:变量对数值的算术均数的反对数。 计算几何均数的观察值应大于零 三、中位数与百分位数1.中位数(median) 用符号M表示,中位数是把一组观察值, 按大小顺序排列,位置居中的数值(n为奇数) 或位置居中的两个数值的均值(n为偶数)其适用情况有: 当资料呈明显的偏态分布; 资料一端或两端无确定数值,如大于

5、或小于某数值; 资料的分布情况不清楚。 频数表资料的中位数 百分位数示意图3.百分位数(percentile) 把一组数据从小到大排列,分成100等份各等份含1%的观察值分割界限上的数值就是百分位数 中位数是第50百分位数,用P50表示频数表法计算百分位数公式: 当 时,公式 (8.5)即为中位数的计算公式: 例8.1 试分别求例8.1频数表的第25、第75百分位数。P254.20+0.20 x(132x25%14)/234.365P754.80+0.20 x(132x75%86)/204.930血糖(mol/L)组段组中值(xi)频数(f)累计频数(f)频率(%)累计频率(%)3.603.7

6、0 3 32.27 2.27 3.803.90 3 6 2.27 4.55 4.004.10 8 14 6.06 10.61 4.204.30 23 37 17.42 28.03 4.404.50 24 61 18.18 46.21 4.604.70 25 86 18.94 65.15 4.804.90 20 106 15.15 80.30 5.005.10 12 118 9.09 89.39 5.205.30 10 128 7.58 96.97 5.405.605.50 4 132 3.03 100.00 合计132(fi) 100.00 P50=4.60+0.2(13250%-61)/24

7、=4.64常用统计指标:全距(range)四分位数间距(quartile interval)方差和标准差(variance&standard deviation)变异系数(CV coefficient of variation)第三节 离散趋势的描述二、四分位数间距四分位数间距,用Q表示,若将一组 资料分为四等份,上四分位数和 下四分位数之差就是: Q=下四分位数:上四分位数:比全距稳定;可用于一端或两端无确切数值的偏态资料。未考虑每一个观察值。 1. 方差(variance)总体方差样本方差自由度三、方差与标准差 标准差的公式还可以写成 :利用频数表计算标准差的公式为:四、变异系数变异系数(

8、coefficient of variation,CV) 常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。 例:某地7岁男孩身高的均数为123.10 cm,标准差为4.71cm;体重均数为22.29kg,标准差为2.26kg, 比较其变异度? 五、标准误的计算标准误表示的是样本均数的变异程度的大小。用于信区间估计参考值范围(reference ranges)医学参考值是指正常人的各种生理、生化数据,组织或排泄物中各种成分的含量。正常人测定值的波动范围,称为参考值范围。参考值范围在诊断方面可用于划分正常或异常。第五节 医学参考值范围1、正态分布法2、百分位数法计算医学参考值范

9、围的常用方法公式(正态分布):双侧参考值范围:单侧参考值范围: (下限值) 或 (上限值)其中X为均数,S为标准差,u值可由附表1查。计 算 器 的 使 用一 般 特 点常用函数运算功能键数字、四则运算和统计运算功能键第二功能键:INV 或 SHIFT 运算模式选择键:MODE常规运算MODE 小数点:普通初等运算清除键 INV AC(KAC):All Clear 总清除键 C :Correct 改正键 log / 10 x :常用对数/反常用对数 ln / ex :自然对数/反自然对数 xy / x1/y :乘方/开方 / ( :开平方根/开括号 1/x / x2 :倒数/平方 ) / x!

10、 :闭括号/阶乘 M+ /MR : 累加贮存/取出贮存 常规运算练习=143.1=104.17=5.67常规运算练习(二)(4) log2=0.3(5) =6.48(6) 求10名7岁男童体重(kg)之和 17.3 18.0 19.4 20.6 21.2 21.8 22.5 23.3 24.0 25.5 5+6+7+9*2+13*3+14*2=1035 M+ 6 7 9*2 13*3 14*2 M+M+M+M+ M+MR清除贮存内容0shiftMR可用于fxM+统计功能常用符号 :均数 :样本标准差 shift :总体标准差 n : 输入变量值的个数 : 输入变量值的总和 Kout :输入变量值的平方和 DATA/DEL :变量的输入/清除当前输入的错值 操作步骤MODE 3 :屏幕显示SD shift AC (即 KAC ) :清除残存数据屏幕上只有显示 SD D17.3 DATA 18.0 DATA :输入数据 Kout 3 表示 nShift 1 均数Shift 3 SKout 1 Kout 2 x练习:计算练习(6)的例数、均数、标准差、 变量值的总和、变量值的平方和。 17.3 18.0 19.4 20.6 21.2 21.8 22.5 23.3 24.0 25.5组段频数频率累计频数累计频率0-88.5188.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论