版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章集中趋势的
统计描述第一节频数分布第一节频数分布一、数值变量的频数分布1、频数:即变量值的个数2、频数表:同时列出观察指标的可能取值区间及其在各区间出现的频数。3、频数分布通常用频数分布表和频数分布图来表示。注意:了解频数分布是分析资料的第一步。(一)频数分布表(frequencytable)
当样本例数较多时,可通过整理资料来编制频数表,如下页所示:
例2-1测得130名健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876频数表的编制步骤:(1)求极差(range):即最大值与最小值之差,又称为全距。R=84–57=27(2)决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为10~15个组。组距=极差/组数,为方便计,组距为极差的十分之一,再略加调整。27/10=2.7≈3
(3)列出组段:第一组段的下限略小于最小值,最后一个组段必须包含最大值。56~59~……80~83~85(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。第一节频数分布N=∑f表2-1130名健康成年男子脉搏(次/分)的频数分布表第一节频数分布
(二)频数分布图第一节频数分布
(三)频数分布的特征从以上的频数分布图可以看出频数分布的两个最重要的特征:1、集中趋势2、离散趋势(四)频数分布的类型1、正态分布:在频数分布图上,表现为中间高,两边低,左右两侧对称并逐渐下降2、偏态分布:频数分布不对称,在频数分布图上表现为高峰偏向一侧。第一节频数分布注意:偏态分布可分为正偏态和负偏态正偏态:高峰偏左侧,即在观察值较小的一端集中了较多的频数负偏态:高峰偏右侧,即在观察值较大的一端集中了较多的频数注意:前者多见于传染病潜伏期的频数分布,后者较为少见。第一节频数分布五、频数表和频数分布图用途1.描述频数分布的类型(对称分布、偏态分布)
(1)对称分布:若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布是否为对称分布?是否为对称分布?(2)偏态分布:
1)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。
表2-2115名正常成年女子血清转氨酶(mmol/L)含量分布
左侧的组段数多于右侧的组段数,频数向左侧拖尾。
2)左偏态分布(负偏态分布):第一节频数分布表2-3101名正常人的血清肌红蛋白含量分布第一节频数分布2.描述频数分布的特征表2-1数据的频数分布特征:①数据变异(离散)范围在57~84(次/分)②数据集中(平均)的组段在68~74(次/分)之间,尤以组段的人数71~(次/分)最多。且上下组段的频数分布基本对称。3.便于发现一些特大或特小的可疑值
4.便于进一步做统计分析和处理第二节集中趋势的描述集中趋势的描述统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有:
算术均数(均数)(mean)几何均数(geometricmean)中位数(median)百分位数(percentile)
众数(mode)
第二节集中趋势的描述(一)算术均数
1、算术均数:简称均数(mean)可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。注意:总体均数用μ表示,样本均数用表示。2、计算方法(1)直接计算法
公式:举例:试计算4,4,4,6,6,8,8,8,10的均数?例2-1测得130名健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876(2)加权法(利用频数表):公式:k:频数表的组段数,f:频数,X:组中值。表2-2130名健康成年男子脉搏(次/分)频数分布表N=∑f∑fX∑fX2第二节集中趋势的描述
3、应用:算数均数适用于对称分布,特别是正态分布资料。第二节集中趋势的描述(二)几何均数(geometricmean)
1、意义:可用于描述各观察值之间呈倍数变化或反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。
2、计算方法几何均数(geometricmean)几何均数:变量对数值的算术均数的反对数。
其他对数(如自然对数)变换获得相同的几何均数例2-5有8份血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。平均抗体效价为:1:57(2)加权法公式:
例2-669例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。第二节集中趋势的描述
3、应用:
几何均数适用于成等比数列的资料,特别是服从对数正态分布资料第二节集中趋势的描述(三)
中位数
11个大鼠存活天数:
4,10,7,50,3,15,2,9,13,60,70平均存活天数?1、中位数(median)是将每个变量值从小到大排列,位置居于中间的那个变量值。第二节集中趋势的描述计算公式:
n为奇数时
n为偶数时
例2-39名中学生甲型肝炎的潜伏期分别为12,13,14,14,15,15,15,17,19天,求其中位数。第二节集中趋势的描述频数表资料的中位数下限值L上限值Ui;fm中位数M例2-1频数表中位数的计算N=∑f中位数=71+3x[(130x50%-59)/26]=71.69第二节集中趋势的描述中位数的应用:1、各种分布类型的资料2、特别适合大样本偏态分布资料或者一端或两端无确切数值的资料。
第二节集中趋势的描述(四)百分位数(percentile)1、百分位数是在一组数据中找到这样一个值,全部观察值的x%小于Px,而其余(100-x)%大于Px。注意:M实际上就是P50,所以百分位数的计算原理与中位数相同。2、计算公式:第二节集中趋势的描述3、百分位数的应用(1)百分位数可用于任何频数分布的资料;(2)可用来描述资料的观察值序列在某百分位置的水平。(3)多个百分位数结合使用可说明某一特定问题:如用P25和P75可描述资料的离散程度;用P2.5和P97.5规定医学95%的参考值范围等。第二节集中趋势的描述(五)众数(mode)是一组数据中出现次数最多的数值,也就是一组数据中占比例最多的那个数,用MO表示。1、众数的计算(1)简单而言,就是一组数据中出现次数最多的数值。例如:2,3,3,3,4,4,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司行政办公审批流程示意图1-1-1
- 《语法·单句分析》课件
- 2024年中考英语复习冲刺过关专题06 完形填空(原卷版)
- 《请给我结果》读书课件
- 塔吊专项施工方案4
- 2024年度品牌管理合同of餐饮连锁with加盟店管理和运营指导3篇
- 二零二四年度工程建设项目技术咨询合同3篇
- 开题报告:新质生产力背景下AI技术在教育改革中的应用
- 开题报告:新时代高职教育“适应性”评价研究
- 《货物运输实务》课件 2.3货运事故处理
- 靶向药物治疗与护理ppt课件
- 土工管袋脱水固化法在外沙湖底泥疏浚与处置工程中的应用
- 北宋铜钱监与版式的对应关系初探
- 振冲碎石桩软基处理施工工艺
- 化工厂防火防爆设计
- D级GPS控制网的布设与精度分析
- 商业发票INVOICE模板
- 需要紧急救治急危重伤病标准及诊疗规范
- 铝表面阳极氧化处理方法及缺陷分析
- 直线训练仪使用技术
- 气管切开的护理PPT
评论
0/150
提交评论