版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章,定量资料的统计描述,例4-1】2006年某市120名10岁男孩的身高(cm)资料如下。 135.4139.8144.0 147.3146.3142.5138.1143.6141.6152.6 132.1144.7143.6146.8144.2141.3137.5142.8140.6150.4 145.9140.2144.5148.2146.4142.4138.5148.9146.2155.4 134.2139.2143.5141.6143.5142.3148.9143.6141.5151.1 132.5138.7149.6146.9148.7141.5137.8142.7144.615
2、1.8 136.4140.0144.3147.5145.6142.5138.5143.7149.5153.6 130.2138.9143.7146.5138.8141.7136.9142.0140.5150.3 135.7145.7144.2147.8145.8142.6138.6143.8141.3153.9 133.4139.6143.7147.5144.8148.0137.4142.1140.8141.8 134.5139.4142.9147.5144.7141.8136.9143.5140.7151.4 145.6147.3143.9141.9151.6145.6148.9144.31
3、39.1145.8 145.6145.3147.6148.6145.5137.3146.5140.3148.4136.5,问题4-1】 该组数据为何种类型资料? 如何描述10岁男孩身高的数量特征,本章主要内容,频数表和频数图 集中趋势的描述 离散趋势的描述 正态分布及其应用,第一节 频数表和频数图,表达变量取值及其不同取值频数分布情况的统计表称为频数分布表,简称频数表(frequency table,频数表和频数图,频数表,频数表的编制,求极差(range) 找出一组观察值中的最大值与最小值,其差值即为极差(或全距),用R表示。 如例4-1中:R=155.4-130.2=25.2,频数表和频数
4、图,2. 确定组数和组距(i) 根据样本含量的大小及研究目的确定组数; 一般设815个组。 例4-1:i=25.2/10=2.52,取整数2做组距,频数表和频数图,3. 确定组段 即确定每一组的起点(下限)和终点(上限),起点称为下限(lower limit) 终点称为上限(upper limit,上限=下限+组距,频数表和频数图,4. 归组计数,整理成表 确定组段界限后,采用计算机或用划记法将 各原始数据归入各组汇总,得出各组段的观 察例数,也就是频数,频数表和频数图,表4-1 2006年某市120名10岁男孩身高(cm)的频数表,频数表和频数图,频数表的用途,揭示资料的频数分布特征和频数分
5、布类型 频数分布的特征: 集中趋势(central tendency) 离散趋势(dispersion) 频数分布的类型: 对称分布 偏态分布,频数表和频数图,频 数,频 数,频 数,图1 101名正常女子血清总胆固醇的频数分布,图2 69例RA患者血清EBV-VCA-IgG 抗体滴度的频数分布,图3 101名正常人血清肌红蛋白的频数分布,血清肌红蛋白(g/ml,正(右)偏态,负(左)偏态,对称分布,2.便于进一步计算指标和统计处理 可利用频数表计算百分位数、中位数、标准差等,频数表和频数图,3. 便于发现某些特大或特小的可疑值,频数图(graph of frequency)是以变量值为横坐标
6、、频数(频率)为纵坐标(不等距分组时以频率/组距=频率密度为纵坐标),以每个等宽的距形面积表示每组的频数(或频率,频数表和频数图,频数图,连续型定量资料:频数图中各距形是相连的,又称直方图(histogram); 离散型定量资料:频数图中各距形是间隔的,又称直条图(bar graph,频数表和频数图,图4-1 2006年某市120名10岁男孩身高的频数图,频数表和频数图,第二节 集中趋势的描述,定量资料集中趋势的描述,常用平均数(average) 表达一组同质定量数据的平均水平或集中位置,集中趋势的描述,算术均数 几何均数 中位数 众数 调和均数,又称均数(mean),是用一组观察值相加除以观
7、察值的个数所得。样本均数用 ,总体均数用,算术均数(arithmetic mean,集中趋势的描述,1. 计算方法 直接法:样本含量较少,加权法:相同观察值较多或频数表资料,集中趋势的描述,例4-2】 某医生测量了10名脑出血患者的血尿素氮(mmol/L)分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试计算该组数据的均数,集中趋势的描述,例4-3】根据表4-1资料,用加权法求120名10岁男孩身高的均数,表4-2 2006年某市120名10岁男孩身高(cm)的均数计算表,集中趋势的描述,2. 应用 均数适用于对称分布特别是正态分布资料,集中趋势的描述,
8、是n个观察值乘积的n次方根,又称倍数均数,用G表示,几何均数(geometric mean,集中趋势的描述,1. 计算方法 直接法:样本含量较少,加权法:相同观察值较多或频数表资料,集中趋势的描述,例4-4】 某实验室测得7人血清中某种抗体的滴度分别为1/4,1/8,1/16,1/32,1/64,1/128,1/256,试求平均滴度,集中趋势的描述,集中趋势的描述,例4-6】50名麻疹易感儿接种麻疹疫苗后,测得血凝 抑制抗体滴度资料见表4-3,求抗体的平均滴度,86.9977,表4-3 50名麻疹易感儿血凝抑制抗体滴度,集中趋势的描述,50名麻疹易感儿接种麻疹疫苗后血凝抑制抗体的平均滴度为1/
9、54,2. 应用及注意事项 几何均数适用 对数正态分布 等比级数资料 观察值中不能有0,实验设计的基本要素,中位数与百分位数,集中趋势的描述,例4-7】200名食物中毒患者潜伏期资料如表4-4, 研究人员据此采用加权法计算均数得平均潜伏期 为27小时。 (1)该组数据在分布上有何特点? (2)用均数描述该资料的平均水平是否合适,集中趋势的描述,表4-4 200名食物中毒患者的潜伏期,中位数(median):将一组观察值由小到大排序后,居于中间位置的数值即为中位数 ,用 表示,中位数是一种位置平均数,它将全部数据排列成的有序数列平均分为两部分,小于和大于中位数的观察值个数相等,各占50,集中趋势
10、的描述,1. 中位数的计算 (1)直接法:观察值个数较少,集中趋势的描述,例4-8】某实验师对10只小白鼠染毒后观察各小鼠的生存时间(分钟),得数据为:35,60,62,63,63,65,66,68,69,69,试计算小白鼠的平均生存时间,集中趋势的描述,2)频数表法 :频数表资料,LM 中位数所在组段下限,组距,中位数所在组段的频数,中位数所在组段前一组的累计频数,集中趋势的描述,求:下表200名食物中毒患者的平均潜伏期,集中趋势的描述,小时,百分位数(percentile):是指将一组观察值由小到大排序后,将其平均分成100等份,对应于每一分割位置上的数值就称为一个百分位数,用 表示,集中
11、趋势的描述,是一种位置指标,一个百分位数将一组观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大,集中趋势的描述,例4-10】根据表4-4,计算P25、P75,集中趋势的描述,2. 中位数与百分位数的应用 中 位 数: 偏态分布资料 一端或两端无确切值 总体分布不明 百分位数:非正态分布资料,集中趋势的描述,第三节 离散趋势的描述,例4-11】分别观察两组各9只动物的每日进食量(mg/g),结果如下: A组 24 25 26 27 28 29 30 31 32 B组 20 21 22 23 24 25 26 27 64 两组动物每日进食量的平均数,均为28mg/g,
12、离散趋势是频数分布的另一特征,反映了观察值之间的变异情况,只有将集中趋势与离散趋势结合起来描述才能全面反映定量资料的数量特征,描述离散 趋势指标,极差 四分位间距 标准差 变异系数,极差(range,R):亦称全距,是一组同质观察值中最大值( )与最小值( )之差,极 差,概念,只考虑最大值与最小值之差异,不能 反映组内其它观察值的变异度 样本含量越大,极差可能越大,极 差,不足之处,四分位数间距(inter-quartile range,Q):为上四分位数QU(即P75)与下四分位数QL (即P25)之差,四分位数间距,概念,例4-12】根据例4-7资料,计算四分位数间距。 小时 小时 四分
13、位数间距: (小时,每个观察值x与 间的变异称为离均差 由于 变异程度用离均差平方和反应,方 差,考虑观察值个数N的影响,在实际工作中,方 差,n-1称为自由度 ( degree of freedom,方差适用: 描述对称分布特别是正态分布资料的离散程度,方差的度量单位是原度量单位的平方 方差开方后即与原数据的度量单位相同,这就是标准差(standard deviation,标准差,在实际工作中,n-1称为自由度 ( degree of freedom,标准差适用: 描述对称分布特别是正态分布资料的离散程度,标准差,数学上可以证明,标准差,例4-13】 某医生测量了10名脑出血患者的血尿素氮(
14、mmol/L)分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试计算该组数据的标准差,标准差,例4-14】根据下表资料,计算120名10岁男孩身高的标准差,标准差,标准差,例4-15】某医院预防保健科,对一组5岁男孩进行体检,测量身高、体重等指标。得身高均数与标准差为115.8 cm和4.5 cm,体重均数与标准差为20.2kg和0.56 kg,得出结论:身高的变异程度比体重大,变异系数,上述结论是否正确,变异系数(coefficient of variation,简记为CV):是一组观察值的标准差与其均数的比值,概念,变异系数,度量衡单位不同的资料 单
15、位相同但均数相差悬殊的两组或多组资料,适用于,变异系数,根据例4-15资料分别计算身高与体重的变异系数。 身高,体重,描述数值变量资料集中趋势的指标,描述数值变量资料离散趋势的指标,第四节 正态分布及其应用,正态分布的概念与特征,图4-1 120名10岁男孩身高资料的频数图,正态分布的概念与特征,正态分布(normal distribution)称为高斯分布(Gauss distribution),如果连续型随机变量X的概率密度函数为,概念,正态分布的概念与特征,则称随机变量X服从参数为 和 的正态分布, 记作,x,正态曲线(normal curve)在横轴上方均数处最高;并以均数为中心,左右
16、对称;两端与横轴永不相交,呈钟形的曲线,正态分布特征,正态分布的概念与特征,正态曲线,正态分布有两个参数,即位置参数 和形状参数,正态分布的概念与特征,位置参数,形态参数,正态分布的概念与特征,正态分布的概念与特征,正态曲线下面积的分布有一定的规律,正态曲线与横轴之间的面积恒等于1或100%; 对称分布,对称轴两侧的面积各为50; 在 区间的面积为68.27 在 区间的面积为95.00 在 区间的面积为99.00,正态分布的概念与特征,思考:能否编制正态曲线下面积的分布表,然 后通过查表来确定某区间对应的面积呢,标准正态分布,统计学家发现,可以使所有的正态分布转化为统一的 的正态分布,该正态分
17、布称为标准正态分布(standard normal distribution,标准正态分布,这种变换称为标准化变换或Z变换。若X服从正态分布 ,则Z就服从,标准正态分布曲线下面积分布规律,例4-18】 已知某地2003年18岁男大学生身高的均数 cm,标准差 cm,且18岁男大学生的身高服从正态分布。问该地18岁男大学生中身高在166.8 cm及其以下者占多大的比例,标准正态分布,先将x转换为z,查附表3,表的左侧找-1.9,表的上方找0.06,相交处为0.025,例4-19】某地2003年抽样调查了100名18岁男大学生身高,算得均数为172.70cm,标准差为4.01cm,正态分布的应用,
18、估计正态分布资料的频数分布,问题】 该地18岁男大学生中身高在162.35cm183.05cm范 围内者所占的比例是多少,查附表3, 左侧的面积为0.005,由正态分布曲线的对称性可知, 右侧的面积也为0.005,又由正态分布曲线下的总面积为1,可得-2.58与2.58之间的面积为1-20.005=0.99=99,正态分布的应用,制定医学参考值范围,医学参考值范围:亦称正常值范围,指绝大多数“正常人”的解剖、生理、生化等指标的波动范围。 所谓“正常人”不是指绝对的“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群,正态分布的应用,制定医学参考值范围的注意事项 要确定一批样本含量足够大的“正常人” 根据研究目的和使用要求选定适当的百分界值 根据专业知识确定单侧或双侧界值 根据资料的分布选用恰当的计算方法,正态分布的应用,制定医学参考值范围常用方法,正态分布法:适用于正态或近似正态分布的资料,双侧界值,单侧界值,表4-6 常用z值表,例4-19】某地2003年抽样调查了100名18岁男大学生身高(cm),算得均数为172.70cm,标准差为4.01cm。 【例4-20】利用例4-19资料估计该地18岁男大学生身高的95参考值范围,身高服从正态分布,其参考值范围应为双侧,采用公式 计算,百分数取95,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度板梁运输与吊装项目管理与协调服务合同3篇
- 教育行业移民咨询服务合同
- 2024版房屋装修合同3篇
- 2024年经典室内设计装修合同
- 餐饮加盟店合同书范本
- 2025年度花卉研发与种植基地合作合同3篇
- 2024年销售代理合同详细信息
- 腕关节骨性结构力学特性研究-洞察分析
- 雾化吸入药物配方优化-洞察分析
- 2025年度网络设备维护与网络畅通保障合同3篇
- 2023年工装行业分析报告及未来五至十年行业发展报告
- 山东省青岛市2023-2024学年高一上学期1月期末物理试题 含解析
- 中国慢性腰背痛诊疗指南2024版解读
- 平山水利枢纽设计说明书
- 2024年国家开放大学电大桥梁工程技术形考任务一、二、三、四答案
- 2024年小区地下车位租赁合同
- 2024年陕西省中考语文试卷附答案
- 抖音火花合同电子版获取教程
- 2024年刑法知识考试题库附参考答案(典型题)
- 第5课《弘扬劳动精神劳模精神工匠精神》第1框《理解劳动精神劳模精神工匠精神》-【中职专用】《职业道德与法治》同步课堂课件
- 2024年湖南高速铁路职业技术学院单招职业技能测试题库及答案解析
评论
0/150
提交评论