医学统计学第二章_第1页
医学统计学第二章_第2页
医学统计学第二章_第3页
医学统计学第二章_第4页
医学统计学第二章_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2011年某市120名7岁男孩身高数据如下,试图编制频率表。2011年,一个城市的120名7岁男孩被列为身高(厘米)数据,试图编制一个频率表。频率表的编制方法如下:(1)找出观测值中的最大值和最小值,并找出范围;(2)确定分段、分段和间隔的数量;根据充分反映数据分布特征的原则,确定分段数;组间隔=26.6/10=2.66;组的数量可以通过参考斯特格斯提出的经验公式来确定;(3)列表表示法:计算每一段中包含的观察单元的数量,2.1.2频率分布图图2.12011某地区120名7岁男生身高的频率分布图,2.1.3。频率分布分析频率表的分析主要在于以下几个方面:(1)可疑值的有无通过对频率分布的分析,发现一些异常值和可疑值的大小异常值(2)分布类型的频率分布可分为两种类型:对称分布和偏斜分布。不同类型的分布应采用不同的统计分析方法,对称分布是指观察值集中在中心部分,以中间数据为主。例如,身高、体重、脉搏、血红蛋白等的分布。对正常人来说,对称分布,所谓的偏斜分布是指观察值从数字轴的中心尾部向正侧(或右侧)的偏离,称为正常偏斜状态(或右偏斜状态);例如,食物中毒引起的腹泻潜伏期尾偏向数轴的负侧(或左侧),称为负偏度(或左偏度)。例如,慢性病患者的年龄分布、(3)两个重要特征的分布特征分布:集中趋势和离散趋势。整个群体中的个体总是具有同质性,这使得观察值趋向于相同的值(即集中趋势)。同一群体中的个体之间也存在各种差异,这使得个体观察值不完全相同。集中趋势的描述性平均值反映了一组观察值的集中趋势、中心位置或平均水平。它是一组数据的代表,能给出一组相似事物或现象的数量特征的一般描述,是统计学中应用最广泛、最重要的指标体系。常用的平均值包括(算术)平均值、几何平均值和中位数,2.2.1平均值是算术平均值的简称,希腊字母通常用来表示总体平均值。样本的平均数量用。平均数反映了一组观测值在数量上的平均水平,最适合描述单峰对称分布数据的平均水平。1)未分组数据(原始数据)平均数的计算方法:所有观测值直接相加,除以总观测数n,示例2.3为了找到表2.1中的平均数据量,2.2.2几何平均数一些医学数据的频率分布,如抗体滴度、细菌计数等。显示出明显的偏度,观测值之间存在多重变化(等比关系),算术平均数显示出此类数据集中趋势的代表性较差。几何平均数应该用来反映平均增加(减少)倍数。几何平均数一般用g表示,适用于变量值为多元关系的数据,但数变换后的指数为单峰对称分布。5人血清抗体滴度分别为1:10、1:20、1:40、1:40和1:160,并计算平均滴度。表2.2第(1)(2)栏列出了接种疫苗后某个地方107人的抗体滴度,并计算了平均滴度。表2.2107受试者免疫后高抗体滴度和麻疹平均滴度的计算,注意,在计算几何平均值时,变量值不能为0,因为0和任意数的乘积为0,0不能取对数。对于同一组变量值,正值和负值不能同时存在。如果变量值都为负,计算时可以去掉负号,负号会加在计算结果之后。中位数和百分位数数据以一种偏斜的方式分布。数据中的一些数据太大(或太小)。分布不规则。当一端或两端有不确定数据(开放数据)时,中值比算术平均值更合理。中位数(缩写为m)是按从小到大的顺序排列一组观察值。中间等级的观察值是中间值。百分位数是一个位置指示器,表示百分位数将整个人群或样本的整个观察值分成两部分。理论上,x%的观察值小于(100-x)%的观察值大于,中位数和百分位数的计算(1)未分组数据的中位数计算方法是设置N个观测值X1,X2,Xn由小到大排列,则9名沙门氏菌食物中毒患者的潜伏期(小时)分别为:2、5、9、12、14、15、18、24、60。找到中间值。8例治愈细菌性痢疾患者的住院天数如下,计算中位数。4,9,10,12,14,20,24,61,(2)分组数据的中位数和百分位数计算公式如下:2.3离散度描述例2.9三组相同性别和年龄的儿童的体重(公斤)如下,尝试分析他们的集中趋势和离散度。组A 2628 3032 34B 2427 0333 36C 2629 0334,三组的平均数是相同的,但五组数据之间的不均衡程度明显不同。只有把两者结合起来,我们才能充分理解事物。描述离差程度的指标包括范围、四分位间距、方差、标准差和变异系数。2.3.1。范围(R)也称为全范围。即一组数据中最大值和最小值之间的差值。反映个人变化的范围。范围大,表明变异程度大。相反,它显示了小变化的优点:简单的计算和明确的含义。缺点:除了最大值和最小值,它不能反映组内其他数据的变化程度。当样本数量太大时,应该不会很差。采样误差很大,非常不稳定。嘿。2.3.2四分位数,表示为Q,是一个特定的百分比,即P25(下四分位数)和P75(上四分位数)四分位数之间的范围是上四分位数和下四分位数之间的差值,q=QU-QL。四分位范围可视为观察值的中间一半的范围,使用四分位范围来反映变化程度的大小有稳定比值范围的优点和缺点:但是,仍然没有考虑所有观测值的变化程度。适用场合:如果集中趋势用中位数描述,相应的离散趋势用四分位间距描述。2.3.3方差和标准偏差每个变量值X与总体平均值之间的差,即偏离平均值:的偏差,称为偏离平均值平方和:的偏差,与平均值平方和的偏差相加得到 (x-) 2,称为偏离平均值平方和的偏差,它不仅与变化程度有关,还与变量值的个数n有关。人口差异:方差的度量单位是原始变量值的度量单位的平方。群体标准差:的方差标准差越大,个体的变异程度越大。另一方面,个体可变性越小,样本标准偏差s:实际上由以下公式计算:分组数据由以下公式计算:2.3.4。为什么要在相对分散中引入相对分散?常用的相对离差指数有:极差与中位数之比;四分位间距(quql)与(QU QL)之比;然而,系数变异是最常用的。变异系数(分散系数):主要用于:测量单位中不同数据集之间的比较,以及具有显著不同平均值的数据集之间的比较。注意:2.4分类数据的比率和比率是相对数字。2.4.1比率(relative ratio),也称为相对比率,是两个相关指标A和B的比率,表示A是B的几倍或几个百分点。比率=A/B例如,新生儿(整个人口)的性别比率成分比率表示一个事物中各成分的比例或分布,通常用百分比表示。计算公式是:例如,班女生的比例,不及格的比例,死亡原因的构成比,以及2.4.3的比率,例如,流感的发生是季节性的。南部非洲是艾滋病受灾最严重的地区,这表明这一现象发生的强度不同,表明这一现象发生的频率或强度不同。通常用百分比(%)、千分率(%)、万分率(10/10,000)、100,000分率(1/100,000)等表示。计算公式为:比例基数的选择:至少二进制整数医学中某些频率指标的定义不符合率的定义。2.4.4。应用相对对数时应注意的问题计算相对对数的分母不应过小原则:在频率稳定的实际应用中,如果观测例数小于20,则不应计算相对对数。发病率的大小对抽样研究中样本的大小具有指导意义。精心设计的程度,实验条件的严格控制,以及对研究对象案例数量的不同要求。2.成分比(相对于对数的强度)不能用来代替分析中的成分比(相对于对数的强度)。它只能表示一个事物各组成部分的比例,而不能表示某一现象发生的频率或强度。3.当每组中观察单元的数量不同时,不可能直接将每组的比率相加以获得平均值并成为总比率。4.进行比较时,应注意数据的可比性。除了研究因素,其他重要的影响因素应该相同或相似。观察对象应当相同,时间应当相似,研究方法应当相同,地区、民族等客观条件应当一致。其他影响因素在各组的内部组成上应该是相似的。2.4.5标准化方法(1)在比较两种事物的总比率时,如果这两种相似事物的内部构成,特别是能够影响指标水平的一个重要特征,在构成上有所不同,它往往会导致总比率的增加或减少。在这种情况下,轻率地比较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论