第8章 计量资料的统计描述_第1页
第8章 计量资料的统计描述_第2页
第8章 计量资料的统计描述_第3页
第8章 计量资料的统计描述_第4页
第8章 计量资料的统计描述_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章计量资料的统计描述学习目标1.掌握平均指标的意义、种类、应用及其计算方法2.熟悉变异指标的意义、种类及标准差的计算与应用3.了解正态分布的概念,熟悉正态分布的特征4.掌握正态曲线下的面积分布规律及其应用第1节平均指标平均指标又称平均数(average),是描述计量资料的常用指标,用以表示一组同质变量值的集中趋势或平均水平。常用的平均数算术均数几何均数中位数

一、算术均数1.定义:将各观察值相加后除以观察值个数所得的商即为算术均数。符号

:总体均数用希腊字母“”表示

样本均数用“”表示2.应用条件变量值呈正态分布或对称分布的计量资料。正态分布或对称分布的计量资料

⑴正常人某些生理、生化指标值的频数分布(身高、红细胞数、血糖浓度等);⑵实验室内对同一样品多次重复测定结果的频数分布;⑶从正态或近似正态总体中抽取的样本均数的频数分布等。3.计算方法⑴直接法:变量值个数不多

公式为例8-1

测定了5名健康人第一小时末红细胞沉降率,分别是6、3、2、9、10mm,求均数。=6(mm)=

⑵加权法:n≥100公式为=例8-2

某年某市120名12岁健康男孩身高(cm)资料如下表,求其平均数。142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9①132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9②154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9计算步骤⑴编制频数分布表1)求全距(极差)R=最大值-最小值2)划分组段①确定组段数:8~15组②确定组距:组距i

=全距/组段数

③划分组段3)列表归组组段划记频数f(1)(2)(3)125~一1129~止4133~正止9137~正正正正正下28141~正正正正正正正35145~正正正正正丁27149~正正一11153~止4157~161—1合计

=120120名12岁男孩身高(cm)资料的频数分布⑵用加权法计算均数

=

组段组中值x频数ffx(1)(2)(3)(4)=(2)×(3)125~1271127129~1314524133139283892141~143355005145~147273969149~151111661153~1554620157~1611591159合计---=120=17172

120名12岁健康男孩身高(cm)均数的加权法计算==143.10(cm)二、几何均数(几何平均数)1.定义将n个变量值的乘积开n次方所得的根即为几何均数。符号用G表示

2.应用条件⑴变量值的对数值呈正态分布或近似正态分布资料,如正常人体内某些微量元素的含量;⑵变量值呈等比数列的资料,如抗体的滴度、药物的效价、卫生事业发展速度等;⑶变量值呈倍数关系的资料,如细菌计数、人口的几何增长等。3.计算方法⑴直接法变量值个数不多公式为G=

例8-35人的血清滴度分别为1:2、1:4、1:8、1:16、1:32,求平均滴度。故平均滴度为1:8。⑵加权法:变量值个数较多或变量值为频数表资料

例8-4某年某市100名儿童接种某种疫苗后,测定抗体滴度的资料如第(1)、(2)列所示,求该疫苗的抗体平均滴度。抗体滴度人数

滴度倒数

(1)(2)(3)(4)(5)=(2)×(4)1:2220.30100.60201:41140.60216.62311:81880.903116.25581:1636161.204143.34761:3222321.505133.11221:648641.806214.44961:12831282.10726.3216合计=120------=7119抗体平均滴度的加权法计算

G=()

=(1.2071)=16.11

这100名儿童的抗体平均滴度为1:16.11。三、中位数和百分位数(一)中位数1.定义将一组变量值按大小顺序排列,位次居中的变量值即为中位数。符号用M表示2.应用条件

⑴偏态分布资料,包括正偏态和负偏态分布的资料,如正常人必需微量元素含量分布、儿童少年视力分布等;⑵一端或两端无界(无确定数值)的资料,即所谓开口资料,如传染病平均潜伏期等;⑶频数分布类型不明的资料,如确定不了资料的分布类型,用中位数描述集中趋势比较稳妥。3.计算方法⑴直接法当变量值个数为奇数时计算公式为

M=

当变量值个数为偶数时计算公式为

M=

例8-5某地11例某传染病患者,其潜伏期(天)分别为2,2,4,3,5,6,3,8,9,11,15,求其平均潜伏期。n=11,为奇数M====5(天)

即有序数列中,第6位上的变量值为5,故其平均潜伏期为5天。例8-6如上例资料在第21天又发生1例该传染病患者,其平均潜伏期又为多少?先将变量值按从小到大的顺序排列:2,2,3,3,4,5,6,8,9,11,15,21。n=12,为偶数

M=

=

=

=5.5(天)即有序数列中,第6位和第7位所对应的变量值5和6的均数为5.5,故其平均潜伏期为5.5天。⑵频数表法计算步骤①先编制频数表;②按所分组段数,由小到大计算累计频数,编成中位数计算表;③确定中位数所在的组段;④代入公式计算中位数.计算公式

M=L+

例8-7

238名正常人发汞值的频数分布如表下第(1)、(2)列,求中位数。发汞值频数累计频数

(1)(2)(3)0.3~20200.7~66861.1~601461.5~481.9~182.3~162.7~63.1~13.5~03.9~4.33合计238238名正常人发汞值(μg/g)的中位数计算可确定中位数所在组段是1.1~,故L=1.1,i=0.4,m=60,n=238,=86。代入公式,得

M

(μg/g)即该地238名正常人发汞值的中位数为1.32μg/g。

(二)百分位数1.定义指将n个观察值从小到大依次排列,再把它分成100等份,对应于%位的数值即为第百分位数。2.计算方法

例8-1资料为例,求第25百分位数,则在先要找到第25百分位数所在组,P25

在“0.7~”组段,L=0.7,

=0.4,=66,

=20,则将这些数据代入公式得第2节变异指标极差方差标准差例8-8甲组2628

30

3234乙组2427303336丙组2629303134

三组均数都为30㎏,但这三组数据的分布特征却不尽相同。一、极差(又称全距)

是一组变量值中最大值与最小值之差,反映一组变量值的变异范围。以符号R表示R=max-minR甲=34-26=8(㎏)R乙=36-24=12(㎏)R丙=34-26=8(㎏)优点:简单缺点:①只用到最大、最小值,样本信息没能充分利用②当资料呈明显偏态时,最大、最小值不稳③样本例数越多,R可能越大,2组观察值例数悬殊时不用R比较二、方差=样本方差:=总体方差:为了得到总体方差的较好估计值,将样本方差分母中变量值个数n减去1,则

=

自由度:n-1计算甲、乙、丙三组数据的方差分别为

=10=22.5=8.5方差愈小,说明变量值的变异程度愈小;方差愈大,说明变异程度愈大。

三、标准差

把方差开平方,恢复了原来的单位,这就是标准差由于克服了方差的不足因而最常用符号

s表示样本标准差,σ表示总体标准差1.样本标准差的计算公式

s=2.标准差的意义说明变量值的变异程度。标准差愈小,说明变量值的变异程度愈小;标准差愈大,说明变异程度愈大。

3.标准差的计算方法直接法小样本资料求标准差

s=

例8-9

求[例8-1]资料的标准差。将n=5,∑=6+3+2+9+10=30∑

=36+9+4+81+100=230,代入公式得s==3.54(mm)

加权法

s=

例8-10求[例8-2]资料的标准差。

身高组段组中值频数

(1)(2)(3)(4)=(2)×(3)(5)=(2)×(4)125~127112716129129~131452468644133~13591215164025137~139283892540988141~143355005715715145~147273969583443149~151111661250811153~155462096100157~161159115925281合计∑

=120∑=17172∑=2461136120名12岁健康男孩身高(cm)标准差的加权法计算将表中的∑

=120,∑

=17172,

=2461136,代入公式(8-2-4)得s=

=5.67(cm)3.标准差的应用1.表示一组变量值的变异程度2.用标准差计算变异系数3.用标准差估计变量值的频数分布情况

4.用标准差计算标准误

四、变异系数(CV)1.计算公式CV=无单位限制例8-11某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.72kg,标准差为4.96kg。试比较身高与体重的变异程度。身高

CV=体重

CV==9.23%=2.98%即该地20岁男子体重间的变异程度比身高间的变异程度大。例8-12某地130名10岁女生体重均数为26.96kg,标准差为3.9kg;150名17岁女生体重均数为49.18kg,标准差为5.3kg,试比较两个年龄别女生体重的离散程度。10岁女生CV=17岁女生CV=×100%=10.92%×100%=14.49%可见,10岁女生体重的离散程度大于17岁女生。2.变异系数应用当二组资料单位不同,而又要比较其变异程度当二组资料均数不同,而又要比较其变异程度第3节正态分布一、概述正态分布(normaldistribution)又称高斯分布(Gaussiandistribution),是一种重要的连续型分布,应用甚广,是许多统计方法的理论基础。120名12岁健康男孩身高的频数分布频数接近正态分布示意图

正态分布曲线二、正态分布的特征

1.正态曲线在横轴的上方,以均数处最高;2.正态分布以均数为中心,左右对称;3.正态分布有二个参数,即总体均数和总体标准差;4.正态曲线下的面积分布有一定规律。三、正态曲线下面积的分布规律μ±1σ范围内的面积占68.27%;μ±1.96σ范围内的面积占95.00%;μ±2.58σ范围内的面积占99.00%。四、正态分布规律的应用1.估计频数分布情况2.估计医学参考值范围3.其它用途质量控制处理对数正态分布资料

估计频数分布情况

区间±本例区间身高范围理论分布实际分布人数

(cm)(%)构成(%)±1s143.10±1×5.67137.43~148.7768.278268.33±1.96s143.10±1.96×5.67131.99~154.2195.0011495.00±2.58s143.10±2.58×5.67128.47~157.3399.0011898.33估计医学参考值范围±

估计双侧95%界限例8-9

某地调查正常成年男子144人的红细胞数,近似正态分布。算得=5.38×1012/L,标准差s=0.44×1012/L,试估计该地成年男子红细胞数的95%参考值范围。因红细胞数过多或过少均为异常,故应估计双侧95%界限

下限为

-1.960s=5.38-1.960

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论