版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
定量资料的统计描述分析
统计描述统计推断
统计分析定量资料的统计描述分析统计描述统计推断统
第一节频数分布表与频数分布图一、频数表的制备(一)频数表的编制1、计算极差(range)R=最大值-最小值2、确定组距
I=R/组数,组数=10153、划分组段每个组段应有一个起始值作为组下限;第一组段应包括最小值,最后组段应包括最大值。4、归纳计数
第一节频数分布表与频数分布图一、频数表的制备
某年某市120名12岁健康男孩身高(cm)测量资料142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9R=160.9–125.9=35I=R/10=35/10=3.5,取整I=4.0
某年某市120名12岁健康男孩身高(cm)频数分布表组段组中值 频数ƒ ƒx
(1) (2)(3)(4)=(2)(3)125 127 1 127129 131 4 524133 135 9 1215137 139 28 3829141 143 35 5005145 147 27 3969149 151 11 1661153 155 4 620157161 159 1 159合计 — 120(ƒ) 17172(
ƒx)
某年某市120名12岁健康男孩身高(cm)频数分布表
(二)频数分布的类型1、对称分布2、偏态分布对称分布正偏态分布负偏态分布(二)频数分布的类型对称分布正偏态分布负偏态分布
(三)频数分布表的用途1、揭示资料的分布类型2、频数分布的重要特征——集中趋势(centraltendency)——离散趋势(tendencyofdispersion)3、便于发现某些特大或特小的可疑值(三)频数分布表的用途
二、连续型变量的频数分布图(一)等距分组二、连续型变量的频数分布图
×年×市流行性乙型脑炎患者的年龄分布(二)不等距分组
×年×市流行性乙型脑炎患者的年龄分布
第二节集中趋势的描述
平均数(averageindex):用以描述同质计量资料频数分布的集中趋势,反映一组变量值的平均水平,是一组变量值的代表值。
第二节集中趋势的描述
一、算术均数:简称均数。用于描述对称分布(特别是呈正态分布)的变量值的平均水平。总体均数用希腊字母
表示,样本均数用X表示。计算方法:
直接法:x=
x/n,用于变量值个数不多时例如:现测得8名健康人血液一小时末红细胞沉降率(血沉)各为:4、7、5、3、10、9、6和7mm/hr。试求其血沉均数。x=
x/n=(4+7+5+3+10+9+6+7)/8=6.4(mm/hr)
加权法:x=
x/
=
x/n,当变量值个数较多或变量值为频数表资料时例如,某市某年120名12岁健康男孩身高的均数X=
x/
=
x/n=17172/120=143.10(cm)一、算术均数:简称均数。用于描述对称分布(特别是呈正
某年某市120名12岁健康男孩身高(cm)频数分布表组段组中值 频数ƒ ƒx
(1) (2)(3)(4)=(2)(3)125 127 1 127129 131 4 524133 135 9 1215137 139 28 3829141 143 35 5005145 147 27 3969149 151 11 1661153 155 4 620157161 159 1 159合计 — 120(ƒ) 17172(
ƒx)
X=
x/
=
x/n=17172/120=143.10(cm)
某年某市120名12岁健康男孩身高(cm)频数二、几何均数:用G表示。用于描述变量值呈等比数列,或呈对数正态分布或近似对数正态分布资料。直接法:G=n
x1x2
x3
xn,G=lg-1(
lgx/n)例如,某地在研究人群中流行性感冒抗体水平的调查中,测得12名儿童的血清对某型病毒之血凝抑制效价的倒数各为5、5、5、5、5、5、5、10、10、10、20、40,试计算平均血凝抑制效价。X=(5+5+5+5+5+5+5+10+10+10+20+40)/12=10.42G=12
57
103
20
40=7.94二、几何均数:用G表示。用于描述变量值呈等比数列,或呈对lgG=lg(12
57
103
20
40)=lg(57
103
20
40)1/12=1/12(7lg5+3lg10+lg20+lg40)=0.89966为简化计算,可两边取对数G=lg-1(lgG)=lg-10.89966=7.94
加权法:G=lg-1(
lgx/
),当变量值个数较多或变量值为频数表资料时G=12
57
103
20
40=7.94lgG=lg(12571032040)=lg(5
三、中位数和百分位数:中位数是一组从小到大顺序排列的变量值,位于正中间位置的数值,亦称为位置平均数,代号为M。多用于描述偏态分布资料,或分布不明资料,或一端或两端无确定数值的开口资料的集中趋势。百分位数代号为PX,是一种位置指标。PX:1,2,3,4,5,6,7,8,9,10,…n100等分P50=
M
三、中位数和百分位数:中位数是一组从小到大顺序排列小样本资料中位数计算方法(直接法):
当例数n为奇数时
M=X(n+1)/2
当例数n为偶数时
M=[X(n/2)+X(n/2+1)]/2例如,7名某病潜伏期各为1、2、2、3、3、5、15,求其平均潜伏期。X=(1+2+2+3+3+5+15)/7=4.4(天)M=X(n+1/2)=3(天)小样本资料中位数计算方法(直接法):
1、离散型变量2、连续型变量中位数和百分位数计算方法(频数表法):
PX=L+i(n
x%-
L)/
mL:百分位数所在组组下限i:百分位数所在组组距
L:百分位数所在组上一个组段的累计频数
m:百分位数所在组频数
M=L+i(n/2-
L)/
mL:中位数所在组组下限i:中位数所在组组距
L:中位数所在组上一个组段的累计频数
m:中位数所在组频数1、离散型变量
238名正常人发汞的中位数计算发汞值 频数(ƒ) 累计频数(ƒL)0.3~ 20 200.7~ 66 861.1~ 60 1461.5~ 48 1.9~ 18 2.3~ 16 2.7~ 63.1~ 13.5~ 03.9~ 3 M=1.1+0.4(238/2–86)/60=1.32(g/g)
238名正常人发汞的中位数计算
三种常用平均数平均数 适用资料 计算方法算术均数 变量值呈对称分布 直接法(未分组资料(X) 加权法(分组资料)
几何均数等比级资料, 直接法(未分组资料) (G)对数正态分布 加权法(分组资料)
中位数 呈偏态分布,直接法(未分组资料)(M) 分布不清分布一端无确定值频数表法(分组资料)三种常用平均数第三节离散程度的指标变异指标:又称离散指标,用以描述一组同质变量值之间参差不齐的程度,即离散程度(degreeofdispersion)或变异度(degreeofvariation)。例如,两组新生儿,各有5例,平均出生体重都是3.4公斤甲组2.82.93.43.94.0乙组3.03.23.43.63.8甲的变异程度>乙组第三节离散程度的指标(一)全距:R(range),亦称极差。即一组变量值中最大值与最小值之差。R甲=4.0-2.8=1.2R乙=3.8-3.0=0.8优点:简单明了缺点:仅考虑了资料的最大值与最小值,不能反应组内其它数据的变异程度。一、极差和四分位间距一、极差和四分位间距
(二)四分位间距(inter-quartilerange)1、百分位数2、四分位数:下四分位数(QL):P25上四分位数(QU):P753、四分位间距
QU-QL(二)四分位间距(inter-quartilerang二、方差与标准差:是最常用来衡量变量值间离散程度的变异指标。总体方差
2,标准差代号
,样本方差S2,标准差代号S。x-
离均差
x-
离均差之和如对称则会出现x-
=0
(x-
)2
离均差平方和与变异度及个数有关(x-
)2/n即方差(variance),总体方差用
2表示
2=
(x-
)2/n数理统计研究结果,
(x-x)2/n<
(x-
)2/n,因此,s2=
(x-x)2/(n-1),缺点是将单位也进行了平方
=n-1,称为自由度。二、方差与标准差:是最常用来衡量变量值间离散程度的变异指标
x
2–(x)2/nfx2–(fx)2/fxS=
(x-x)2/(n-1)= = n–1
fx–1
运用:1、用来描述正态分布资料的变异程度。
2、当资料呈正态或近似正态资料时往往将均数与标准差同时写出:X
S,表示均数的代表性。
3、计算变异系数
4、用标准差估计变量值的频数分布
5、用标准差计算标准误标准正态分布示意图课件某年某市120名12岁健康男孩身高(cm)频数分布表组段组中值频数ƒƒxfx2
(1)(2)(3)(4)=(2)(3)(5)=(2)(4)
125127 1127 16129129 131 4524 68644133 135 91215 164025137 139 283829 540988141 143 355005 715715145 147 273969 583443149 151 111661 250811153 155 4620 96100157161159 1159 25181合计 12017172 2461136
(ƒ)(
ƒx)(
ƒx2)
2461136-(17172)2/120s=
120-1
某年某市120名12岁健康男孩身高(cm)频数分布表三、变异系数:又称离散系数。代号为CV。
SCV=100%x
运用:1、比较均数相差悬殊的几组资料的变异程度;
2、比较度量衡单位不同的几组资料的变异程度;例如,某地20岁男子160人,身高均数为166.06cm,标准差4.95cm;体重均数53.72kg,标准差4.96kg,试比较身高与体重的变异程度。身高:CV=(4.95/166.06)×100%=2.98%体重:CV=(4.96/53.72)×100%=9.23%三、变异系数:又称离散系数。代号为CV。正态分布及其应用一、正态分布(normaldistribution):是医学和生物学中最常见的总体频数分布,以均数为中心,两侧逐渐下降并对称,两端永远不与横轴相交。
为了应用方便,常对变量X作u=(X-
)/
变换,使
=0,
=1,则正态分布转换为标准正态分布(或称U分布),用N(0,1)表示。
正态分布及其应用
特征:1、均数处最高;2、以均数为中心,左右对称;3、有两个参数:
和
;正态分布用N(
,
)表示
特征:
正态分布曲线
正态分布曲线正态曲线下面积的分布规律正态曲线下的面积分布有一定规律:变量值范围正态曲线下面积(变量值出现的概率)
1.0
68.27%
1.96
95.00%(警界线)
2.58
99.00%(控制线)面积分布规律的通式
Z
正态曲线下面积的分布规律(68.27%)
(95.00%)1.96(99.00%)2.58正态曲线面积分布规律
X
(68.27%)X二、标准正态分布Z
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 养老院新冠疫情应急处理方案
- 农产品安全生产诚信管理标准
- 学校网站内容安全管理制度
- 冷库设计方案及其维护管理措施
- 政府部门应急管理演练方案
- 养老院疫情应急响应处理方案
- 金融科技服务创新方案
- 2023年智能电能表及配件项目评价分析报告
- 2024至2030年精铸生铁煎盘项目投资价值分析报告
- 2024至2030年拉手缩蜡模具项目投资价值分析报告
- C++程序设计:第8章 数组
- 海口市安全生产事故应急救援预案(中安科修编稿)
- 浅谈钢-混凝土叠合板组合梁
- 23001料仓制作安装施工工艺标准修改稿
- 学习的最高境界叫巅峰学习状态
- 3211 城市公交企业安全风险分级管控指南
- 行政管理 外文翻译 外文文献 英文文献 全球媒体和政治:跨国沟通制度和公民文化
- 北京市房屋建筑和市政基础设施工程危险性较大的分部分项工程安全管理实施细则
- 议论文段落写作——茹清平
- (完整版)驾驶员违章违规处罚办法
- “六项机制”工作实施方案
评论
0/150
提交评论