版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
会计学1第定量资料的统计描述图3-1某年某市120名1岁男童乳牙数的频数分布第2页/共56页第1页/共56页
二、连续型定量资料
例3-2
某市2000年l20名6岁女孩的身高(cm)资料(连续型)105.4113.2118.7119.0107.0106.8114.2101.2114.9114.1119.5 104.3113.3112.2110.7112.7110.8115.6109.2116.0105.7127.8115.8118.5115.7116.7110.3118.0113.0118.5105.8118.9124.0117.5123.1113.7124.1125.3117.8108.7106.2 103.8122.6104.0126.5116.0117.5110.3120.1113.2123.4 112.4115.0128.1110.9125.1114.4110.2112.0116.4108.3110.9120.4108.2121.2112.3121.8117.0111.4117.2113.9116.1114.4118.8116.1108.4114.5109.0116.8110.8119.8 114.1118.8116.7113.4122.2118.1121.2114.0116.7112.3 121.1116.5110.3119.1118.4106.3115.3121.0107.5112.8121.6119.2113.5112.5123.1116.6129.5112.3126.8122.8121.1124.6125.7122.5121.0124.4120.9111.3112.5第3页/共56页第2页/共56页第4页/共56页第3页/共56页频数表编制步骤:(一)求极差:一组变量值的最大值和最小值之差,亦称为全距R=Xmax–Xmin=129.5-101.2=28.3(cm)第5页/共56页第4页/共56页定组距:组距=极差/组数
1、确定组数:一般在8~15组左右
2、确定组距(等距或不等距):组距=极差/组数=28.3/10=2.83≈33、确定各组段的上下限:连续型资料,各组段写为半开半闭型;离散型资料,既可写成上限开口型,也可写成上限闭口型(二)划分组段:第6页/共56页第5页/共56页表3-2某市120名6岁女孩身高频数分布组段划记频数f累计频率(%)(1)(2)(3)(4)99~102~105~108~111~114~117~120~123~126~129~132合计一1
0.83干33.33正干8
10.00正正正15
22.50正正正正20
39.17正正正正王24
59.17正正正王19
75.00正正正1587.50正正10
95.83王4
99.17一1
100.00120-(三)列表划记第7页/共56页第6页/共56页第8页/共56页第7页/共56页正偏态分布集中位置偏向于左侧负偏态分布集中位置偏向于右侧分布类型对称分布,最常见的是正态分布不对称分布:正偏态分布和负偏态分布第9页/共56页第8页/共56页1、便于发现特大和特小的可疑值;
2、揭示资料的分布类型;
3、可以看到频数分布的两个特征: 集中趋势和离散趋势频数分布表的用途第10页/共56页第9页/共56页第二节集中趋势的描述
一、算术均数(mean)总体均数用μ表示,样本均数用表示。适用条件:对称分布,特别是正态分布。第11页/共56页第10页/共56页(二)加权法:计算公式(一)直接法:……,……,……,……。……,第12页/共56页第11页/共56页
表3-3某市120名6岁女孩身高(cm)均数的计算(加权法)组段
频数f
组中值Xfx(1)
(2)
(3)
(4)=(2)×(3)
99~102~105~108~111~114~117~120~123~126~129~132合计
1
100.5
100.5
3
103.5
310.5
8
106.5
852.0
15
109.5
1642.5
20
112.5
2250.0
24
115.5
2772.0
19
118.5
2251.5
15
121.5
1822.5
10
124.5
1245.0
4
127.5
510.0
1
130.5
130.512013887
(cm)第13页/共56页第12页/共56页适用条件:变量值的变化呈倍数变化关系,特别是对数对称分布、对数正态分布。
二、几何均数(geometricmean
)几何均数用G表示。第14页/共56页第13页/共56页(一)直接法:对数形式:…几何均数,…变量值对数之和,…反对数符号(二)加权法:第15页/共56页第14页/共56页第16页/共56页第15页/共56页(1)偏态分布资料,变量分布规律不清,有少数特小值或特大值,变量值一端或两端无确定值。
三、中位数和百分位数(一)中位数(median,M)
适用资料:(2)所有资料。理论上对称分布资料的算术均数与M相等,对数对称资料宜用几何均数第17页/共56页第16页/共56页n……,……1.直接由原始数据计算中位数
当变量值较少时,将n个变量值从小到大排列后记为xi,即有x1≤x2≤…≤xnn为奇数时,n为偶数时,第18页/共56页第17页/共56页例3-6.
测定7名成年男性红细胞数(1012/L):3.83,4.25,4.58,4.83,5.17,5.60,5.95
例3-7.
测得某市某大学8名正常女子总胆固醇(mmol/L):2.58,3.02,3.41,3.87,
4.25,4.73,5.13,5.71第19页/共56页第18页/共56页2.用频数表计算中位数适用条件是:样本含量(n)足够大(n>100)—M所在组段的频率,iM—
该组段的组距,—小于该组段的各组累计频数。L—
该组段的下限,计算公式:众数:一组数据中出现的频数最多的数据,描述集中趋势的指标。第20页/共56页第19页/共56页第21页/共56页第20页/共56页(二)百分位数(percentile)PX
将观察值从小到大排列后,等分成100份,位于第x百分位置上的数值称第百分之x位数,记为Px。有x%的数据比Px
小,有(100~X)%的数据比Px
大,故百分位数是一个位置指标。
第22页/共56页第21页/共56页第23页/共56页第22页/共56页第三节离散程度的描述例3-10:三组同性别、同年龄儿童的体重(kg)资料如下:甲组1618202224
乙组1417202326
丙组1619202124
均数相同,都是20kg,然而这3组数据间参差不齐的程度(即变异)是不相同的第24页/共56页第23页/共56页适用于各种分布类型R=极大值-
极小值极差可用于反映各种分布资料的变异程度,简单明了;缺点:①只涉及最大值和最小值,不能反映组内其他数据的变异程度;②样本较大时,抽样误差大,因此抽到最大值和最小值的可能性也越大。
一、极差(range)
亦称全距第25页/共56页第24页/共56页两端无确切值或分布不明确资料的离散程度。相对比较稳定,但只反映了居中间的50%数据的变异情况,仍未考虑到每个观察值的变异情况,不能代表全部观察值的离散程度。
二、四分位数间距
(inter-quartilerange)四分位数间距Q=QU-QL。适用条件:各种分布类型,特别是偏态分布资料、第26页/共56页第25页/共56页适用条件:对称分布资料,特别是正态分布资料(同均数);偏态资料。
三、方差(variance)
四、标准差(standarddeviation)
总体标准差—σ,样本标准差—s第27页/共56页第26页/共56页(二)加权法:…变量值平方和…变量值和的平方(一)直接法:总体标准差第28页/共56页第27页/共56页第29页/共56页第28页/共56页(1)描述变量值分布的离散程度,标准差大,变量值分散,标准差小,变量值集中。(2)概括地估计变量值的频数分布(3)计算正常值范围(4)计算标准误(统计推断中常用统计指标)应用:第30页/共56页第29页/共56页适用于:多组资料之间变异程度的比较时,1.单位不同,2.均数相差较大。
五、变异系数
(coefficientofvariation)
计算公式:第31页/共56页第30页/共56页第32页/共56页第31页/共56页第33页/共56页第32页/共56页第四节正态分布及其应用
一、正态分布的概念和特征
正态分布(normaldistribution)是一种重要的连续型分布。在医学卫生领域中,有许多变量都近似服从正态分布,如测量误差、许多生化指标的值和人的身高、体重等。此外,许多分布可用正态分布近似,如大样本偏态资料的样本均数近似正态分布,还有些分布可由正态分布导出,因此,正态分布可以说是最重要的一种分布。第34页/共56页第33页/共56页表3-7
某地某年120名12岁女孩身高(cm)的频数分布组段
x频数
f频率(1)(2)(3)125~10.01129~40.03133~90.08137~280.23141~350.29145~270.23149~110.09153~40.03157~16110.01合计1201.00第35页/共56页第34页/共56页频率
(a)12512913313714114514915315716101234身高(cm)第36页/共56页第35页/共56页(b)第37页/共56页第36页/共56页(c)
图3-3频数分布逐渐接近正态分布示意图第38页/共56页第37页/共56页正态分布的概率密度函数:
正态分布具有下列特性:(1)正态密度函数曲线在横轴上方,且曲线在均数处最高。(2)正态分布以均数为中心,左右对称。(3)曲线下面积为1。(4)正态分布的两个参数
和
分别决定分布的位置和形状。第39页/共56页第38页/共56页
图3-4不同均数、不同标准差的正态分布示意图第40页/共56页第39页/共56页二、正态曲线下面积的分布规律
若x~N(,),则~N(0,1)(z)=1-(-z)第41页/共56页第40页/共56页例3-17.z1=-1.50,z2=-0.31,求标准正态分布曲线下(-1.50,-0.31)区间内面积D。查附表1得
(-1.50)=0.0668和(-0.31)=0.3783,则面积
例3-18.
已知某地某年120名7岁女孩身高=122.0cm,s=4.7cm,试估计该地7岁女孩身高介于118cm和124cm范围内的比例及120名7岁女孩介于此范围内的人数。第42页/共56页第41页/共56页
(z1)=(-0.8511)=0.1989
(z2)=(0.4255)=1-(-0.4255)=1-0.3354=0.6646D=
(z1)-
(z2)=0.6646-0.1989=0.4657故估计该地某年身高界于118cm~124cm范围内的7岁女孩所占比例为0.4657,即46.57%。估计120名7岁女孩中身高界于118cm~124cm范围内的人数为12046.57%56名。第43页/共56页第42页/共56页第44页/共56页第43页/共56页三、参考值范围
参考值范围(referencerange)也称为正常值范围。医学参考值是指包括绝大多数正常人的某指标值范围,由于存在着个体差异,正常人的解剖,生理,生化等各种指标并非常数,而是在一定范围内波动,故采用医学参考值范围(medicalreferencerange)作为判定正常和异常的参考标准。对于服从正态分布的指标,可根据正态分布的面积分布规律制定其参考值范围;对于不服从正态分布的指标,可先进行变量变换使之服从正态分布或直接利用百分位数法制定其参考值范围。第45页/共56页第44页/共56页制定医学参考值范围的基本步骤:1.从正常人群中抽样,样本含量要足够大:所谓“正常人”并不是指完全健康的人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。3.确定是否需要分组制定参考值范围4.决定取双侧还是取单侧5.选定合适的百分界限6.对资料的分布作正态性检验7.根据资料的分布类型选用适当的方法来估计参考值范围。第46页/共56页第45页/共56页(1)正态分布法:适用于正态或近似正态分布的资料。
双侧参考值范围
单侧参考值范围上限
单侧参考值范围下限
第47页/共56页第46页/共56页
例3-19.某地调查156名正常成年男子的红细胞数,资料近似正态分布,计算得均数,s=0.441012
L。下限:-1.96s=5.38-.96×0.44=4.521012L
上限:+1.96s=5.38+1.96×0.44=6.241012L
μ的95%参考值范围为4.52~6.24(×1012L)。(2)百分位数法:适用于任何分布类型的资料。但常用于经过数据转换仍然不呈正态分布或分布不明的资料。第48页/共56页第47页/共56页例3-20.用硫酸—高锰酸钾—硝酸消化法和无火焰原子吸收光谱法测得某市238名正常人的发汞值第49页/共56页第48页/共56页第50页/共56页第49页/共56页datali3_2;inputx@@;cards;105.4113.2118.7119.0107.0106.8114.2101.2114.9114.1119.5104.3113.3112.2110.7112.7110.8115.6109.2116.0105.7…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…;proc
univariatenormal;run;第51页/共56页第50页/共56页
最佳选择题1.描述一组偏态分布资料的变异度,以()指标较好。A.全距B.标准差C.变异系数D.四分位数间距E.方差2.用均数和标准差可全面描述()资料的特征。A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3.各观察值均加(或减)同一数后,()。A.均数不变,标准差变B.均数变,标准差不变C.两者均不变D.两者均变E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。A.变异系数B.方差C.全距D.标准差E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。A.算术均数B.标准差C.中位数D.几何均数E.平均值第52页/共56页第51页/共56页6.各观察值均乘以同一不等于0的数后,()不变。A.算术均数B.标准差C.中位数D.几何均数√E.变异系数7.()分布资料,均数等于中位数。A.正偏态B.负偏态C.正态D.偏态E.对数正态8.对数正态分布是一种()分布。A.偏态B.负偏态C.正态√
D.右偏态E.对称9.最小(大)组段无下(上)限的频数分布资料,可用()描述其集中趋势。A.均数B.标准差C.中位数D.几何均数E.四分位数间距10.血清学滴度资料常用来表示其平均水平的指标是()。A.算术均数B.标准差C.中位数D.几何均数E.变异系数第53页/共56页第52页/共56页
11.以下指标中()可用来描述定量资料的离散程度。
A.算术平均数B.几何平均数
C.极差D.中位数
12.偏态分布资料宜用()描述其分布的趋势。
A.算术平均数B.中位数
C.四分位数间距D.方差13.用均数和标准差可全面描述()资料的分布特征。
A.正态分布B.偏态分布
C.对称分布
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 展览场地合同范本
- 以租抵债合同标准版3篇
- 解除租赁合同第三人的条件
- 解除长期租赁合同协议
- 2024年度融资租赁合同标的飞机2篇
- 解除劳动合同通知书 返岗通知书
- 2024年度二手汽车交易合同标的全风险评估服务3篇
- 学校食品原料供货合同范本
- 2024年度二手房购房贷款解除合同2篇
- 商店承包合同范本
- 栏杆喷漆合同范例
- 踝关节不稳的康复治疗
- 产学研合同模板
- 2024-2030年中国云安全服务行业深度调查及投资模式分析报告
- 建筑工程施工现场安全管理处罚规定
- 4.1陆地水体间的相互关系课件高中地理人教版(2019)选择性必修一
- 6人小品《没有学习的人不伤心》台词完整版
- 论现代企业人力资源管理中激励机制的应用以腾讯公司为例
- CRRT治疗剂量的计算
- (完整)风景园林概论知识点,推荐文档
- 烟草专卖局(公司)员工考核管理办法
评论
0/150
提交评论