版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
集中趋势的统计描述2023/7/211第1页,课件共36页,创作于2023年2月集中趋势:观察值的平均水平或集中位置,用平均数反映离散趋势:观察值的变异程度或离散程度,用变异指标反映描述资料的集中趋势与离散趋势2023/7/212第2页,课件共36页,创作于2023年2月第二章计量资料的集中趋势
一、计量资料的频数分布二、集中趋势指标*1.
了解统计描述的基本概念,频数分布表的编制、类型及用途,连续型变量的频数分布图。掌握算术平均数、几何平均数、中位数的计算及适用范围。2023/7/213第3页,课件共36页,创作于2023年2月一、计量资料的频数分布频数分布表的概念频数分布表的制作频数分布表在统计分析中的作用2023/7/214第4页,课件共36页,创作于2023年2月(一)频数分布表
frequencydistributiontable对观察到的计量资料,按变量的取值范围进行分段,统计变量值出现在每一个段中的次数(即频数,frequency),以表格的形式列出各个段及其对应的频数.此类表格称为频数分布表.2023/7/215第5页,课件共36页,创作于2023年2月频数分布表2023/7/216第6页,课件共36页,创作于2023年2月(二)频数表的制作方法计算极差(R)
决定组数(k)、组段和组距(i)列表划记2023/7/217第7页,课件共36页,创作于2023年2月
例1.1某地140名正常成年男子红细胞数P82023/7/218第8页,课件共36页,创作于2023年2月极差:组数:组距:组段:解题步骤:2023/7/219第9页,课件共36页,创作于2023年2月2023/7/2110第10页,课件共36页,创作于2023年2月
图2-1140名正常男子红细胞计数的直方图
2023/7/2111第11页,课件共36页,创作于2023年2月1、作为陈述资料的形式:
简单明了或直观形象,便于进一步作统计分析。(三)频数表与频数分布图的用途2023/7/2112第12页,课件共36页,创作于2023年2月2、揭示计量资料的分布特征频数分布类型正偏态分布右偏态分布负偏态分布左偏态分布正态分布2023/7/2113第13页,课件共36页,创作于2023年2月101名正常成年女性血清总胆固醇频数分布频数血清总胆固醇正态分布2023/7/2114第14页,课件共36页,创作于2023年2月2023/7/2115第15页,课件共36页,创作于2023年2月2023/7/2116第16页,课件共36页,创作于2023年2月3、描述资料的集中趋势与离散趋势频数分布特征集中趋势离散趋势
指频数分布集中分布于某些组段趋势
指频数分布从集中位置逐渐向两侧递减的趋势2023/7/2117第17页,课件共36页,创作于2023年2月4.便于发现一些特大或特小的可疑值可疑值可疑值2023/7/2118第18页,课件共36页,创作于2023年2月二、集中趋势指标
statisticsoflocation平均数(average)是一类用描述数值变量资料集中趋势(即平均水平)的指标.2023/7/2119第19页,课件共36页,创作于2023年2月平均数的表示符号2023/7/2120第20页,课件共36页,创作于2023年2月1.算术平均数
意义:一组性质相同的观察值在数量上的平均水平。样本算术平均数的计算公式:
2023/7/2121第21页,课件共36页,创作于2023年2月组段(1)频数,f(2)组中值,X(3)
fX(4)=(2)×(3)3.80~23.907.804.00~64.1024.64.20~114.3047.34.40~254.50112.54.60~324.70150.44.80~274.90132.35.00~175.1086.75.20~135.3068.95.40~45.5022.05.60~25.7011.45.80~6.00
合计15.905.9140669.8第22页,课件共36页,创作于2023年2月算术平均数的适用条件资料呈现正态分布或对称分布2023/7/2123第23页,课件共36页,创作于2023年2月2.几何平均数
意义:N个数值的乘积开N次方即为这N个数的几何均数。
样本几何平均数的计算公式:
2023/7/2124第24页,课件共36页,创作于2023年2月直接法:例2.2Page11例2.2
测得10人的血清滴度的倒数分别为2,2,4,4,
8,8,32,32,求平均滴度。
2023/7/2125第25页,课件共36页,创作于2023年2月间接法:例2.3Page11例2.3某医师使用胎盘浸液钩端螺旋体菌对326名农民接种两月后测得血清IgG抗体滴度如下,计算平均抗体滴度。
IgG滴度倒数XlgX例数lgX
201.3011620.816401.6025791.417801.90376144.6351602.20475165.3093202.50554135.2786402.8062570.15512803.1072371.4662023/7/2126第26页,课件共36页,创作于2023年2月①变量值中不能有0;
②不能同时有正值和负值;
③若全是负值,计算时可先把负号去掉,得
出结果后再加上负号。计算几何均数注意事项:2023/7/2127第27页,课件共36页,创作于2023年2月几何平均数的适用条件当一组观察值为非对称分布、且差距较大数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系或呈对数正态分布。常用于计算抗体平均滴度、药物的平均效价等2023/7/2128第28页,课件共36页,创作于2023年2月3.中位数(median)*
1)直接法:当n为奇数时当n为偶数时
2)频数表法:
该公式适用于原始数据资料
该公式适用于频数表资料LM,iM,fM分别为M所在组段的下限、组距和频数,fL为M所在组段之前各组段的累积频数。
样本中位数的计算公式意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。2023/7/2129第29页,课件共36页,创作于2023年2月
1,3,7,55,86,100,中位数为多少?
1,3,7,55,100,中位数为多少?2023/7/2130第30页,课件共36页,创作于2023年2月
表2-4某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂频数累积频数累积频率(%)0.10~
27
27
4.30.40~169196
31.10.70~167363
57.61.00~
94457
72.51.30~
81538
85.41.60~
42580
92.11.90~
28608
96.52.20~
14622
98.72.50~
4626
99.42.80~
3629
99.83.10~
1630100.0
合计630
-
-M2023/7/2131第31页,课件共36页,创作于2023年2月中位数的适用条件当资料呈明显的偏态分布资料一端或两端无确定数值资料的分布情况不明*对于任何分布资料都可以用中位数反映平均水平,但中位数没有利用全部数据的信息,只受位置居中的观察值的影响.*若资料呈对称或正态分布,总体中位数与总体算术平均数相等;样本中位数与样本算术平均数不一定完全相等,但一般情况下,近似相等.2023/7/2132第32页,课件共36页,创作于2023年2月4.百分位数Px(percentile)百分位数是把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数.中位数即第50百分位数,记为P50.把某些特殊的百分位数结合起来,能较全面地反映数据的集中趋势和离散趋势.如P5,
P25,
P50,
P75,
P95
等指标结合起来.百分位数常常用于医学参考值范围的估计.2023/7/2133第33页,课件共36页,创作于2023年2月计算公式:例2.5资料P25,P50,P75,P90
计算结果2023/7/2134第34页,课件共36页,创作于2023年2月先找到包含Px的最小累计频率;该累计频率同行左边的组段值为L;3.
L
同行右边的频数为fx(或fm
);4.
L前一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论