




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章定量数据的统计描述*1教学要求学会编制频数分布表;掌握平均数的概念、种类和应用熟悉变异指标的意义、种类,掌握标准差的意义与应用;*2频数表和频数分布1.频数表的编制例2-1某地用随机抽样方法检查了140名成年男子的红细胞数(×1012/L),检测结果如表2-1所示:问题:红细胞数是什么类型资料?*3表2-1调查某地140名成年男子的红细胞数(×1012/L)*44.765.265.615.954.464.574.315.185.275.244.465.004.734.475.344.704.814.935.045.515.605.075.244.974.714.444.945.054.784.524.994.584.934.334.834.565.444.794.914.264.385.224.824.794.955.074.805.304.654.774.505.375.085.054.654.814.543.824.014.894.625.124.854.944.154.505.054.404.145.014.375.244.604.714.805.154.364.524.644.374.874.604.724.835.335.044.634.224.764.884.613.974.084.584.314.054.514.49
4.624.734.474.584.704.814.554.284.754.88
4.484.595.095.205.325.054.414.524.775.50
4.715.214.944.685.174.915.024.764.634.98
频数表编制方法①找出极大值和极小值,并计算极差R
(range)本例:R=5.95-3.82=2.13(×1012/L)②依R分组,确定组数、组距、组段,常取8~15组,用R/10取整作组距i
(interval)本例:i
=2.13/10=0.213,取组距为0.2③确定组限:第一组下限为3.80~(包括最小值)最后一组包括最大值④列表划记,确定频数*5组段划记频数3.80~1124.00~11111164.20~11111111111114.40~1111111111111111111111111254.60~11111111111111111111111111111111324.80~111111111111111111111111111275.00~11111111111111111175.20~1111111111111135.40~11111111145.60~1125.80~6.0011合计140调查某地140名成年男子的红细胞数(×1012/L)*6*7调查某地140名成年男子的红细胞数(×1012/L)直方图*8调查某地140名成年男子的红细胞数(×1012/L)的頻数表组段(1)组中值(2)频数(3)累积频数(4)频率(%)(5)累积频率(%)(6)3.80~3.9221.431.434.00~4.1684.295.714.20~4.311197.8613.574.40~4.5254417.8631.434.60~4.7327622.8654.294.80~4.92710319.2973.575.00~5.11712012.1485.715.20~5.3131339.2995.005.40~5.541372.8697.865.60~5.721391.4399.295.80~6.005.911400.71100.00频数表的用途①陈述资料的形式,代替原始数据,便于进一步分析②可揭示资料的分布特征
分布特征:集中趋势和离散趋势集中趋势(centraltendency):变量值集中位置。本例在组段“4.60~”左右
离散趋势(tendencyofdispersion):变量值围绕集中位置的分布情况。离“中心”位置越远,频数越小;
*9③描述分布类型偏态分布对称分布:10均数在正中,左右频数对称正偏态:高峰偏向左侧,拖尾偏向右侧(正轴)方向,右偏态负偏态:高峰偏向右侧,拖尾偏向左侧(负轴)方向,左偏态*11④便于发现可疑值:远离群体的特大/特小值⑤当样本量大时,频率可以作为概率的估计值例如:成年男子红细胞数出现在4.0–4.2之间的可能性是4.29%描述集中趋势的指标:平均数(average)平均数:用来说明某种现象或事物数量的中等水平。求平均数必须注意:①同质的事物或现象才能求平均数②由资料的分布选用适当的平均数。③种类:算术均数、几何均数、中位数、众数、调和均数*12一.算术均数(arithmeticmean)1.计算方法一:直接法
样本观察值:X1,X2,…,Xn例110名7岁男童体重(kg)分别为:17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5,求平均体重。*132.计算方法二:加权法例2求例2.1中的平均红细胞数.用各组段的组中值代替该组段中的任一观察值,该组段的频数是f,即有f个组中值,则*14组中值=(本组段下限+本组段上限)/2*15调查某地140名成年男子的红细胞数(×1012/L)的頻数表组段(1)组中值x(2)频数f(3)fx(4)fx2(5)3.80~3.927.830.424.00~4.1624.6100.864.20~4.31147.3203.394.40~4.525112.5506.254.60~4.732150.4706.884.80~4.927132.3648.275.00~5.11786.7442.175.20~5.31368.9365.175.40~5.5422.0121.005.60~5.7211.464.985.80~6.005.915.934.81合计140669.83224.20
结果:140名正常成年男子红细胞数均数为4.7842
×1012/L3.加权法与直接法相比较:计算稍微简单,结果相差不大,本例直接法结果*164.均数的特性:①各离均差之和=0即②离均差的平方和小于各观察值x与任何a(a≠x)之差的平方和,即
离均差平方和最小,均数是和各测量值最接近的数值,均数作为各个测量值的代表值是最好的。*175.适用范围:最适用于对称分布资料,尤其是正态分布资料,对于偏态资料则不理想。*18讨论大样本资料可以用直接法计算均数吗?
直接法和加权法计算公式中,“X”的含义有何区别?
直接法与加权法计算均数,那一种结果更精确?
*19二.几何平均数(geometricmean)适用范围:某些医学资料,如抗体的滴度、细菌计数等,个体变量值之间成倍数关系,频数分布明显偏态,经过对数转换后成单峰对称分布。要求观察值中不能有0,且不可正负值均有。*20计算方法:1)直接法或者*21例6人的血清滴度为1:2,1:4,1:8,1:16,1:32,1:64,求平均滴度。先求平均滴度的倒数,答:平均滴度为1:11.312)加权法:*22抗体滴度(1)频数f(2)滴度倒数x(3)lgx(4)f•lgx(5)=(2)×(4)1︰2016201.301020.81651︰4057401.602191.31741︰8076801.9031144.63481︰160751602.2041165.30901︰320543202.5051135.27811︰640256402.806270.15451︰12802312803.107271.4658合计∑326--698.9761表2-3胎盘浸出液钩端螺旋体菌苗接种2个月后清IgG抗体滴度几何均数计算表23结论:326名农民接种胎盘浸出液钩端螺旋体菌苗疫苗后平均血清IgG抗体平均滴度为1︰139log10x计算器:SHIFTlnexor*24*25三、中位数(Median)
中位数(M):中位数常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。当资料呈显著偏态或有个别特大特小值时,中位数的代表性优于平均数。计算定义:将一组变量值由小到大依次排列,居以中间位置的观察值即为中位数,为这组数据的平均数。中位数只受居中变量值的影响。
X:5,5,6,7,20(d)位次12345
M=6*26中位数的计算1.例数较少n为偶数n为奇数X:5,5,6,7,20(d)位次12345*272.频数表资料*282.频数表资料(例2-4)630×50%=315表2-4某地630名正常女性血清甘油三脂含量(mmol/L)--630合计100.0
63013.10~99.862932.80~99.462642.50~98.7622142.20~96.5608281.90~92.1580421.60~85.4538811.30~72.5457941.00~57.63631670.70~31.11961690.40~4.327270.10~累积频率(%)累积频数频数甘油三脂中位数频数表计算步骤1.在频数表上计算累计频数2.中位数所在组段略大于n×50%3.确定公式中下限值(L)、组距(i)、频数(f)、累计频数(fL)4.代入公式计算中位数。630正常女性血清TG中位数为0.914mmol/L*300102030405060708090100(%)M所在的组段或区间共有363-196=167例,假定数据呈均匀分布,则M离该区间下限的距离占整个区间宽度的百分比为:(315-196)/(363-196)=(630×50%-196)/167,区间宽度为组距0.3所以M=0.7+0.3×(630×50%-196)/167=0.914mmol/L*31累计频率31.11%累计频数196630×50%=315累计频率57.60%累计频数363167119
百分位数(percentile)指将n个观察值从小到大依次排列,再把它分成100等份,对应于x%位的数值即为第x百分位数。通常用Px表示。中位数即第50百分位数P500102030405060708090100P50M*32L:
组段的下限;iM:
组距;fx:
频数;
fL:Px所在组段之前的累积频数。计算例2.4的百分位数P25
、P75
、P90。中位数和百分位数的应用
1.中位数是百分位数的特例。其特点是不易受异常值的影响,适用于描述明显偏态分布、或两端无确定数值数据的平均水平。2.描述数据序列在某百分位置的水平。多个百分位数结合使用如P25和P75可以描述数据的分散程度,用P2.5和P97.5计算医学95%的参考值范围等。
计量资料分布与平均数选择分布类型算术均数几何均数中位数正态分布√×√对数正态分布×√√其他分布××√*35*36例2-6对甲乙两名高血压患者连续观察5天,测得的收缩压(mmHg)结果如下:时间(天)甲乙12345162147178142186164161165159166合计均数815163815163第三节变异(variation)指标1.极差(Range)(全距)优点:简便缺点:1.只利用了两个极端值2.n大,R也会大3.不稳定447*372.
四分位间距(inter-quartilerange)Q极差不稳定,主要是受两端的极值影响,所以有人建议将两端数据截去一定比例,如各去掉25%Q=p75-p25=Qu-QL四分位间距比R稳定,但仍未考虑每个观察值。对偏态分布,记为:M(P25,P75)。*380255075100MP25P75*39求离均差平方和的平均数以消除样本大小的影响——方差或均方均方(meansquare缩写为MS),又称样本方差,记为S2,即:
*40相应的总体参数叫总体方差,记为σ2。对于有限总体而言,σ2的计算公式为:3.方差(variance)V,S2,σ2
*41在统计学中,常用样本标准差S估计总体标准差σ4.标准差(standarddeviation)
由于所以前面公式可改写为:
*42标准差
standarddeviation标准差的意义:SD是表示一组变量值离散程度的指标,均数与标准差结合,能全面反映一组变量值的分布情况。由公式可见,当各变量值愈接近均数时,标准差越小,当各观察值远离均数时,标准差越大,所以标准差能说明变量值的离散程度。*43不分组资料的标准差的计算用代数的方法将上述公式简化为*44例1求4,1,0,1,4的标准差*45分组资料的标准差计算公式:计算实例10-1*46*47调查某地140名成年男子的红细胞数(×1012/L)的頻数表组段(1)组中值x(2)频数f(3)fx(4)fx2(5)3.80~3.927.830.424.00~4.1624.6100.864.20~4.31147.3203.394.40~4.525
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度商业地产项目场地施工租赁合作书
- 低碳设计趋势分析-洞察及研究
- 二零二五年度校园配送服务单位食品安全快速检测技术支持合同
- 二零二五年度城市公园及绿地保洁服务协议
- 2025版户外运动基地场地承包经营合同
- 二零二五年度环保建筑材料销售代理权授权合同
- 2025版港口码头保安与安全监控服务合同
- 二零二五年saas大数据分析软件销售合同
- 二零二五年度保险经纪服务委托合同样本
- 二零二五年度水上运输承包合同
- 北京安全生产治本攻坚三年行动方案
- 建设单位全员安全生产责任清单
- 项目计划管理培训
- 2026届高三语文一轮复习教学计划
- 给非财务人员的财务培训
- 品质培训课件模板
- 2025至2030中国GPU芯片行业市场发展现状调研及竞争格局与产业运行态势及投资规划深度研究报告
- 佛教寺院各项管理制度
- 供水公司维修管理制度
- 宁城职教中心实习实训基地项目可行性论证报告
- 海底捞服务管理制度
评论
0/150
提交评论