平均水平集中趋势的统计描述_第1页
平均水平集中趋势的统计描述_第2页
平均水平集中趋势的统计描述_第3页
平均水平集中趋势的统计描述_第4页
平均水平集中趋势的统计描述_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

平均水平集中趋势的统计描述1第一页,共三十七页,2022年,8月28日第一节频数分布一、频数表(frequencytable)一种格式的统计表,同时列出观察指标的可能取值区间及其在各区间的出现的频数。2第二页,共三十七页,2022年,8月28日4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76

例2.1某地用随机抽样方法检查了140名成年男子的红细胞数第三页,共三十七页,2022年,8月28日频数表的编制步骤:1、确定组数:组数一般为8~15组。2、确定组距:用i表示,i=全距/组数,一般取整数。全距用R表示,观察值中的最大值和最小值之差。

R=最大值-最小值R=5.95-3.82=2.13i=R/10=2.13/10≈0.214第四页,共三十七页,2022年,8月28日3、确定组段:确定组段的上、下限。要求第一组包括最小的观察值,最后一组包括最大的观察值。值得注意的是各组段不能重叠,每一组段均为半开半闭区间。如[112,114)或表示“112~”第一组“3.8~”、第二组“4.0~”4、列表划记:用划记法得到每组的频数。5第五页,共三十七页,2022年,8月28日红细胞数(×1012/L)划记组中值频数频率(%)3.8~3.9021.44.00~正4.1064.34.20~正正4.30117.94.40~正正正正正4.502517.94.60~正正正正正正4.703222.94.80~正正正正正4.902719.35.00~正正正5.101712.15.20~正正5.30139.35.40~5.5042.95.60~5.7021.45.8~6.005.9010.7表2-2某地140名正常男子红细胞数的频数表第六页,共三十七页,2022年,8月28日二、直方图纵轴表示各组的频数(频率),横轴表示观察变量,以直方的面积大小表示频数的多少,以直方面积占总面积的比例表示频率的大小。7第七页,共三十七页,2022年,8月28日三、频数分布表的用途1、代替繁杂的原始数据,便于进一步分析。2、便于观察数据的分布类型。正态分布(normaldistribution):其特征是中间组段的频数最多,两侧的频数分布对称,并按一定规律下降。偏态分布的基本特征是,频数分布不对称。正偏态分布:频数分布的高峰向左偏移,长尾向右侧延伸。负偏态分布:频数分布的高峰向右偏移,长尾向左侧延伸。8第八页,共三十七页,2022年,8月28日第九页,共三十七页,2022年,8月28日表2-2115名正常成年女子血清转氨酶(mmol/L)含量分布

10第十页,共三十七页,2022年,8月28日第十一页,共三十七页,2022年,8月28日表2-3101名正常人的血清肌红蛋白含量分布12第十二页,共三十七页,2022年,8月28日第十三页,共三十七页,2022年,8月28日3、便于发现资料中某些远离群体的特大或特小的可疑值。4、当样本含量比较大时,可用各组段的频率作为概率的估计值。第十四页,共三十七页,2022年,8月28日集中趋势(centraltendency):变量值集中位置.——平均水平指标离散趋势(tendencyofdispersion):变量值围绕集中位置的分布情况。离“中心”位置越远,频数越小;且围绕“中心”左右对称.——变异水平指标

频数表的分布特征15第十五页,共三十七页,2022年,8月28日第二节平均数

平均数(average)常用于描述一组变量值的集中趋势,是反映同质资料的平均水平或集中位置的特征值。平均数有多种,常用的有算术均数、几何均数和中位数。16第十六页,共三十七页,2022年,8月28日一、算术均数(mean)(一)计算方法有:直接法和加权法。1.直接法将所有的观察值X1,X2,…,Xn直接相加再除以观察例数。17第十七页,共三十七页,2022年,8月28日如对例2.1的数据用上面公式计算,可算得140名正常成年男子红细胞数的均值为:18第十八页,共三十七页,2022年,8月28日k:频数表的组段数,f:频数,X:组中值。2.加权法

适用于频数表资料。19第十九页,共三十七页,2022年,8月28日将表2-2的数据带入公式,有:直接法与加权法计算的均数非常接近,加权法计算的均数是近似值。20第二十页,共三十七页,2022年,8月28日(二)均数的应用

主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料。例如大多数正常人的生理、生化指标(身高、体重、腰围、臀围、血红蛋白、白细胞数等)都适宜用均数表达其集中趋势。21第二十一页,共三十七页,2022年,8月28日二、几何均数(geometricmean)用G表示,是将n个观察值x的乘积再开n次方所得的根。特点:数值按大小顺序排列后,各观察值呈倍数或近似倍数关系。(一)计算方法:直接法和加权法22第二十二页,共三十七页,2022年,8月28日1.直接法:23第二十三页,共三十七页,2022年,8月28日2.加权法:对于频数表资料,可用下式计算:24第二十四页,共三十七页,2022年,8月28日例2.2测得10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度。该组数据的均数,为10.825第二十五页,共三十七页,2022年,8月28日例2.3某医师使用胎盘侵液钩端螺旋体菌苗对326名农民接种2个月后测得血清IgG抗体滴度如下表,试计算平均抗体滴度。IgG滴度倒数例数201640578076160753205464025128023即胎盘侵液钩端螺旋体菌苗接种2个月后血清IgG抗体的平均滴度为1:139。第二十六页,共三十七页,2022年,8月28日(二)应用:

观察值呈倍数或近似倍数变化,

对数正态分布资料,原始数据呈正偏态分布。几何均数在医学研究领域多用于血清学和微生物学中。如抗体滴度、效价等。

27第二十七页,共三十七页,2022年,8月28日三、中位数和百分位数(一)中位数(median)一般用M表示。将一组观察值从小到大按顺序排列X1≤X2…≤Xn,居中心位置的数值即为中位数。中位数是一个位置指标,以中位数为界,将变量分为左右两半。1.计算方法有直接法和频数表法。28第二十八页,共三十七页,2022年,8月28日(1)直接法:当n为奇数时:当n为偶数时:29第二十九页,共三十七页,2022年,8月28日现测得极低密度脂蛋白(VLDL)中的载脂B蛋白的含量(mg/dl)测5个人的值:0.84、2.85、5.46、8.58、9.60中位数为5.46测4个人的值:0.84、2.85、5.46、8.58中位数为(2.85+5.46)/2=4.1630第三十页,共三十七页,2022年,8月28日(2)频数表法:31第三十一页,共三十七页,2022年,8月28日例2.4对某地630名50-60岁的正常女性检查了血清甘油三酯含量的频数表甘油三酯频数累积频数累积频率0.10~27274.30.40~16919631.10.70~16736357.61.00~9445772.51.30~8153895.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0合计630————表2-4某地630名50-60名正常女性血清甘油三脂含量的频数表第三十二页,共三十七页,2022年,8月28日2.中位数的应用

资料分布呈明显偏态(正或负偏态分布);频数分布两端无确定数值时;资料的分布情况不明。例如,某些传染病或食物中毒的潜伏期、人体的某些测定指标(如发汞、尿铅),其平均水平可用中位数来表示。33第三十三页,共三十七页,2022年,8月28日(二)百分位数(percentile)是指在一组数据中找到这样一个值,全部观察值的X%小于Px,而其余(100-X)%大于Px。

PxX%(100-X)%34第三十四页,共三十七页,2022年,8月28日频数表法

35第三十五页,共三十七页,2022年,8月

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论