定量变量的统计描述_第1页
定量变量的统计描述_第2页
定量变量的统计描述_第3页
定量变量的统计描述_第4页
定量变量的统计描述_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定量变量的统计描述第一页,共三十页,2022年,8月28日对于计量资料如果观察值较少,可直接计算统计描述指标;如果观察值较多,应先进行整理——列出频数表,然后再进行统计描述。第一节频数分布表与频数分布图第二页,共三十页,2022年,8月28日例6.1某地120名健康成人血糖(mmol/L)测定结果如下4.604614.655.864.754.805.814.715.045.254.335.704.945.325.784.854.285.484.484.294.935.214.584.054.114.785.144.154.495.264.384.635.124.955.115.224.665.094.674.685.623.67*5.273.833.914.454.925.354.064.284.405.134.525.125.404.885.015.005.595.534.964.574.835.435.065.334.904.084.485.044.425.235.084.424.235.244.255.625.284.305.024.564.775.375.644.725.164.865.524.334.985.484.964.785.105.315.345.384.504.824.954.554.815.564.554.894.695.194.725.454.154.806.16**5.555.134.865.754.955.064.99第三页,共三十页,2022年,8月28日频数表编制步骤:(1)计算全距

(range):亦称极差,简记为R,R=Xmax-Xmin,本例最大值为6.16,最小值为3.67,故:

R=6.16﹣3.67=2.49(mmol/L)

(2)确定组距:一般分为8~15组。本例:

R=2.49,i=

R/k=2.49/10=0.249(mmol/L)

,

定组距为i=0.20(mmol/L)

比较适宜。(3)确定组限:第一组段应包括最小值;各个组段只包括下限值,不包括上限值;最末一组段应包括最大值,并同时写出其下限和上限。(4)划记,列频数表(见表6-1)第四页,共三十页,2022年,8月28日表6-1某地120名成人血糖的频数分布

血糖(mmol/L)

频数(f)3.6~3.8~4.0~4.2~4.4~4.6~4.8~5.0~5.2~5.4~5.6~5.8~

6.0~6.21269141521181510531合计120(Σf)第五页,共三十页,2022年,8月28日图6-1某地120名健康成人血糖(mmol/L)频数分布图第六页,共三十页,2022年,8月28日图6-2频数分布的三种类型示意图第七页,共三十页,2022年,8月28日频数分布表的用途频数表的用途:1.作为陈述资料的形式,可以替代繁杂的原始资料,便于进一步统计分析。2.揭示资料的分布特征和分布类型。3.便于发现某些特大或特小的可疑值(离群值)。4.当样本量较大时,可以各组段的频率作为概率的估计值。第八页,共三十页,2022年,8月28日第二节描述平均水平的统计指标

统计描述即用恰当的统计指标描述资料的数量特征。计量资料的统计描述分为两个方面:

集中趋势(centraltendency)主要指平均水平离散趋势(tendencyofdispersion)第九页,共三十页,2022年,8月28日平均数(average)

平均数是反映一组同质的数值变量资料的集中趋势或平均水平的指标。常用的平均数有三种:一、算术均数(arithmeticmean,)

二、几何均数(geometricmean,G)

三、中位数(median,M)和百分位数

(percentile,Px)第十页,共三十页,2022年,8月28日一、算术均数(arithmeticmean)

是n个变量值的数值平均值,即各个变量值之和除以变量值的个数。适用于对称分布资料。例测得5名周岁儿童的头围(cm)为:44、45、46、47、48,求其平均头围。(一)直接法:第十一页,共三十页,2022年,8月28日(二)加权法(weightingmethod):当观察值较多时,可先编制频数表(frequencytable),然后用加权法(weightingmethod)计算:一、算术均数(arithmeticmean)第十二页,共三十页,2022年,8月28日

一、算术均数(arithmeticmean)SD=0.482第十三页,共三十页,2022年,8月28日二、几何均数(geometricmean)几何均数是n个变量值的乘积开n次方所得的根。直接法第十四页,共三十页,2022年,8月28日二、几何均数(geometricmean)例7.2有5人的血清中某抗体效价分别为1:10、1:20、1:40、1:80、1:160,求其平均效价。即5人血清中该抗体平均效价为1:40第十五页,共三十页,2022年,8月28日二、几何均数(geometricmean)加权法

第十六页,共三十页,2022年,8月28日例7.340名麻疹易感儿接种疫苗1个月后血凝抑制抗体滴度见表7-3,求平均滴度。第十七页,共三十页,2022年,8月28日本例∑flgx=72.2471,代入公式得:即40名麻疹易感儿接种疫苗1个月后血凝抑制抗体平均滴度为1:64。第十八页,共三十页,2022年,8月28日三、中位数和百分位数中位数(median)

将一组观察值按大小依次排列,位置居中的数即中位数。

第十九页,共三十页,2022年,8月28日三、中位数和百分位数

直接法(计算实例):测得5人的极低密度脂蛋白(VLDL)中的载脂B蛋白含量(mg/dl)分别为:

0.84、2.85、5.46、8.58、9.60M=5.46(mg/dl)如仅测4人:0.84、2.85、8.58、9.60。M=(2.85+8.58)/2=5.72(mg/dl)第二十页,共三十页,2022年,8月28日频数表计算法:例7某地205例伤寒患者潜伏期见下表,求平均潜伏期第二十一页,共三十页,2022年,8月28日频数表计算法:例7.4某地205例伤寒患者潜伏期见表7-4,求平均潜伏期LfMΣfL第二十二页,共三十页,2022年,8月28日LnfiLM----------的各组累积频数小于样本量,即总频数中位数所在组的频数中位数所在组的组距中位数所在组的下限式中:ΣfL第二十三页,共三十页,2022年,8月28日

本例为第4个组段。L=8天,i=2天,f50=50,ΣfL=97。代入式7.1得:故平均潜伏期为8.22天。第二十四页,共三十页,2022年,8月28日百分位数(Percentile,Px)的各组累积频数小于—样本量,即总频数—所在组的频数—所在组的组距—所在组的下限—分位数第—式中:LnPfPiPLxPxxxxx

ΣfL第二十五页,共三十页,2022年,8月28日百分位数的计算实例表某地630名正常女性甘油三脂含量甘油三脂(mg/dl)频数(f)累积频数(Σf)累积频率(1)(2)(3)(4)10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合计630--第二十六页,共三十页,2022年,8月28日根据上表数据计算P25和P75四分位数的计算实例()()()()dlmgPdlmgP/7.135457%756308130130/2.6327%2563016930407525=-+==-.+=.第二十七页,共三十页,2022年,8月28日第二十八页,共三十页,2022年,8月28日学习要点频数表的编制

求全距→定组距→确定组限→划记列表平均数的计算

直接法、加权法(或频数表法)三

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论