第2章 数值变量资料的统计描述课件_第1页
第2章 数值变量资料的统计描述课件_第2页
第2章 数值变量资料的统计描述课件_第3页
第2章 数值变量资料的统计描述课件_第4页
第2章 数值变量资料的统计描述课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章

数值变量资料的统计描述

第一节频数分布表和频数分布图第二节计量资料的常用统计指标第2章数值变量资料的统计描述学习目标说出频数表的编制方法,频数分布的两种趋势学会数值变量资料常用指标(平均水平、离散程度)的计算方法描述正态分布的基本特征与内容,了解医学参考值范围的估计方法第2章数值变量资料的统计描述第一节数值变量资料的频数表频数表的概念频数表的编制第2章数值变量资料的统计描述一、频数表的概念

所谓频数就是观察值的个数。频数分布就是观察值在其所取值的范围内,于各组段中分布的情况。所谓频数表是指一种统计表:即同时列出观察值的可能取值及其出现频数。具体作法是,先根据观察值数量大小进行分组第2章数值变量资料的统计描述二、频数表的编制步骤

计算全距,用R表示。确定组段数、组距划分组段设计划记表归纳计数第2章数值变量资料的统计描述

第二节集中趋势的指标算术均数(均数)几何均数中位数第2章数值变量资料的统计描述一、算术均数适用资料类型:适用于观察值呈正态分布或对称分布的数值变量资料。

第2章数值变量资料的统计描述直接计算法(观察个数不多时)=第2章数值变量资料的统计描述加权法(当观察值个数较多或观察值为频数表资料时)

=第2章数值变量资料的统计描述简捷法(当观察值个数较多,同时数值又较大时)第2章数值变量资料的统计描述

用简捷计算法求算术均数和标准差适用的资料类型:样本含量大,且数值较大的频数表资料第2章数值变量资料的统计描述表1120名12岁健康男孩身高(cm)均数的计算简捷法组段(1)组中值(2)频数f(3)d=(x-x0)/i

(4)fd(5)=(3)×(4)125~1271-4-4129~1314-3-12133~1359-2-18137~13928-1-28141~143(x0)350014515111222153~1554312157~161159144合计120(∑f))3(∑fd)第2章数值变量资料的统计描述1.假定均数的选择:一般选频数较多,且位置比较居中的组中值。2.求缩减值dd=(x-x0)/i3.公式:x=x0+∑fd/∑f×i本例:x=x0+∑fd/∑f×i

=143+3/120×4=143.10第2章数值变量资料的统计描述表2120名12岁健康男孩身高(cm)标准差的计算简捷法组段(1)组中值(2)频数f(3)d=(x-x0)/i

(4)fd(5)=(3)×(4)Fd2(6)=(4)×(5)125~1271-4-416129~1314-3-1236133~1359-2-1836137~13928-1-2828141~143(x0)35000145~1472712727149~1511122244153~155431236157~16115914416合计120(∑f)3(∑fd)239(∑fd2)第2章数值变量资料的统计描述二、几何均数

适用资料类型:观察值呈对数正态分布或观察值为等比数列(如血清抗体滴度)的资料第2章数值变量资料的统计描述(一)直接法第2章数值变量资料的统计描述对数形式即第2章数值变量资料的统计描述(二)加权法当观察值个数较多或观察值为频数表资料,可用加权法求几何均数,即

第2章数值变量资料的统计描述三、中位数和百分位数

中位数(median)是一组按大小顺序排列的观察值,其位次居中的数值,以M表示。当一组观察值中,大部分比较集中而少数数值偏向一侧时,或资料的分布情况不清楚,或观察值一端(或两端)无确定数值,均可用中位数表示其集中趋势。第2章数值变量资料的统计描述百分位数以符号Px表示。用于描述一组观察值在某百分位置上的水平。如P5为5%分位数,表示有5%个观察值小于它,有95%个观察值大于它;P95为95%分位数,表示有95%个观察值小于它,有5%个观察值大于它。也可用一组百分位数来描述总体或样本的分布特征。如P2.5~P97.5,除表示资料2.5%位置上和97.5%位置上的水平外,还表示有95%个观察值分布在这个范围内。

第2章数值变量资料的统计描述第三节

离散程度指标

全距四分位数间距方差标准差变异系数第2章数值变量资料的统计描述(一)全距全距(range)又称极差,以R表示,是一组观察值中最大值与最小值的差。用全距来说明变异程度的大小,其优点是简单明了,如用于说明传染病、食物中毒的最短、最长潜伏期等。缺点是仅考虑了资料的最大值和最小值,不能反映组内其它数据的变异程度,因此用全距表示变异程度并不理想

第2章数值变量资料的统计描述(二)四分位数间距用符号Q表示,它可以通过计算百分位数P75和P25之差得到,即Q=P75-P25。四分位数间距越大,说明数据的变异越大;反之,四分位数间距越小说明变异越小。用四分位数间距作为说明离散程度的指标,与全距相比不易受极端值的影响,但仍未考虑到每一个具体观察值的变异度,因此用四分位数间距表示变异程度亦不理想。第2章数值变量资料的统计描述(三)方差用(样本)或σ2(总体)表示。方差愈小,说明观察值的变异程度愈小;方差愈大,说明变异程度愈大。第2章数值变量资料的统计描述(四)标准差是离均差平方和与自由度之商的算术平方根。标准差愈小,说明观察值的变异程度愈小;标准差愈大,说明变异程度愈大。第2章数值变量资料的统计描述标准差的计算方法1.直接法

第2章数值变量资料的统计描述2.加权法将资料进行分组,制成频数表再计算标准差则较为方便。第2章数值变量资料的统计描述3.简捷法第2章数值变量资料的统计描述

第四节正态分布及其应用

正态分布的概念正态分布的特征

正态分布的应用

第2章数值变量资料的统计描述一、正态分布的概念及特征

正态分布(normaldistribution)又称高斯分布(Gaussiandistribution),是一种很重要的连续型分布,应用甚广

略呈钟型,两头低,中间高,左右对称,近似于数学上的正态分布。第2章数值变量资料的统计描述二、正态曲线下面积的分布规律

正态分布曲线下与横轴之间的整个面积为1或100%。μ±1σ范围内的面积占正态曲线下总面积的68.27%,即有68.27%的观察值分布在此范围内;μ±1.96σ范围内的面积占正态曲线下总面积的95.00%,即有95.00%的观

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论