离散型趋势PPT课件_第1页
离散型趋势PPT课件_第2页
离散型趋势PPT课件_第3页
离散型趋势PPT课件_第4页
离散型趋势PPT课件_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 这三组数据的均数都是这三组数据的均数都是3030,集中水平是一样的,集中水平是一样的,但是三组的分布不一样,也就是离散程度不同。但是三组的分布不一样,也就是离散程度不同。A A和和B B的数据分布均匀,但的数据分布均匀,但B B的散布范围大于的散布范围大于A A;C C的数的数据分布不均匀,两头分散,中间集中,散布范围与据分布不均匀,两头分散,中间集中,散布范围与A A相同。因此,要全面把握数据的分布特点,不仅相同。因此,要全面把握数据的分布特点,不仅需要了解数据的集中位置,还要了解数据的离散状需要了解数据的集中位置,还要了解数据的离散状况。况。 24 26 28 30 32 34 36AB

2、C第1页/共25页 表示变异程度常用的指标有:极差、四分位数间表示变异程度常用的指标有:极差、四分位数间距、方差及标准差。距、方差及标准差。1 1 极差(极差(rangerange,R R):):就是这一组数据的全距,可以反映就是这一组数据的全距,可以反映个体变异的范围。适用于数量较少,内部分布较均匀的资料个体变异的范围。适用于数量较少,内部分布较均匀的资料。试计算。试计算A A、B B、C C三组数据的极差。如:三组数据的极差。如:A A和和B B的数据。特点是的数据。特点是:简单明了,但粗略、不稳定。由于仅考虑到两个极端值,:简单明了,但粗略、不稳定。由于仅考虑到两个极端值,当样本含量较大

3、的情况下,这种缺点更加暴露出来。当样本含量较大的情况下,这种缺点更加暴露出来。离散趋势指标(续)离散趋势指标(续)第2页/共25页离散趋势指标(续)离散趋势指标(续) 2 2 四分位数间距(四分位数间距(quartile rangequartile range,Q Q):):上节已经上节已经接触到百分位数的概念。四分位数间距定义是接触到百分位数的概念。四分位数间距定义是Q=Q=P P7575-P-P2525 实际上,就是中间一半变量值的全距,反映了居中数值实际上,就是中间一半变量值的全距,反映了居中数值50%50%个体的散布范围。与全距相比,稳定性较好,因它舍个体的散布范围。与全距相比,稳定性

4、较好,因它舍去了两头不太稳定的变量值的影响。可以用于各种类型的去了两头不太稳定的变量值的影响。可以用于各种类型的连续性变量资料,但主要用于偏态分布数据的描述,与中连续性变量资料,但主要用于偏态分布数据的描述,与中位数的数据相对应。试计算以下资料中伤寒患者潜伏期的位数的数据相对应。试计算以下资料中伤寒患者潜伏期的四分位数间距。四分位数间距。第3页/共25页第4页/共25页四分位数间距四分位数间距 首先找到首先找到P75P75所在的组段,即累计频数百分比超出所在的组段,即累计频数百分比超出75%75%的组段,在本例为的组段,在本例为”1010 “组段,故组段,故L=10L=10,f75=40f75

5、=40,i=2i=2,n=178n=178, 代入公式:代入公式: 然后找到然后找到P25P25所在组段,本例为所在组段,本例为”6 6 “组段,组段,故故L=6L=6,f25=36f25=36,i=2i=2,n=178n=178, 代入公代入公式:式: Q=P75-P25=10.33-6.08=4.25Q=P75-P25=10.33-6.08=4.25(天)(天)127Lf 2( * %)10(178*75% 127)10.33()40XLxiPLn xff天43Lf 2( * %)=6+%=36XLxiPLn xff(178*25-43)6.08(天)第5页/共25页离散趋势指标(续)离散

6、趋势指标(续) 3 3 方差(方差(variancevariance):):极差和四分位数间距极差和四分位数间距因代表性差,一般只用于偏态分布等不适合计因代表性差,一般只用于偏态分布等不适合计算算术均数的资料的变异程度大小,对于正态算算术均数的资料的变异程度大小,对于正态分布的资料,可以考虑每一个观察值与均数的分布的资料,可以考虑每一个观察值与均数的差值,这样就可以避免极差和四分位数间距的差值,这样就可以避免极差和四分位数间距的缺陷。缺陷。 那么能否用每一个观察值与均数之差的总和,那么能否用每一个观察值与均数之差的总和,即即 来表示变异程度的大小呢?来表示变异程度的大小呢?(X-X)第6页/共

7、25页方方 差差 因此,考虑把每个观察值的离均差 平方后再求和,即 ,称离均差平方和,这样就避免了正负相消的问题。但离均差平方和的大小除了与变异程度大小有关外,还与观察值的个数有关。观察值的个数越多,则 就越大。用 除以观察值的个数所得到的值就称为离均差的平方,简称均方,又称为方差(variance)。方差就是表示变异程度较好的指标,方差愈小,说明观察值的变异程度愈小。(X-X)2( X-X)2(X-X)2(X-X)第7页/共25页总总 体体 方方 差差为了全面考虑观察值的变异情况,衡量总体(正态分布)中为了全面考虑观察值的变异情况,衡量总体(正态分布)中每一个变量值每一个变量值X X与均数与

8、均数的差距,即(的差距,即(X X-),称为),称为“离均离均差差”。那么变异总和,即。那么变异总和,即(X X-),称为),称为“离均差总和离均差总和”,由于由于(X X-)=0=0(理论上),不能进行描述应用,而采用(理论上),不能进行描述应用,而采用(X X-)2 2,称为,称为“离均差平方和离均差平方和”,再考虑到变量值个,再考虑到变量值个数数N N(平均分配变异度),就得到了总体方差即:(平均分配变异度),就得到了总体方差即:第8页/共25页样样 本本 方方 差差 在实际应用时,总体均数往往未知,常常得到的是样本的数据,在实际应用时,总体均数往往未知,常常得到的是样本的数据,因此,以

9、因此,以 来代替来代替 ,得到的就是样本方差即:,得到的就是样本方差即: 由于用样本计算得到的数值偏小,为了较好地估计总体,分母用由于用样本计算得到的数值偏小,为了较好地估计总体,分母用n-1n-1代替代替N N进行校正。这里的上进行校正。这里的上n-1n-1又称为自由度(又称为自由度(degree of degree of freedomfreedom)。为了便于计算,将方差变换为:)。为了便于计算,将方差变换为: 第9页/共25页 离散趋势指标(续)离散趋势指标(续)4 4 标准差(标准差(standard deviationstandard deviation):):方差说明观察值的变异

10、程度,方差说明观察值的变异程度,其优点是全面考虑了一组观察值中每一个数据,缺点是将观察值其优点是全面考虑了一组观察值中每一个数据,缺点是将观察值的单位进行了平方,不便于实际应用中解释其含义。标准差就是的单位进行了平方,不便于实际应用中解释其含义。标准差就是一个反映变异程度的统计指标,由于它是以正态分布为前提推算一个反映变异程度的统计指标,由于它是以正态分布为前提推算出来的,因此,它适用于与算术均数相同条件的资料分布类型,出来的,因此,它适用于与算术均数相同条件的资料分布类型,与算术均数结合起来,描述一组正态分布资料的基本特征。标准与算术均数结合起来,描述一组正态分布资料的基本特征。标准差小,变

11、异度小,分布集中,均数的代表性好。计算公式:差小,变异度小,分布集中,均数的代表性好。计算公式: 2()1XXSn第10页/共25页标准差的计算方法标准差的计算方法1.1.直接法:小样本未分组资料可以直接用公式求直接法:小样本未分组资料可以直接用公式求标准差,但实际工作中,为了便于计算,常用以标准差,但实际工作中,为了便于计算,常用以下推导公式:下推导公式:22() /1XXnSn第11页/共25页 测定了测定了5 5名健康成人血糖值分别为名健康成人血糖值分别为5.865.86、5.325.32、4.054.05、4.954.95、3.833.83(mmol/Lmmol/L) 本例本例 , ,

12、n=5n=5,代入公式:代入公式:24.01X 2118.22X222() /118.2224.01 /5=0.8515 1XXnSn(mmol/L)第12页/共25页标准差的计算方法标准差的计算方法2.2.加权法:大样本资料先列频数表,然后按下式计加权法:大样本资料先列频数表,然后按下式计算标准差。算标准差。22() /1fXfXfSf第13页/共25页表表2-1 2-1 某山区某山区100100名健康成年男性身高测量名健康成年男性身高测量结果结果168.5170.0172.5165.0175.5155.5157.0180.0179.5161.5175.0175.0167.0171.5171

13、.0172.5168.5168.0159.5164.0167.0162.0176.0177.5166.0167.5165.0175.5169.0173.5167.5172.0168.5165.5161.0175.5165.0169.5166.5158.0160.0168.5178.5172.0160.0170.0167.0146.5155.0170.5170.0175.0172.0165.0156.5162.0168.5165.0159.0170.5162.0162.5167.5166.0157.5163.5169.0155.5167.5169.0165.0184.0168.0160.0179

14、.5150.0165.0173.0168.0152.0170.0165.0173.0156.0167.5161.0176.5171.5162.0158.0164.0154.5168.5158.0163.5170.0162.5166.0152.5160.0第14页/共25页根据上表资料求根据上表资料求100100名健康成年男性身高(名健康成年男性身高(cmcm)的标准差。)的标准差。首先列出频数表,然后分别计算出首先列出频数表,然后分别计算出 , 和和 ,然后代入公式即可:本例。,然后代入公式即可:本例。fX2fXf222() /2784480.0 16672.0 /1007.11100 1fX

15、fXfSf(cm)第15页/共25页表表2-3 1002-3 100名健康成年男性身高的均数名健康成年男性身高的均数计算(加权法)计算(加权法) 身高()身高()频数(频数(f )组中值(组中值(X0)fX0fX02146.01148.0148.021 904.0150.03152.0456.069 312.0154.08156.01248.0194 688.0158.012160.01920.0307 200.0162.019164.03116.0511 024.0166.025168.04200.0705 600.0170.018172.03096.0532 512.0174.09176.

16、01584.0278 784.0178.04180.0720.0129 600.0182.0186.01184.0184.033 856.0合计合计100( f)-16 672.0(fX)2 784 480.0(fX2)第16页/共25页标准差的应用标准差的应用 1.1.表示一组观察值的离散程度。两组或多组表示一组观察值的离散程度。两组或多组观察值在单位相同,均数相等或近似的条件下,观察值在单位相同,均数相等或近似的条件下,标准差较大的那一组,说明观察值的离散程度标准差较大的那一组,说明观察值的离散程度较大,即观察值围绕均数的分布较离散,均数较大,即观察值围绕均数的分布较离散,均数的代表性较差

17、;反之,均数的代表性好。在医的代表性较差;反之,均数的代表性好。在医学文献上常用均数加减标准差(学文献上常用均数加减标准差( )的形)的形式,表示资料的平均水平和离散程度。式,表示资料的平均水平和离散程度。XS第17页/共25页标准差的应用标准差的应用 2.2.用标准差计算变异系数,当两组观察值单位不同,或用标准差计算变异系数,当两组观察值单位不同,或两组均数相差较大时,不能直接用标准差比较其离散程两组均数相差较大时,不能直接用标准差比较其离散程度的大小,这是则要用变异系数(度的大小,这是则要用变异系数(coefficient of coefficient of variationvariat

18、ion,CVCV)作比较。其计算公式为:)作比较。其计算公式为:100%SCVX和标准差一样,变异系数愈小,说明该组观察值的离散程度愈小,变异和标准差一样,变异系数愈小,说明该组观察值的离散程度愈小,变异系数愈大,说明离散程度愈大。系数愈大,说明离散程度愈大。第18页/共25页 例:测得某地56名7岁男童身高均数为121.16cm,标准差为4.32cm;胸围均数为57.71cm,标准差为2.82cm,试比较两个指标的变异程度。 从标准差来看,该人群身高的变异大于胸围的变异,但这可能只是一种假象,因为身高的均数远大于胸围的均数。标准差反映的是各观察值与均数之间平均的绝对差值,但对于不同的指标而言

19、,相同的差值意义却不同。当两均数相差较大时,相对指标比绝对指标能更好地反映变异程度大小。第19页/共25页本例,分别求的身高和胸围的变异系数为:本例,分别求的身高和胸围的变异系数为:身高:身高:CV1=4.31/121.76CV1=4.31/121.76100%=3.56%100%=3.56%胸围:胸围:CV2=2.82/57.71CV2=2.82/57.71100%=4.89%100%=4.89%即胸围的变异程度大于身高的变异程度。即胸围的变异程度大于身高的变异程度。第20页/共25页 3.3.用标准差估计观察值的频数分布情况,当观察用标准差估计观察值的频数分布情况,当观察值呈正态分布时,可用均数说明其平均水平,标值呈正态分布时,可用均数说明其平均水平,标准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论