03平均数、标准差与变异系数1_第1页
03平均数、标准差与变异系数1_第2页
03平均数、标准差与变异系数1_第3页
03平均数、标准差与变异系数1_第4页
03平均数、标准差与变异系数1_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 平均数是统计学中最常用的统计量,用来表明平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数资料中各观测值相对集中较多的中心位置。平均数主要包括有:主要包括有: 算术平均数算术平均数(arithmetic mean) 中位数中位数(median) 众数众数(mode) 几何平均数几何平均数(geometric mean) 调和平均数调和平均数(harmonic mean) 一、算术平均数一、算术平均数 算术平均数算术平均数是指资料中各观测值的总和除是指资料中各观测值的总和除以观测值个数所得的商,简称以观测值个数所得的商,简称平均数或均数平均数或均数,记为。记为

2、。 算术平均数可根据样本大小及分组情况而算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。采用直接法或加权法计算。 (一一)直接法直接法 主要用于样本含量主要用于样本含量n30以下、未经分组资以下、未经分组资料平均数的计算。料平均数的计算。 设某一资料包含设某一资料包含n个观测值:个观测值: x1、x2、xn, 则样本平均数可通过下式计算:则样本平均数可通过下式计算: 其中,其中,为总和符号;为总和符号; 表示从第一个观测值表示从第一个观测值x1累加到第累加到第n个观测值个观测值xn。当。当 在意义上已明确时,在意义上已明确时,可简写为可简写为x,(,(3-1)式可改写为:)式可改写

3、为: nxnxxxxniin121niix1nxx 【例【例3.1】 某种公牛站测得某种公牛站测得10头成年公牛的体重头成年公牛的体重分别为分别为500、520、535、560、585、600、480、510、505、490(kg),求其平均数。),求其平均数。 由于由于 x=500+520+535+560+58 +600+480+510+505+49 =5285, n=10 得:得: 即即10头种公牛平均体重为头种公牛平均体重为528.5 kg。 (二)加权法(二)加权法 对于样本含量对于样本含量 n30 以上且已分组的资料,可以以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均

4、数,计算在次数分布表的基础上采用加权法计算平均数,计算公式为:公式为: .5(kg)528105285nxxffxfxffffxfxfxfxkiikiiikkk11212211 式中:式中: 第第i组的组中值;组的组中值; 第第i组的次数;组的次数; 分组数分组数 第第i组的次数组的次数fi是权衡第是权衡第i组组中值组组中值xi在资料中在资料中所占比重大小的数量,因此将所占比重大小的数量,因此将fi 称为是称为是xi的的“权权”,加权法也由此而得名。,加权法也由此而得名。 【例【例3.2】 将将100头长白母猪的仔猪一月窝头长白母猪的仔猪一月窝重(单位:重(单位:kg)资料整理成次数分布表如下

5、,)资料整理成次数分布表如下,求其加权数平均数。求其加权数平均数。ixifk 表表31 100头长白母猪仔猪一月窝重次数分布表头长白母猪仔猪一月窝重次数分布表 利用(利用(32)式得:)式得: 即这即这100头长白母猪仔猪一月龄平均窝重为头长白母猪仔猪一月龄平均窝重为45.2kg。 计算若干个来自同一总体的样本平均数的计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权平均数时,如果样本含量不等,也应采用加权法计算。法计算。 )(2 .451004520kgffxx 【例【例3.3】 某牛群有黑白花奶牛某牛群有黑白花奶牛 1500头,头,其平均体重为其平均体重为750

6、kg ,而另一牛群有黑白花,而另一牛群有黑白花奶牛奶牛1200头,平均体重为头,平均体重为725 kg,如果将这,如果将这两个牛群混合在一起,其混合后平均体重为多两个牛群混合在一起,其混合后平均体重为多少?少? 此例两个牛群所包含的牛的头数不等,要此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛计算两个牛群混合后的平均体重,应以两个牛群牛的头数为权,求两个牛群平均体重的加权群牛的头数为权,求两个牛群平均体重的加权平均数,即平均数,即 即两个牛群混合后平均体重为即两个牛群混合后平均体重为738.89 kg。 (三)平均数的基本性质(三)平均数的基本性质 1、样本各观测

7、值与平均数之差的和为零,、样本各观测值与平均数之差的和为零,即即离均差之和等于零离均差之和等于零。 或简写成或简写成)(89.738270012007251500750kgffxx0)(1xxnii0)(xx 2、样本各观测值与平均数之差的平方和为最小,、样本各观测值与平均数之差的平方和为最小,即即离均差平方和为最小离均差平方和为最小。 (xi- )2 (xi- a)2 (常数(常数a ) 或简写为:或简写为: 几何平均数几何平均数调和平均数调和平均数 上述五种平均数,最常用的是算术平均数。上述五种平均数,最常用的是算术平均数。 一、标准差的意义一、标准差的意义 用平均数作为样本的代表,其代表

8、性的强用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。变异程度大小的统计量。 全距(极差)全距(极差)是表示资料中各观测值是表示资料中各观测值变异程度大小最简便的统计量。但是全变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值,距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测值的变异并不能准确表达资料中各观测值的变异程度,比较粗略。

9、当资料很多而又要迅程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以速对资料的变异程度作出判断时,可以利用全距这个统计量。利用全距这个统计量。 为为 了了 准准 确确 地地 表示样本内各个观测值的变异表示样本内各个观测值的变异程度程度 ,人们,人们 首首 先会考虑到以平均数为标准,求先会考虑到以平均数为标准,求出各个观测值与平均数的离差,(出各个观测值与平均数的离差,( ) ,称,称为为离均差离均差。 虽然离均差能表示一个观测值偏离平均数的虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负性质和程度,但因为离均差有正、有负 ,离均,离均差之和差之和 为零

10、,即(为零,即( ) = 0 ,因,因 而而 不不 能能 用用离均差之和离均差之和( )来)来 表表 示示 资料中所有观测资料中所有观测值的总偏离程度。值的总偏离程度。 xxxxxx 为了解决离均差有正为了解决离均差有正 、有负,离均差之、有负,离均差之和为零的问和为零的问 题题 , 可先求可先求 离离 均均 差的绝差的绝 对对 值值 并并 将将 各各 离离 均均 差差 绝对绝对 值值 之之 和和 除以除以 观观 测测 值值 个个 数数 n 求求 得得 平平 均均 绝绝 对对 离差,即离差,即| |/n。虽然平均绝对离差可以表示资料。虽然平均绝对离差可以表示资料中各观测值的变异程度中各观测值的

11、变异程度 ,但由于平均绝对,但由于平均绝对离差包含绝对值符号离差包含绝对值符号 ,使用很不方便,在,使用很不方便,在统计学中未被采用。统计学中未被采用。xx 我们还可以采用将离均差平方的办法来解决我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。离均差有正、有负,离均差之和为零的问题。 先将各先将各 个离个离 均差平方,即均差平方,即 ( )2 ,再求,再求 离离均差平方和均差平方和 , 即即 ,简称,简称平方和平方和,记为,记为ss; 由由 于于 离差平方和离差平方和 常常 随随 样样 本本 大大 小小 而而 改改 变变 ,为,为 了了 消消 除除 样样 本大小本

12、大小 的的 影影 响响 , 用平方用平方和和 除除 以以 样样 本本 大大 小,小, 即即 ,求出离均差,求出离均差平方和的平均数平方和的平均数 ;xx2)(xx nxx/)(2 为了使所得的统计量是相应总体参数的无为了使所得的统计量是相应总体参数的无 偏偏估计量,统计学证明,在求离均差平方和的平均估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量数时,分母不用样本含量n,而用自由度,而用自由度 n-1, 于是,我们于是,我们 采采 用统计量用统计量 表示资料的表示资料的变异程度。变异程度。 统计量统计量 称称 为为 均均 方方 ( mean square缩写为缩写为ms),又称

13、又称样本方差样本方差,记为记为s2,即,即 s2= 1/)(2nxx1/)(2nxx1/)(2nxx 相应的总体参数叫相应的总体参数叫 总体方差总体方差 ,记,记为为2。对于有限总体而言,。对于有限总体而言,2的计算的计算公式为:公式为: nxx/)(22 由于由于 样本方差样本方差 带有原观测单位的带有原观测单位的 平平方单位,在仅表示一个资料中各观测值方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时的变异程度而不作其它分析时 , 常需要常需要与平均数配合使用与平均数配合使用 ,这,这 时应时应 将平方单位将平方单位还原,即应求出样本方差的平方根。统还原,即应求出样本方差的平方根

14、。统计学上把样本方差计学上把样本方差 s2 的平方根叫做的平方根叫做样本样本标准标准 差差,记为,记为s,即:,即: 1)(2nxxs 由于由于 所以上式可改写为:所以上式可改写为: )2()(222xxxxxx222xnxxx222)()(2nxnnxxnxx22)(12)(2nxsnx 相应的总体参数叫相应的总体参数叫总体标准差总体标准差,记为,记为。对于有限总体而言,。对于有限总体而言,的计算公式为:的计算公式为: 在统计学中,常用样本标准差在统计学中,常用样本标准差s估计估计总体标准差总体标准差。 nx/)(2二、标准差的计算方法二、标准差的计算方法 (一)直接法(一)直接法 对于未分

15、组或小样本资料对于未分组或小样本资料 , 可直可直接利用(接利用(311)或()或(3-12)式来计算)式来计算标准差。标准差。 【例【例3.9】 计算计算10只辽宁绒山羊产绒量:只辽宁绒山羊产绒量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600,650(g)的标准差。)的标准差。 此例此例n=10,经计算得:,经计算得:x=5400,x2=2955000,代入(,代入(312)式得:)式得: 即即10只辽宁绒山羊产绒量的只辽宁绒山羊产绒量的 标准差标准差 为为65.828g。828.6511010/540029550001/)(222nnxx

16、s (二)加权法(二)加权法 对于已制成次数分布表的大样本资料,可对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。计利用次数分布表,采用加权法计算标准差。计算公式为:算公式为: 式中,式中,f为各组次数;为各组次数;x为各组的组中值;为各组的组中值;f = n为总次数。为总次数。 1/)(1)(222fffxfxfxxfs 【例【例3.10】 利用某纯系蛋鸡利用某纯系蛋鸡200枚蛋重资料枚蛋重资料的次数分布表(见表的次数分布表(见表3-4)计算标准差。)计算标准差。 将表将表3-4中的中的f、fx、 代入(代入(314)式)式得:得: 即某即某 纯纯 系系 蛋蛋 鸡鸡

17、200枚枚 蛋蛋 重的标准差为重的标准差为3.5524g。5524. 31200200/1.1070511.5755071/)(222fffxfxs2fx 表表34 某纯系蛋鸡某纯系蛋鸡200枚蛋重资料次数分布枚蛋重资料次数分布 及标准差计算表及标准差计算表 三、标准差的特性三、标准差的特性 (一)(一)标准差的大小,受资料中每个观测值的影响,标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。如观测值间变异大,求得的标准差也大,反之则小。 (二)(二)在计算标准差时,在各观测值加上或减去一在计算标准差时,在各观测值加上或减去一个常数,其数值不变。个常数,其数

18、值不变。 (三)(三)当每个观测值乘以或除以一个常数当每个观测值乘以或除以一个常数a,则所,则所得的标准差是原来标准差的得的标准差是原来标准差的a倍或倍或1/a倍。倍。 (四)(四)在资料服从正态分布的条件下,资料在资料服从正态分布的条件下,资料中约有中约有68.26%的观测值在平均数左右一倍标的观测值在平均数左右一倍标准差(准差( s)范围内;约有)范围内;约有95.43%的观测值的观测值在平均数左右两倍标准差(在平均数左右两倍标准差( 2s)范围内;)范围内;约有约有99.73%的观测值在平均数左右三倍标准的观测值在平均数左右三倍标准差(差( 3s) 范范 围内。也就是说全距近似地围内。也就是说全距近似地等于等于6倍标准差,可用(全距倍标准差,可用(全距/6)来粗略估计)来粗略估计标准差。标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论