管理里统计学3统计资料的综合_第1页
管理里统计学3统计资料的综合_第2页
管理里统计学3统计资料的综合_第3页
管理里统计学3统计资料的综合_第4页
管理里统计学3统计资料的综合_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

表示统计资料的特征数有哪些?几何平均数与调和平均数各适合于什么情况?计算样本方差与总体方差公式有何区别?集中位置分散程度偏倚程度3.1表示集中位置的特征数3.1.1平均数算术平均数(Arithmeticaverage)几何平均数(GeometricMean)调和平均数定义:一组n个观测值x1,x2,…,xn的算术平均数,定义为(1)算术平均数(Arithmeticaverage)如果资料已经分组,组数为k,用x1,x2,…,xk

表示各组中点,f1,f2…,fk

表示相应的频数,那么(1)算术平均数(Arithmeticaverage)表3-1某校125位大学一年级新生体重表体重(公斤)组中值(x)

人数(f)46—4847449—51502052—54532555—57563858—60592161—63621264—66655(1)算术平均数(Arithmeticaverage)其平均体重:===55.592(1)算术平均数(Arithmeticaverage)

当时最小

性质(1)算术平均数(Arithmeticaverage)在数据为环比类型的问题中,算术平均数是不适用的。例如下表是天津市工业总产值在“十五”期间的逐年增长率,如求该期间平均增长率,算术平均数是不恰当的。几何平均数可以解决这个问题。(2)几何平均数(GeometricMean)表3-2天津市工业总产值年份比上年增长%2000200114.0200219.6200324.1200431.0200520.8(天津市2005统计年鉴)

(2)几何平均数(GeometricMean)定义:一组n个数据的几何平均数定义为在上式中,依次为114.0,119.6,124.1,十五期间天津市工业总产值年均增长率为21.8%。131.0,120.8于是几何平均数:(2)几何平均数(GeometricMean)当数据是相对变化率,求平均数时,算术平均数也不恰当。例如:甲乙两地相距120公里,某人乘车往返甲乙两地之间,去时速度每小时20公里,回来时速度为每小时30公里,若求平均速度,这时用算术平均数是不对的,但调和平均数可解决此类问题。(3)调和平均数在上例中,(公里/小时)定义:一组n个数据的调和平均数H,由下式定义(3)调和平均数算术平均数、调和平均数、几何平均数是三种不同形式平均数,分别有各自的应用条件

进行统计研究时,适宜采用算术平均数时就不能用调和平均数或几何平均数,适宜用调和平均数时,同样也不能采用其他两种平均数。但从数量关系来考虑,如果用同一资料(变量各值不相等):调和平均数≤几何平均数≤算术平均数算术平均数表示了集中位置特征,它照顾到每一个值,但它不见得是出现次数最多的值(甚至也可能不是观测值中的一个)。所以有必要研究表示集中位置的其它的特征数。3.1.2众数(Mode)定义:对于有频数分布的变量,它的众数指频数最大的变量的值表3-3频数分布表Xf3155273对于已分组且等组距的频数分布,根据最大频数,可求得众数所在组。根据众数定义,可知众数不唯一。3.1.2众数(Mode)算术平均数作为集中位置的特征还有一缺点,就是受观测值中极端值的影响很大,而一组观测值中的极端值常常没有代表性。中位数将避免这种影响。3.1.3中位数(Median)

一组n个观测值按数值大小排列,处于中央位置的值称为中位数以表示,,当n为奇数,当n为偶数定义:即3.1.3中位数(Median)性质:一组观测值中小于Me的个数和大于Me的个数相等。当最小第25百分位数又称第一个四分位数(FirstQuartile),用Q1表示;第50百分位数又称第二个四分位数(SecondQuartile),用Q2表示;第75百分位数又称第三个四分位数(ThirdQuartile),用Q3表示。中位数是第50百分位数一组n个观测值按数值大小排列如x1,x2,x3,x4…处于p%位置的值称第p百分位数。定义:3.1.4百分位数(Percentile)计算第p百分数第1步:以递增顺序排列原数据(即从小到大排列)。第2步:计算指数

第3步1.若i不是整数,将i向上取整。大于I的毗邻整数为第p百分位数的位置。2.若i是整数,则第P百分位数是第i项与第(i+l)项数据的平均值。如何计算百分位数2210225523502380238023902420244024502550263028253.1.4四分位数(quartile)数据的变异程度产品质量检查的结果说明生产是否稳定测量的结果说明测量方法或仪器是精密还是粗糙学生的成绩成绩是否整齐(而不是高低)3.2表示变异(分散)程度的特征数定义

其中xmax和xmin分别为数据中的极大值和极小值。3.2.1极差(或称全距Range)R对于已分组的频数分布(组数为k)定义平均差M.D.是离差的绝对值的平均数,即3.2.2平均差(MeanAbsoluteDeviation)方差

样本

对于已分组的频数分布(组数为k)总体

样本

总体

3.2.3方差(Variance),标准差(Standard

Deviation)标准差样本标准差总体标准差样本标准差总体标准差对于已分组的频数分布(组数为k)标准差的单位与X的单位相同。3.2.3方差(Variance),标准差(Standard

Deviation)定义变异系数C是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。3.2.4变异系数(CoefficientofVariation)3.3.1比较众数、中位数和算术平均数的相对位置

下图列举出了对称的、具有左偏态(负偏态)和右偏态(正偏态)的频数分布的例子。注意到它们的特点是:①对称的分布的众数、中位数和算术平均数相同;②具有偏倚性的分布,算术平均数突出在外,偏向分布的尾端,而中位数则介于众数与算术平均数之间。偏倚性是表示各观测值分布不对称情况或程度的。3.3表示偏倚情况或程度的特征数

图3-13.3.1比较众数、中位数和算术平均数的相对位置>Me>Mo<Me<Mo

=Me=Mo可以看出,对于单峰的分布,对称态:左偏态:右偏态:3.3.1比较众数、中位数和算术平均数的相对位置(1)Pearson偏倚系数Pearson分布对称,则k=0左偏态,则k<0右偏态,则k>03.3.2定量地描述偏倚性,常用的两个公式(2)用标准化的三阶矩阵g表示3.3.2定量地描述偏倚性,常用的两个公式

3.4五数概括法五数概括法(2)第1四分位数(Q1)。(3)中位数(Q2)。(4)第3四分位数(Q3)。(5)最大值。(1)最小值。首先将数据按递增顺序排列,然后很容易就能确定最小值、3个四分位数和最大值了。对12个月薪数据的样本,按照递增顺序排列如下:221022552350|238023802390|242024402450|255026302825Q1=2365Q2=2405Q3=2500上述起薪数据以五数概括为:2210,2365,2405,2500,2825。3.4五数概括法盒形图实际上是以图形来概括数据。我们将盒形图延至这一章才讲是因为它的关键是计算中位数和四分位数Q1和Q3。此外还将用到四分位数间距IQR=Q3-Q1

。盒形图的画法步骤如下:

(1)画一个方盒,其边界恰好是第1和第3四分位数。对于上述的起薪数据,Q1=2365,Q3=2500。这个方盒包含了中间的50%的数据。(2)在方盒上中位数的位置画一条垂线(对起薪数据,中位数为2405)。因此中位数将数据分为相等的两个部分。3.5盒形图(3)利用四分位数间距IQR=Q

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论