第4章 数据分布特征的测定_第1页
第4章 数据分布特征的测定_第2页
第4章 数据分布特征的测定_第3页
第4章 数据分布特征的测定_第4页
第4章 数据分布特征的测定_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第4章数据分布特征的测度,4.1集中趋势的测度4.2离散程度的测度4.3偏态与峰态的测度,4.1集中趋势的测度,一.众数二.中位数和分位数三.均值四.众数、中位数和均值的比较,集中趋势(centraltendency),一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值,众数(mode),集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数,众数(不唯一性),无众数原始数据:10591268,一个众数原始数据:659855,多于一个众数原始数据:252828364242,1、由单项数列求众数某车间工人日

2、产情,2.由组距数列计算,首先确定次数最多的组,即众数组,然后,用公式计算。,下限公式:,上限公式:,中位数(median),排序后处于中间位置上的值,不受极端值的影响,1、由未分组资料计算中位数,设有六个工人的日产量(件)依次排列为10、11、12,13、14、15、则:,中位数位次(n+1)26+123.5,(1)由单项数列求中位数,2、由分组资料计算中位数:,例10:某生产车间120名工人生产某种零件的日产量如下表所示,计算该车间工人日产量的中位数。,2.由组距数列求中位数,下限公式:,L为中位数所在组下限,为中位数所在组以前各组的累计次数(较小制),为中位数所在组的次数,上限公式:,U

3、为中位数所在组上限,为中位数所在组以后各组的累计次数(较大制),从某单位抽查800户,取得人均收入资料如下表,计算该单位人均收入的中位数。,中位数位次f28002400,中位数组在700-800这一组中。由下限公式,由上限公式,四分位数(quartile),1.排序后处于25%和75%位置上的值,四分位数,未分组数据:,均值(mean),1.集中趋势的最常用的测度值2.一组数据的均衡点所在3.易受极端值的影响,简单算术平均数(simplemean),加权算术平均数(weightedmean),设一组数据为:x1,x2,xn相应的频数为:f1,f2,fk,(例题分析),(权数对均值的影响)P34

4、,甲组:考试成绩(x):020100人数分布(f):118乙组:考试成绩(x):020100人数分布(f):811,算术平均数(数学性质),1.各变量值与均值的离差之和等于零,2.各变量值与均值的离差平方和最小,调和平均数(harmonicmean),1.均值的另一种表现形式,原来只是计算时使用了不同的数据!,调和平均数,【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格,几何平均数(geometricmean),1.n个变量值乘积的n次方根2.适用于对比率数据的平均3.主要用于计算平均增长率,【例】一位投资者持有一种股票,1996年、1997年、1998年和1999

5、年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。,平均收益率103.84%-1=3.84%,众数、中位数和均值的比较,众数、中位数和均值的关系,众数、中位数和均值的特点和应用,众数不受极端值影响具有不唯一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用,分布离散程度的测度,一、极差二、内距三、方差和标准差四、离散系数,极差(range),一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布,R=max(xi)-min(xi),内距(In

6、ter-QuartileRange,IQR),也称四分位差上四分位数与下四分位数之差内距=Q3Q1反映了中间50%数据的离散程度不受极端值的影响可用于衡量中位数的代表性,方差和标准差,方差和标准差(VarianceandStandarddeviation),离散程度最常用的测度值反映了各变量值与均值的平均差异,总体方差和标准差(PopulationvarianceandStandarddeviation),未分组数据:,组距分组数据:,样本方差和标准差(simplevarianceandstandarddeviation),未分组数据:,组距分组数据:,样本方差P34自由度(degreeoff

7、reedom),一组数据中可以自由取值的数据的个数当样本数据的个数为n时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他,离散系数,离散系数(coefficientofvariation),1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较,【例】某管理局抽查了所属的8家企业,其产品销售

8、数据如表。试比较产品销售额与销售利润的离散程度,结论:计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度,计算分析题,1.某厂400名职工工资如下,根据上述资料计算该厂职工平均工资和标准差。,解:,2.某县去年年粮食产量资料如下:,根据上表资料计算该县粮食作物平均单位面积产量。,解:,3.某地甲、乙两个农贸市场三种主要蔬菜价格及销售资料如下:,比较该地区哪个农贸市场蔬菜平均价格高?并说明原因。,解:,4.某工厂生产一批零件共10万件,为了解这批产品的质量,采取不重复抽样的方法抽取1000件进行检查,其结果如下,根据质量标准,使用寿命800小时及以上者为合格品。计算平均合格率、标准差及标准差系数。,5、甲、乙两单位工人的生产资料如下:,(1)哪个单位工人的生产水平高?(2)哪个单位工人的生产水平整齐?,6.甲、乙两班同时对统计学课程进行测试,甲班平均成绩为70分,标准差为9.0分;乙班的成绩分组资料如下:,计算乙班学生的平均成绩,并比较甲、乙两班哪个班的平均成绩更有代表性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论