离中趋势的测度_第1页
离中趋势的测度_第2页
离中趋势的测度_第3页
离中趋势的测度_第4页
离中趋势的测度_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

离中趋势的测度第1页,课件共55页,创作于2023年2月随着电子商务的发展,网上购物称为一种时尚,快递公司如雨后春笋般出现,所以邮政服务正在努力向用户友好型转变。现在有这样一种情况,过几天我的妈妈过生日,我去邮局咨询一下“请告诉我提前多少天寄出生日贺卡,这样在我妈妈生日当天刚好收到,不早也不晚”。递送时间的一致性可以用递送时间的标准差来衡量,标准差越小就意味着递送时间的一致性就越强。第2页,课件共55页,创作于2023年2月第3页,课件共55页,创作于2023年2月实例:一些银行要求顾客在每个窗口等待,而另一些银行分发号码,相当于顾客在一个大队列中等待,在什么不同吗?银行一:6.56.66.76.87.17.37.47.77.77.7(一列)-------------------------------------------------------------------------------银行二:4.25.45.86.26.77.77.78.59.310.0(多列)顾客等待时间(以分钟计)第4页,课件共55页,创作于2023年2月银行一(一列等待)平均数=7.15中位数=7.20银行二(多列等待)平均数=7.15中位数=7.204 5 6 78 9 10第5页,课件共55页,创作于2023年2月离散程度数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值第6页,课件共55页,创作于2023年2月异众比率(variationratio)1. 离散程度的测度值之一2. 非众数组的频数占总频数的比率3. 计算公式为

4.用于衡量众数的代表性第7页,课件共55页,创作于2023年2月异众比率(例题分析)解:

在所调查的200人当中,关注非别克的人数占44%,异众比率还是比较大。因此,用“别克”来反映城市居民对汽车品牌的一般趋势,其代表性不是很好某地区居民关注汽车品牌的频数分布汽车品牌人数(人)比例频率(%)别克福特马自达标志现代吉利112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100第8页,课件共55页,创作于2023年2月四分位差(quartiledeviation)1. 离散程度的测度值之一2. 也称为内距或四分间距3. 上四分位数与下四分位数之差

QD

=QU-QL4. 反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性第9页,课件共55页,创作于2023年2月四分位差(顺序数据的算例)解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5

已知

QL=不满意=2

QU=

一般=3四分位差:

QD=QU=

QL

=3–2

=1某企业员工对管理水平评价的频数分布回答类别企业人数(人)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—第10页,课件共55页,创作于2023年2月数值型未分组数据的四分位差(算例)【例】:一个部门1月份10个人的收入数据原始数据:

15007507806601080850960200012501630排序:

660

75078085096010801250150016302000位置:1234

5678910第11页,课件共55页,创作于2023年2月数值型数据:方差和标准差第12页,课件共55页,创作于2023年2月下面是两名同学射击比赛的成绩情况第13页,课件共55页,创作于2023年2月第14页,课件共55页,创作于2023年2月请同学们思考,当平均水平相同时,还可以从哪些方面分析,来说明两个人射击成绩的差异?从而判断究竟选派那位同学参加比赛更合适呢?1、

从变化范围的大小进行分析,谁参加比赛更合适呢?通常,一组数据中的最大值减去最小值所得的差,叫做这组数据的极差(range)极差=数据中的最大值-数据中的最小值小结:极差表示了一组数据变化范围的大小,但由于只考虑了它的两个极端数据的变化,而没有考虑其它数据,因此用它来表示一组数据的波动情况还比较粗略.

第15页,课件共55页,创作于2023年2月极差(range)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响未考虑数据的分布计算公式为

R

=max(xi)-min(xi)第16页,课件共55页,创作于2023年2月2、从波动大小进行分析。观察折线图,你能发现两人射击成绩的波动差异吗?第17页,课件共55页,创作于2023年2月1.用数值怎样表示一次成绩偏离平均数的程度?2.怎样表示10次成绩偏离平均数的程度?3.平均水平之上的数减去平均数是正数,平均水平以下的数减去平均数是负数。直接相加就会“正负抵消”,和为0.为了避免“正负抵消”的问题怎么办?4.如果两组数据不一样多,怎么解决数据个数的影响?综上所述,我们可以用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据的波动大小.这个结果通常称为方差(variance).第18页,课件共55页,创作于2023年2月方差和标准差(varianceandstandarddeviation)1. 离散程度的测度值之一2. 最常用的测度值3. 反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差第19页,课件共55页,创作于2023年2月样本方差和标准差(simplevarianceandstandarddeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!第20页,课件共55页,创作于2023年2月样本方差自由度(degreeoffreedom)一组数据中可以自由取值的数据的个数当样本数据的个数为n

时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x

=5

确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量第21页,课件共55页,创作于2023年2月样本方差与标准差(例题分析1)【例】个成年人某个月上网时间的数据如下(单位:小时),计算其方差及其标准差。第22页,课件共55页,创作于2023年2月样本方差与标准差(例题分析1)第23页,课件共55页,创作于2023年2月样本方差与标准差(例题分析2)

【例4-14】在【例4-7】中,50个固定电话新客户第一个月的电话清单的平均电话费用,试据此表资料计算方差及其标准差。第24页,课件共55页,创作于2023年2月样本方差与标准差(例题分析2)第25页,课件共55页,创作于2023年2月平均差

(meandeviation)各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度数学性质较差,实际中应用较少计算公式为未分组数据组距分组数据第26页,课件共55页,创作于2023年2月平均差

(例题分析)某电脑公司销售量数据平均差计算表按销售量分组组中值(Mi)频数(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计—120—2040第27页,课件共55页,创作于2023年2月平均差

(例题分析)含义:每一天的销售量平均数相比,平均相差17台含义:每一天的销售量平均数相比,平均相差17台第28页,课件共55页,创作于2023年2月相对位置的测量:标准分数第29页,课件共55页,创作于2023年2月标准分数(standardscore)1.也称标准化值2. 对某一个值在一组数据中相对位置的度量3. 可用于判断一组数据是否有离群点4. 用于对变量的标准化处理5.计算公式为第30页,课件共55页,创作于2023年2月标准化值

(例题分析)9个家庭人均月收入标准化值计算表家庭编号人均月收入(元)标准化值z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996第31页,课件共55页,创作于2023年2月标准分数(性质)均值等于02. 方差等于1第32页,课件共55页,创作于2023年2月标准分数(性质)

z分数只是将原始数据进行了线性变换,它并没有改变一个数据在改组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1。

第33页,课件共55页,创作于2023年2月经验法则经验法则表明:当一组数据对称分布时约有68%的数据在平均数加减1个标准差的范围之内约有95%的数据在平均数加减2个标准差的范围之内约有99%的数据在平均数加减3个标准差的范围之内若不是对称分布会怎样?第34页,课件共55页,创作于2023年2月假定某学校在校大学生每月的生活消费支出近似服从正态分布,其月生活消费支出的均值为500元,标准差为50元。对于大学生生活消费支出的分布情况,你有何看法?解:因为数据是正态分布,我们可以应用经验法则得到:大约68%的月生活消费支出在450元(500-50)和550元(500+50)之间大约95%的月生活消费支出在400元(500-2×50)和600元(500+2×50)之间大约99.7%的月生活消费支出在350元(500-3×50)和650元(500+3×50)之间第35页,课件共55页,创作于2023年2月相对离散程度:离散系数第36页,课件共55页,创作于2023年2月离散系数(coefficientofvariation)1. 标准差与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响4. 用于对不同组别数据离散程度的比较5.计算公式为第37页,课件共55页,创作于2023年2月离散系数

(实例和计算过程)

某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0第38页,课件共55页,创作于2023年2月S2=23.09(万元)V2=32.521523.09=0.710X2=32.5215(万元)X1=536.25(万元)S1=309.19(万元)V1=536.25309.19=0.577结论:计算结果表明,V1<V2,说明产品销售额的离散程度小于销售利润的离散程度第39页,课件共55页,创作于2023年2月离散系数(例题分析)第40页,课件共55页,创作于2023年2月

例1:某项调查发现,现今三口之家的家庭最多(32%),求异众比率。某开发商根据这一报导,将房屋的户型大部分都设计为适合三口之家居住的样式和面积,你认为如何呢?例2:设为测体重,得到成人组和婴儿组各100人的两个抽样总体。成人组平均体重为65千克,全距为10千克;婴儿组平均体重为4千克,全距为2.5千克。能否认为成人组体重的离势比婴儿组体重的离势大?

例3:对一个群体测量身高和体重,平均身高为170.2厘米,身高标准差为5.30厘米;平均体重为70千克,体重标准差为4.77千克。比较身高和体重的离散程度。第41页,课件共55页,创作于2023年2月数据类型与离散程度测度值数据类型和所适用的离散程度测度值数据类型分类数据顺序数据数值型数据适用的测度值※异众比率※四分位差

※方差或标准差—异众比率

※离散系数(比较时用)——平均差——极差——四分位差——异众比率第42页,课件共55页,创作于2023年2月偏度与峰度的测度一.偏度及其测度二.峰度及其测度第43页,课件共55页,创作于2023年2月偏度与峰度分布的形状扁平分布尖峰分布偏度峰度左偏分布右偏分布与标准正态分布比较!第44页,课件共55页,创作于2023年2月偏度第45页,课件共55页,创作于2023年2月偏度(skewness)统计学家Pearson于1895年首次提出数据分布偏斜程度的测度偏度系数=0为对称分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论