离散趋势度量-理解变异性课件_第1页
离散趋势度量-理解变异性课件_第2页
离散趋势度量-理解变异性课件_第3页
离散趋势度量-理解变异性课件_第4页
离散趋势度量-理解变异性课件_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

离散趋势度量—理解变异性课件1离散趋势度量—理解变异性课件2第三章离散趋势量数——理解变异性第一节什么是离散趋势量数第二节离散系数种类:异众比率、四分位差、极差、标准差和方差、离散系数第三节偏态与峰态第四节标准化第三章离散趋势量数——理解变异性第一节什么是离散趋势3第一节什么是离散趋势量数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度反映社会经济现象变动的均匀性和稳定性不同类型的数据有不同的离散程度测度值第一节什么是离散趋势量第一节什么是离散趋势量数据分布的另一个重要特征第一节4第一节什么是离散趋势量数二、种类

异众比率Vr四分位差Q.D.极差 R平均差 A.D.标准差 S.D.(σ)离散系数 Vσ第一节什么是离散趋势量数二、种类异众比率Vr5第二节离散系数种类第二节离散系数种类6异众比率

(variationratio)1. 对分类数据离散程度的测度2. 非众数组的频数占总频数的比例3. 计算公式为4.用于衡量众数的代表性异众比率

(variationratio)1. 对分类数据7异众比率

(例题分析)解:

在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“可口可乐”代表消费者购买饮料品牌的状况,其代表性不是很好不同品牌饮料的频数分布

饮料品牌频数比例百分比(%)

可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100异众比率

(例题分析)解:不同品牌饮料的频数分布饮料品牌8四分位差

(quartiledeviation)1、对顺序数据离散程度的测度2、也称为内距或四分间距3、上四分位数与下四分位数之差

Qd=QU

QL4、反映了中间50%数据的离散程度5、不受极端值的影响6、用于衡量中位数的代表性四分位差

(quartiledeviation)1、对顺序9极差(range)1、一组数据的最大值与最小值之差2、离散程度的最简单测度值,常用于数值型数据3、易受极端值影响4、未考虑数据的分布7891078910R

=max(xi)-min(xi)计算公式为极差(range)1、一组数据的最大值与最小值之差7891010许多时候,平均掩盖了数据的真实深度。好的决策不仅要考虑集中趋势度量,还要考虑散步大小。所有的东西只为平均水平设计,我们的社会将会崩溃(高速公路、大坝、房屋建筑、温度)“一个人在通过平均深度为1米的河流时淹死了”许多时候,平均掩盖了数据的真实深度。11平均差

(meandeviation)1、各变量值与其平均数离差绝对值的平均数2、能全面反映一组数据的离散程度,受极值影响3、数学性质较差,实际中应用较少计算公式为未分组数据组距分组数据平均差

(meandeviation)1、各变量值与其平均12平均差

(例题分析)某电脑公司销售量数据平均差计算表按销售量分组组中值(Mi)频数(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计—120—2040平均差

(例题分析)某电脑公司销售量数据平均差计算表按销13平均差

(例题分析)

含义:每一天的销售量平均数相比,平均相差17台平均差

(例题分析)14思考比较下列两组数据的极差:A组:2,10,5,5,5,5,5,5,5,5.B组:4,6,3,7,2,8,1,9,5,5.试问:A组与B组,哪个组的数据离散程度较大?A组与B组的极差相等.这说明极差虽能反映这两组数据的波动情况,但能判断其离散程度的大小吗?思考比较下列两组数据的极差:A组与B组的极差相等.这说明极差15标准差(standarddeviation)和方差标准差各变量与其平均值的差平方的平均数的平方根。标准差表示一个数据组中变异性的平均数量。实际的含义是与均值的平均距离。标准差越大,每个数据点与数据分布的均值的平均距离越大。4681012x=8.3标准差(standarddeviation)和方差标准差各16案例姓名(A)财务管理姓名(B)财务管理史彬莲71夏军军75史子俊84金梦雨81陈正辉47郁淼71刘洋68黄超62周晓晨97刘兆云78平均成绩73.2平均成绩73.2A组同学的得分散落在高点和低点B组同学的分数相当接近案例姓名(A)财务姓名(B)财务史彬莲71夏军军75史子俊817思考,你认为A组和B组的标准差哪一个比较大呢?SA=18.7SB=7.3标准差最小值为0,而数据的离散程度越大,标准差的值就越大思考,你认为A组和B组的标准差哪一个比较大呢?SA=18.718样本方差和标准差未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!样本方差和标准差未分组数据:组距分组数据:未分组数据:组距分19样本方差

自由度(degreeoffreedom)1、一组数据中可以自由取值的数据的个数2、当样本数据的个数为

n

时,若样本均值x

确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值3、例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5

确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值4、样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量样本方差

自由度(degreeoffreedom)1、一20样本标准差

(例题分析)某电脑公司销售量数据平均差计算表按销售量分组组中值(Mi)频数(fi)140-150150-160160-170170-180180-190190-200200-210210-220220-230230-24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计—120—55400样本标准差

(例题分析)某电脑公司销售量数据平均差计算表21样本标准差

(例题分析)

含义:每一天的销售量与平均数相比,平均相差21.58台样本标准差

(例题分析)22甲、乙两学生某次考试成绩列表语文数学物理化学政治英语甲959065707585乙1107095508075

甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。例甲、乙两学生某次考试成绩列表语文数学物理化学政治英语甲923甲、乙两台包装机同时分装质量为400g的奶粉,从它们各自分装的奶粉中随机抽取了10袋,测得它们的实际质量(单位:克)如下:甲:401400408406410409400393394394乙:403404396399402401405397402399试问:哪台包装机包装的奶粉质量比较稳定?甲、乙两台包装机同时分装质量为400g的奶粉,从24可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。

供货计划完成百分比(%)季度总供货计划执行结果一月二月三月钢厂甲100323434乙100203050可用来反映社会生产和其他社会经济活动过程的均衡性或协调25案例:问该班男生是身高的变异性大还是体重变异性大?均值标准差身高(CM)1708体重(KG)657案例:问该班男生是身高的变异性大还是体重变异性大?均值标准差26离散系数

(coefficientofvariation)1、 标准差与其相应的均值之比2、对数据相对离散程度的测度3、消除了数据水平高低和计量单位的影响4、 用于对不同组别数据离散程度的比较5、计算公式为离散系数

(coefficientofvariation27案例:问该班男生是身高的变异性大还是体重变异性大?均值标准差离散系数身高(CM)17084.53体重(KG)65711.67案例:问该班男生是身高的变异性大还是体重变异性大?均值标准差28离散系数

(例题分析)某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度离散系数

(例题分析)某管理局所属8家企业的产品销售数据企29离散系数

(例题分析)结论:计算结果表明,v1<v2,说明产品销售额的离散程度小于销售利润的离散程度v1=536.25309.19=0.577v2=32.521523.09=0.710离散系数

(例题分析)结论:计算结果表明,v1<v2,说30数据类型与离散程度测度值数据类型和所适用的离散程度测度值数据类型分类数据顺序数据数值型数据适用的测度值※异众比率※四分位差※方差或标准差—

异众比率※离散系数(比较时用)——

平均差——

极差——

四分位差——

异众比率数据类型与离散程度测度值数据类型和所适用的离散程度测度值数据31第三节偏态和峰态及其度量第三节偏态和峰态及其度量32偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布33偏态

(skewness)统计学家Pearson于1895年首次提出数据分布偏斜程度的测度1. 偏态系数=0为对称分布2. 偏态系数>0为右偏分布3. 偏态系数<0为左偏分布偏态

(skewness)统计学家Pearson于1895年34偏态系数

(skewnesscoefficient)根据原始数据计算根据分组数据计算偏态系数

(skewnesscoefficient)根据35偏态系数

(例题分析)

某电脑公司销售量偏态及峰度计算表按销售量份组(台)组中值(Mi)频数

fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合计—120540000

70100000

偏态系数

(例题分析)某电脑公司销售量偏态及峰度计算表36偏态系数

(例题分析)结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数偏态系数

(例题分析)结论:偏态系数为正值,但与0的差异不37偏态与峰态

(从直方图上观察)按销售量分组(台)结论:1.为右偏分布

2.峰态适中140150210某电脑公司销售量分布的直方图190200180160170频数(天)25201510530220230240偏态与峰态

(从直方图上观察)按销售量分组(台)结论:1.38峰态

(kurtosis)统计学家Pearson于1905年首次提出数据分布扁平程度的测度峰态系数=0扁平峰度适中峰态系数<0为扁平分布峰态系数>0为尖峰分布峰态

(kurtosis)统计学家Pearson于1905年39峰态系数

(kurtosiscoefficient)根据原始数据计算根据分组数据计算峰态系数

(kurtosiscoefficient)根据40峰态系数

(例题分析)结论:峰态系数为负值,但与0的差异不大,说明电脑销售量为轻微扁平分布峰态系数

(例题分析)结论:峰态系数为负值,但与0的差异不41第四节标准化第四节标准化42标准化值

(例题分析)9个家庭人均月收入标准化值计算表家庭编号人均月收入(元)标准化值z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996标准化值

(例题分析)9个家庭人均月收入标准化值计算表家43标准分的特征无论作为变量的满分是几分,其标准分的平均数势必为0,其标准差势必为1.无论作为变量的单位是什么,其标准的平均数势必为0,而其标准差势必为1.这样满分为100分的考试和满分为200分考试都可以比较。标准分的特征无论作为变量的满分是几分,其标准分的平均数势必为44标准值(性质)1、均值等于02. 方差等于1标准值(性质)1、均值等于045离散趋势度量—理解变异性课件46离散趋势度量—理解变异性课件47离散趋势度量—理解变异性课件481、一组数据最大值与最小值之差称为()A平均差b标准差c极差d四分位差2、各变量值与其均值离差平方的平均数称为()A极差b平均差c方差d标准差3、如果一个数据的标准分数是-2,表面该数据()A比平均数高出2个标准差b比平均数低出2个标准差C等于2倍平均数D等于2倍标准差4、如果一个数据的标准分数是3,表明该数据()A比平均数高出3个标准差B比平均数高出3个标准差C等于3倍平均数D等于3倍标准差5、一组数据的标准分数,其()A均值为1,方差为0B均值为0,方差为1C均值为1,方差为1D均值为0,方差为06、比较两组数据的离散程度最适合的统计量是()A极差B平均差C标准差D离散系数7、用极差度量离散程度的缺陷是()A基于均值计算离散程度B基于绝对值计算,不宜使用C易于计算D没有使用所有数据的信息8、两组数据的均值不等,但标准差相等,则()A均值小的,离散程度大B均值大的,离散程度大C均值小的,离散程度小D两组数据的离散程度相同1、一组数据最大值与最小值之差称为()49离散趋势度量—理解变异性课件50离散趋势度量—理解变异性课件51实例分析:比较两省市的经济水平城市苏州南京无锡常州南通徐州泰州扬州盐城镇江淮安连云宿迁财政收入亿元745434415215198164135128126101969063城市青岛济南烟台淄博潍坊日照临沂济宁菏泽滨州东营威海莱芜聊城泰安德州财政收入342210189129158439213561808110333559155实例分析:比较两省市的经济水平城市苏州南京无锡常州南通徐州泰52离散趋势度量—理解变异性课件531、一组数据中出现频率最多的变量值称为()A众数b中位数c四分位数d均值2、下列关于众数的叙述,不正确的是()A一组数据可能存在多个众数B众数主要适用于分类数据C一组数据的众数是唯一的D众数不受极端值的影响3、一组数据排序后处于中间位置上的变量值称为()A众数b中位数c四分位数d均值4、一组数据排序后处于25%和75%位置的值称为()A众数b中位数c四分位数d均值5、一组数据相加后除以数据的个数所得到的结果称为()A众数b中位数c四分位数d均值6、n个变量值乘积的n次方根称为()A众数b中位数c四分位数d几何平均数7、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生,上述描述中,众数是()A1200b经济管理学院c200d理学院8、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生,描述改组数据的集中趋势宜采用()A众数b中位数c四分位数d均值1、一组数据中出现频率最多的变量值称为()549、某居民小区准备采取一项新的物业管理措施,为此,随机抽取100名居民进行调查,其中表示赞成的有69户,表示中立有22户,表示反对的有9户。描述该组数据的集中趋势宜采用()

A众数b中位数c四分位数d均值10、某居民小区准备采取一项新的物业管理措施,为此,随机抽取100名居民进行调查,其中表示赞成的有69户,表示中立有22户,表示反对的有9户。该组数据的中位数是()

A赞成b69c中立d2211、某班共有25名学生,期末统计学课程考试分数分别为68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,该班考试分数的众数是()

A72b70c68d5612、某班共有25名学生,期末统计学课程考试分数分别为68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,该班考试分数的中位数是()

A72b70c68d5613、某班共有25名学生,期末统计学课程考试分数分别为68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,该班考试分数的均值是()

A72b70c68d5614、某班共有25名学生,期末统计学课程考试分数分别为68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,该班考试分数的下四分位数和上四分位数是()

A64.5和78.5b67.5和71.5c64.5和71.5d64.5和67.59、某居民小区准备采取一项新的物业管理措施,为此,随机抽取15515、在某行业中随机抽取10家企业,第一季度利润额(单位:万元)分别为72,63.1,54.7,54.3,29,26.9,25,23.9,23,20.该组数据的中位数为()

A28.46b30.20c27.95d28.1216、在某行业中随机抽取10家企业,第一季度利润额(单位:万元)分别为72,63.1,54.7,54.3,29,26.9,25,23.9,23,20.该组数据的均值为()

A28.46b30.20c27.95d39.1917、一组样本数据为3,3,1,5,13,12,11,9,7.这组数据的中位数是()

A3b13c7.1d718、当一组数据中有一项为零时,不能计算()

A均值b中位数c几何平均数d众数19、某校9个英语班级的学生人数分别为12,15,9,12,13,12,14,11,10.据此计算的结果是()

A均值=中位数=众数b均值>中位数>众数

c中位数>均值>众数d均值>中位数>众数20、在测度数据集中趋势的统计量中,不受极端值影响的是()

A均值b几何平均数c调和平均数d中位数21、下列叙述正确的是()A众数可以用于数值型数据b中位数可以用于分类数据c几何平均数可以用于顺序数据d均值可以用于分类数据15、在某行业中随机抽取10家企业,第一季度利润额(单位:万5622、某公司进行计算机水平测试,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状是()

A对称B左偏C右偏D无法确定23、下面给出的数据中,哪一个集中趋势的度量最为合适?为什么?A一个社区中的新房价格B年收入C入门课程的成绩D智力测验成绩22、某公司进行计算机水平测试,新员工的平均得分是80分,标57离散趋势度量—理解变异性课件58离散趋势度量—理解变异性课件59第三章离散趋势量数——理解变异性第一节什么是离散趋势量数第二节离散系数种类:异众比率、四分位差、极差、标准差和方差、离散系数第三节偏态与峰态第四节标准化第三章离散趋势量数——理解变异性第一节什么是离散趋势60第一节什么是离散趋势量数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度反映社会经济现象变动的均匀性和稳定性不同类型的数据有不同的离散程度测度值第一节什么是离散趋势量第一节什么是离散趋势量数据分布的另一个重要特征第一节61第一节什么是离散趋势量数二、种类

异众比率Vr四分位差Q.D.极差 R平均差 A.D.标准差 S.D.(σ)离散系数 Vσ第一节什么是离散趋势量数二、种类异众比率Vr62第二节离散系数种类第二节离散系数种类63异众比率

(variationratio)1. 对分类数据离散程度的测度2. 非众数组的频数占总频数的比例3. 计算公式为4.用于衡量众数的代表性异众比率

(variationratio)1. 对分类数据64异众比率

(例题分析)解:

在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“可口可乐”代表消费者购买饮料品牌的状况,其代表性不是很好不同品牌饮料的频数分布

饮料品牌频数比例百分比(%)

可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100异众比率

(例题分析)解:不同品牌饮料的频数分布饮料品牌65四分位差

(quartiledeviation)1、对顺序数据离散程度的测度2、也称为内距或四分间距3、上四分位数与下四分位数之差

Qd=QU

QL4、反映了中间50%数据的离散程度5、不受极端值的影响6、用于衡量中位数的代表性四分位差

(quartiledeviation)1、对顺序66极差(range)1、一组数据的最大值与最小值之差2、离散程度的最简单测度值,常用于数值型数据3、易受极端值影响4、未考虑数据的分布7891078910R

=max(xi)-min(xi)计算公式为极差(range)1、一组数据的最大值与最小值之差7891067许多时候,平均掩盖了数据的真实深度。好的决策不仅要考虑集中趋势度量,还要考虑散步大小。所有的东西只为平均水平设计,我们的社会将会崩溃(高速公路、大坝、房屋建筑、温度)“一个人在通过平均深度为1米的河流时淹死了”许多时候,平均掩盖了数据的真实深度。68平均差

(meandeviation)1、各变量值与其平均数离差绝对值的平均数2、能全面反映一组数据的离散程度,受极值影响3、数学性质较差,实际中应用较少计算公式为未分组数据组距分组数据平均差

(meandeviation)1、各变量值与其平均69平均差

(例题分析)某电脑公司销售量数据平均差计算表按销售量分组组中值(Mi)频数(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计—120—2040平均差

(例题分析)某电脑公司销售量数据平均差计算表按销70平均差

(例题分析)

含义:每一天的销售量平均数相比,平均相差17台平均差

(例题分析)71思考比较下列两组数据的极差:A组:2,10,5,5,5,5,5,5,5,5.B组:4,6,3,7,2,8,1,9,5,5.试问:A组与B组,哪个组的数据离散程度较大?A组与B组的极差相等.这说明极差虽能反映这两组数据的波动情况,但能判断其离散程度的大小吗?思考比较下列两组数据的极差:A组与B组的极差相等.这说明极差72标准差(standarddeviation)和方差标准差各变量与其平均值的差平方的平均数的平方根。标准差表示一个数据组中变异性的平均数量。实际的含义是与均值的平均距离。标准差越大,每个数据点与数据分布的均值的平均距离越大。4681012x=8.3标准差(standarddeviation)和方差标准差各73案例姓名(A)财务管理姓名(B)财务管理史彬莲71夏军军75史子俊84金梦雨81陈正辉47郁淼71刘洋68黄超62周晓晨97刘兆云78平均成绩73.2平均成绩73.2A组同学的得分散落在高点和低点B组同学的分数相当接近案例姓名(A)财务姓名(B)财务史彬莲71夏军军75史子俊874思考,你认为A组和B组的标准差哪一个比较大呢?SA=18.7SB=7.3标准差最小值为0,而数据的离散程度越大,标准差的值就越大思考,你认为A组和B组的标准差哪一个比较大呢?SA=18.775样本方差和标准差未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!样本方差和标准差未分组数据:组距分组数据:未分组数据:组距分76样本方差

自由度(degreeoffreedom)1、一组数据中可以自由取值的数据的个数2、当样本数据的个数为

n

时,若样本均值x

确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值3、例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5

确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值4、样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量样本方差

自由度(degreeoffreedom)1、一77样本标准差

(例题分析)某电脑公司销售量数据平均差计算表按销售量分组组中值(Mi)频数(fi)140-150150-160160-170170-180180-190190-200200-210210-220220-230230-24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合计—120—55400样本标准差

(例题分析)某电脑公司销售量数据平均差计算表78样本标准差

(例题分析)

含义:每一天的销售量与平均数相比,平均相差21.58台样本标准差

(例题分析)79甲、乙两学生某次考试成绩列表语文数学物理化学政治英语甲959065707585乙1107095508075

甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。例甲、乙两学生某次考试成绩列表语文数学物理化学政治英语甲980甲、乙两台包装机同时分装质量为400g的奶粉,从它们各自分装的奶粉中随机抽取了10袋,测得它们的实际质量(单位:克)如下:甲:401400408406410409400393394394乙:403404396399402401405397402399试问:哪台包装机包装的奶粉质量比较稳定?甲、乙两台包装机同时分装质量为400g的奶粉,从81可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。

供货计划完成百分比(%)季度总供货计划执行结果一月二月三月钢厂甲100323434乙100203050可用来反映社会生产和其他社会经济活动过程的均衡性或协调82案例:问该班男生是身高的变异性大还是体重变异性大?均值标准差身高(CM)1708体重(KG)657案例:问该班男生是身高的变异性大还是体重变异性大?均值标准差83离散系数

(coefficientofvariation)1、 标准差与其相应的均值之比2、对数据相对离散程度的测度3、消除了数据水平高低和计量单位的影响4、 用于对不同组别数据离散程度的比较5、计算公式为离散系数

(coefficientofvariation84案例:问该班男生是身高的变异性大还是体重变异性大?均值标准差离散系数身高(CM)17084.53体重(KG)65711.67案例:问该班男生是身高的变异性大还是体重变异性大?均值标准差85离散系数

(例题分析)某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度离散系数

(例题分析)某管理局所属8家企业的产品销售数据企86离散系数

(例题分析)结论:计算结果表明,v1<v2,说明产品销售额的离散程度小于销售利润的离散程度v1=536.25309.19=0.577v2=32.521523.09=0.710离散系数

(例题分析)结论:计算结果表明,v1<v2,说87数据类型与离散程度测度值数据类型和所适用的离散程度测度值数据类型分类数据顺序数据数值型数据适用的测度值※异众比率※四分位差※方差或标准差—

异众比率※离散系数(比较时用)——

平均差——

极差——

四分位差——

异众比率数据类型与离散程度测度值数据类型和所适用的离散程度测度值数据88第三节偏态和峰态及其度量第三节偏态和峰态及其度量89偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布90偏态

(skewness)统计学家Pearson于1895年首次提出数据分布偏斜程度的测度1. 偏态系数=0为对称分布2. 偏态系数>0为右偏分布3. 偏态系数<0为左偏分布偏态

(skewness)统计学家Pearson于1895年91偏态系数

(skewnesscoefficient)根据原始数据计算根据分组数据计算偏态系数

(skewnesscoefficient)根据92偏态系数

(例题分析)

某电脑公司销售量偏态及峰度计算表按销售量份组(台)组中值(Mi)频数

fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合计—120540000

70100000

偏态系数

(例题分析)某电脑公司销售量偏态及峰度计算表93偏态系数

(例题分析)结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数偏态系数

(例题分析)结论:偏态系数为正值,但与0的差异不94偏态与峰态

(从直方图上观察)按销售量分组(台)结论:1.为右偏分布

2.峰态适中140150210某电脑公司销售量分布的直方图190200180160170频数(天)25201510530220230240偏态与峰态

(从直方图上观察)按销售量分组(台)结论:1.95峰态

(kurtosis)统计学家Pearson于1905年首次提出数据分布扁平程度的测度峰态系数=0扁平峰度适中峰态系数<0为扁平分布峰态系数>0为尖峰分布峰态

(kurtosis)统计学家Pearson于1905年96峰态系数

(kurtosiscoefficient)根据原始数据计算根据分组数据计算峰态系数

(kurtosiscoefficient)根据97峰态系数

(例题分析)结论:峰态系数为负值,但与0的差异不大,说明电脑销售量为轻微扁平分布峰态系数

(例题分析)结论:峰态系数为负值,但与0的差异不98第四节标准化第四节标准化99标准化值

(例题分析)9个家庭人均月收入标准化值计算表家庭编号人均月收入(元)标准化值z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996标准化值

(例题分析)9个家庭人均月收入标准化值计算表家100标准分的特征无论作为变量的满分是几分,其标准分的平均数势必为0,其标准差势必为1.无论作为变量的单位是什么,其标准的平均数势必为0,而其标准差势必为1.这样满分为100分的考试和满分为200分考试都可以比较。标准分的特征无论作为变量的满分是几分,其标准分的平均数势必为101标准值(性质)1、均值等于02. 方差等于1标准值(性质)1、均值等于0102离散趋势度量—理解变异性课件103离散趋势度量—理解变异性课件104离散趋势度量—理解变异性课件1051、一组数据最大值与最小值之差称为()A平均差b标准差c极差d四分位差2、各变量值与其均值离差平方的平均数称为()A极差b平均差c方差d标准差3、如果一个数据的标准分数是-2,表面该数据()A比平均数高出2个标准差b比平均数低出2个标准差C等于2倍平均数D等于2倍标准差4、如果一个数据的标准分数是3,表明该数据()A比平均数高出3个标准差B比平均数高出3个标准差C等于3倍平均数D等于3倍标准差5、一组数据的标准分数,其()A均值为1,方差为0B均值为0,方差为1C均值为1,方差为1D均值为0,方差为06、比较两组数据的离散程度最适合的统计量是()A极差B平均差C标准差D离散系数7、用极差度量离散程度的缺陷是()A基于均值计算离散程度B基于绝对值计算,不宜使用C易于计算D没有使用所有数据的信息8、两组数据的均值不等,但标准差相等,则()A均值小的,离散程度大B均值大的,离散程度大C均值小的,离散程度小D两组数据的离散程度相同1、一组数据最大值与最小值之差称为()106离散趋势度量—理解变异性课件107离散趋势度量—理解变异性课件108实例分析:比较两省市的经济水平城市苏州南京无锡常州南通徐州泰州扬州盐城镇江淮安连云宿迁财政收入亿元745434415215198164135128126101969063城市青岛济南烟台淄博潍坊日照临沂济宁菏泽滨州东营威海莱芜聊城泰安德州财政收入342210189129158439213561808110333559155实例分析:比较两省市的经济水平城市苏州南京无锡常州南通徐州泰109离散趋势度量—理解变异性课件1101、一组数据中出现频率最多的变量值称为()A众数b中位数c四分位数d均值2、下列关于众数的叙述,不正确的是()A一组数据可能存在多个众数B众数主要适用于分类数据C一组数据的众数是唯一的D众数不受极端值的影响3、一组数据排序后处于中间位置上的变量值称为()A众数b中位数c四分位数d均值4、一组数据排序后处于25%和75%位置的值称为()A众数b中位数c四分位数d均值5、一组数据相加后除以数据的个数所得到的结果称为()A众数b中位数c四分位数d均值6、n个变量值乘积的n次方根称为()A众数b中位数c四分位数d几何平均数7、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生,上述描述中,众数是()A1200b经济管理学院c200d理学院8、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生,描述改组数据的集中趋势宜采用()A众数b中位数c四分位数d均值1、一组数据中出现频率最多的变量值称为()1119、某居民小区准备采取一项新的物业管理措施,为此,随机抽取100名居民进行调查,其中表示赞成的有69户,表示中立有22户,表示反对的有9户。描述该组数据的集

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论