经济学第四章统计资料的初步描述课件_第1页
经济学第四章统计资料的初步描述课件_第2页
经济学第四章统计资料的初步描述课件_第3页
经济学第四章统计资料的初步描述课件_第4页
经济学第四章统计资料的初步描述课件_第5页
已阅读5页,还剩153页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上学期有三个班的学生选修《统计学》,分别是财务管理、财政、旅游管理。考试结束后考试成绩如下:

1、要了解每个班学生考试成绩如何

2、比较三个班的考试成绩优劣对总体进行分析是通过指标,有总量指标、相对指标、平均指标等。上学期有三个班的学生选修《统计学》,分别是财务管理、财1第四章统计资料的初步描述第四章统计资料的初步描述2第一节总量指标第二节相对指标第三节平均指标第四节标志变异指标第五节偏度和峰度第一节总量指标第二节相对指标第三节平均指标第四节3第一节总量指标概念反映现象在一定时间、地点、条件下的总规模或总水平的统计指标,也称绝对数指标。作用是认识社会经济现象总体特征的起点。是科学管理的基本依据之一。是计算相对数指标和平均数指标的基础。特点只有有限总体才能计算总量指标;总量指标大小随研究范围大小增加或减少。第一节总量指标概念反映现象在一定时间、地点、条件下的总规4分类

1.按反映的内容不同分为总体标志总量总体单位总量2.按反映的时间状况不同分为时点总量指标时期总量指标3.按计量单位不同分为价值量指标实物量指标劳动量指标价值量指标时期总量指标是反映总体在一段时间内达到的规模或水平的总量指标,简称时期指标。时点总量指标是反映总体在某一时点上存在状况的总量指标,简称时点指标。二者区别:(1)时期指标各期数值可直接相加,时点指标一般不能。(2)时期指标数值与计算期长短有关,时点指标没有。(3)时期指标数值往往是通过连续登记获得,时点指标往往通过一次登记获取。注:同一总体不同时点上的值相加无意义,不同总体相加有意义。分类1.按反映的内容不同分为总体标志总量总体单位总量5

单位名称企业数职工人数(人)利润额(万元)工业增加值(万元)纺织局化工局机械局

300250450

800050007000

100020002000

200500300合计1000

20000

5000

1000总体单位总量总体标志总量时点指标时期指标例单位名称企业数利润额(万元)工业增加值(万元)纺织6指出下列指标哪些是时期指标,哪些是时点指标?居民储蓄存款余额森林面积新增林地面积各年末人口数人口出生数社会劳动者人数各月商品销售额旅客周转量指出下列指标哪些是时期指标,哪些是时点指标?居民储蓄存款余额7第二节相对指标概念两个有联系的指标对比的比值,也称为相对数表现形式无名数:系数、倍数、成数、百分数(%)、千分数(‰)有名数:将计算相对数的分子分母的计量单位同时使用的形式。作用揭示现象之间的对比关系,以反映现象的发展速度、密度、结构、比例关系等使某些不能直接对比的现象找到对比的基础。某地区历年GDP的资料如下:年份199519961997199819992000GDP(亿元)3002.73661.24079.34356.64576.15137.7与上年相比的发展速度(%)-121111106105112我们不便看出哪一年发展得快,则计算发展速度如下:第二节相对指标概念两个有联系的指标对比的比值,也称为相对8种类结构相对数总体部分数值与总体全部数值对比,反映总体内部构成。计算公式:例如何比较不同地区生活水平的高低?种类结构相对数总体部分数值与总体全部数值对比,反映总体内部构9比例相对数同一总体中不同部分指标数值对比。计算公式:我国2000年第五次人口普查结果,男女性别比例为106.74:100,这说明以女性为100,男性人口是女性人口数的1.0674倍。简称性比例106.74。

例1

2009年我国GDP抽象化为100,第一产业、第二产业、第三产业的比例为:10.6︰46.8︰42.6。

例2比例相对数同一总体中不同部分指标数值对比。计算公式:10比较相对数同类现象的指标数值在不同空间的比值。计算公式:甲班有学生60人,乙班有学生50人,则甲班人数为乙班人数的120%(即:60/50);例1甲企业人均月工资800元,乙企业人均月工资1000元则甲企业人均月工资为乙企业的80%(即800/1000)例2比较相对数同类现象的指标数值在不同空间的比值。计算公式:甲班11强度相对数两个有联系但性质不同的总量指标对比,表明某一现象在另一现象中发展的强度、密度和普及程度。计算公式:例1例2例3用有名数表示的强度相对数分子分母可以相互颠倒,若颠倒前是个正指标,则颠倒后是个逆指标;反之亦然。如希望指标值越大越好就是正指标,如GDP、人口密度等,如希望指标值越小越好就是逆指标,如成本等。

惯例4某城市人口100万人,营业网点5000个。正指标逆指标强度相对数两个有联系但性质不同的总量指标对比,表明某一现象在12计划完成相对数现象在一定时期内的实际完成数与计划任务数对比,又称计划完成程度。计算公式:情况1情况2情况3由总量指标计算计划完成程度。由相对指标计算计划完成程度。由平均指标计算计划完成程度。

例1:某企业某年某种产品计划产量为500吨,实际产量为600吨,则计划完成程度为:

例2:某企业某种产品产量计划比去年提高8%,实际比去年提高10%,试计算该产品产量的计划完成程度。

例3:某企业计划本生产期原材料平均单耗为5.5千克,实际单耗为5.1千克,则计划完成程度为:

计划完成相对数现象在一定时期内的实际完成数与计划任务数对比,13动态相对数将同一总体不同时间的指标数值对比,反映现象在时间上发展变化的方向和程度,以百分数形式表示。计算公式:注意指标间的可比性:动态相对数将同一总体不同时间的指标数值对比,反映现象在时间上14讨论:经济问题研究中如何寻找合适的指标?1、房价是否存在泡沫?房价收入比:住房价格与城市居民家庭年收入之比。空置率:2、政府刺激经济计划是否拉动了消费?消费率=最终消费/国内生产总值×100%讨论:经济问题研究中如何寻找合适的指标?15第三节平均指标概念在同质总体内,运用一定的方法将总体各单位在某一标志下的数量差异抽象化,以反映总体在一定时间、地点和条件下所达到的一般水平。作用1、可以用来进行对比分析。2、可以用来分析现象之间的依存关系。3、可以反映总体分布的集中趋势。第三节平均指标概念在同质总体内,运用一定的方法将总体各单16种类

1.按计算方法不同分为数值平均数位置平均数算术平均数几何平均数调和平均数众数中位数2.按考核内容不同分为动态平均数静态平均数种类1.按计算方法不同分为数值平均数位置平均数算术平均数17计算方法算术平均数计算公式:算术平均数与强度相对数

相同:二者均是两个总量指标对比的结果。不同:首先,算术平均数对比的分子和分母是同一总体的标志总量和单位总量,而强度相对指标对比的分子分母是两个不同总体现象总量;其次,算术平均数分子中的每一个标志量都是由分母中的每一个单位来承担,分子的标志值个数和分母的单位数存在着对应关系,而强度相对指标对比的分子分母在数量上没有对应关系。另外,强度相对指标反映现象的程度、密度和普遍程度,统计平均数反映现象总体某种数量特征的一般水平。计算方法算术平均数计算公式:算术平均数与强度相对数18

1.简单算术平均数——资料未经分组2.加权算术平均数——资料经过分组单项式数列组距式数列以各组组中值代替各组平均数计算1.简单算术平均数——资料未经分组2.加权算术平均数19例

某贸易公司60名员工月工资分组资料如下:工资(元)组中值x人数(人)f工资总额(元)xf800以下800~10001000~12001200~15001500以上7009001100135016506142610442001260028600135006600合计—6065500工资(元)组中值(元)X人数比重(%)ƒ/∑ƒ工资×比重800以下800~10001000~12001200~15001500以上70090011001350165010.023.343.316.76.770.00209.70476.30225.45110.55合计—100.01092例某贸易公司60名员工月工资分组资料如下:工资组中20[经济学]第四章统计资料的初步描述课件21数学性质简单公式加权公式

各个变量值与算术平均数的离差平方之和为最小值

加权公式简单公式

各个变量值与平均数离差之和等于零数学性质简单公式加权公式各个变量值与算术平均数的22证明:设x0为不等于平均数的任意值,则:代入以x0

为中心的离差平方和,得证明:设x0为不等于平均数的任意值,则:代入以x0为中心23调和平均数变量值倒数的算术平均数的倒数,又称倒数平均数。

1.简单调和平均数有一种蔬菜,早晨的价格每千克0.5元,中午0.2元,晚上0.1元。如果早、中、晚各买1元钱的蔬菜,则当天所买的蔬菜平均价格是多少?例

以公式表示练习:某人在30元/股、50元/股、100元/股的三个不同价位各买进“贵州茅台”股票6000元,则所持该股票的均价是多少?调和平均数变量值倒数的算术平均数的倒数,又称倒数平均数。24

2.加权调和平均数例前进化工厂2009年11月购进三批A原料,每批的

价格及金额如下表,求平均价格。批次价格(元/公斤)x金额(元)m购进数量(公斤)m/x第一批第二批第三批505560110002750018000220500300合计—5650010202.加权调和平均数例前进化工厂2009年11月购进三批A25练习:

法拉利队的车王迈克尔·舒马赫在2004年9月初的一次试车中(F2004),以每小时320公里的速度开了52圈,以每小时345公里的速度开了35圈,而队友巴里切罗以每小时322公里的速度开了45圈,以每小时337公里的速度开了42圈,求两人各自的平均车速。

某鱼摊有两种鲫鱼:大的每公斤18元,小的每公斤12元,并不能还价。一顾客欲各买一条,但提出两条一起称,每公斤15元,鱼摊主答应。问谁占便宜?练习:

法拉利队的车王迈克尔·舒马赫在2004年9月初的一次试车中(F2004),以每小时320公里的速度开了52圈,以每小时345公里的速度开了35圈,而队友巴里切罗以每小时322公里的速度开了45圈,以每小时337公里的速度开了42圈,求两人各自的平均车速。

某鱼摊有两种鲫鱼:大的每公斤18元,小的每公斤12元,并不能还价。一顾客欲各买一条,但提出两条一起称,每公斤15元,鱼摊主答应。问谁占便宜?练习:练习:26几何平均数

1.简单几何平均数当总体数值等于各部分数值之积的时候用几何平均数。

2.加权几何平均数3.应用条件变量值的连乘积等于总比率或总速度的场合几何平均数1.简单几何平均数当总体数值等于各部分数值之积27例1

某公司向银行申请一笔贷款,期限5年.第1、2年利率为3%,第3、4年为4%,第5年为5%,求该笔贷款的平均年利率?

希望机械厂生产的机车要经过三个连续作业车间才能完成。2005年一季度第一车间铸造产品的合格率为95%,第二车间粗加工产品的合格率为93%,第三车间精加工产品的合格率为90%,第四车间组装的合格率为86%,则该企业的产品合格率为多少?例2例1某公司向银行申请一笔贷款,期限5年.第1、2年利率为328中位数将总体各单位的标志值按大小顺序排列,处于中间位置的就是中位数。Me50%50%计算步骤:

首先确定中点位次;

然后找出中点位次对应的变量值。中位数将总体各单位的标志值按大小顺序排列,处于中间位置的就是29

总体单位数为奇数时,在第位置

总体单位数为偶数时,在第和位置两个标志值的平均

1.由未分组资料确定中位数例1

某一个科室有9人,年龄分别为24、25、25、26、26、27、28、29、55岁,则中位数为26岁。总体单位数为奇数时,在第位置30

2.由已分组资料确定中位数

如果是单项式数列,则所在的组所对应的变量值即为中位数日产零件数(件)工人人数(人)向上累计向下累计26338031101377321427673427545336187226418808合计802.由已分组资料确定中位数如果是单项式数列,则31

如果是组距式数列,应该如何确定中位数?按日产量分组(千克)工人数(人)向上累计向下累计50以下101016460——70192915470——80507913580——90361158590——1002714249100——1101415622110以上81648合计164如果是组距式数列,应该如何确定中位数?按日产量分组(千克32中位数的确定(组距数列)共个单位共个单位共个单位共个单位LU中位数组组距为d共个单位假定该组内的单位呈均匀分布共有单位数

中位数下限公式为

该段长度应为

中位数的确定(组距数列)共个单位共33Me为中位数L为中位数所在组的下限U为中位数所在组的上限Sm-1为中位数所在组以下的累计次数(向上累计)Sm+1为中位数所在组以上的累计次数(向下累计)fm为中位数所在组的次数Σf为总次数i为中位数所在组的组距Me为中位数34

2004年某地大学生消费支出调查资料月消费额组中值(元)调查人数(人)累计人数(人)300以下300~400400~500500~600600~700700以上250350450550650750801804302207020802606909109801000合计——1000——

中位数的位置为1000/2=500,可知月消费金额位居第500位的学生在月消费额400—500元这个组,中位数为:例22004年某地大学生消费35众数众数是变量数列中出现次数最多的变量值。特点:众数既适用于变量数列,也适用于品质数列。当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)数据太少时,不宜用众数。众数众数是变量数列中出现次数最多的变量值。特点:众数既适用于36

1.由未分组资料确定众数

由品质数列或单项数列确定众数,出现次数最多的标志值就是众数。1.由未分组资料确定众数由品质数列或单项数列确定众37

2、由组距数列计算众数先根据各组次数确定众数所在的组,这时应注意各组组距是否相等,如不等则要考虑组距对次数的影响,然后利用下列公式计算众数。下限公式

L:众数组的下限Δ1:众数组次数与前一组次数之差Δ2:众数组次数与后一组次数之差I:众数组的组距上限公式2、由组距数列计算众数下限公式L:众数组的下限上限公式38例1

2008年某地大学生消费支出调查资料月消费额人数(人)300以下300~400400~500500~600600~700700以上801804302207020合计1000

观察众数在400-500这一组,进一步计算得:例12008年某地大学生消费支出39GEFDCABfXf3f2f1dXLXUM0Δ1Δ2众数的两个计算公式可以从几何图形得到证明:GEFDCABfXf3f2f1dXLXUM0Δ1Δ2众数的两40各平均数之间的关系1、算术平均数和几何平均数、调和平均数的关系如果根据同一资料计算,则调和平均数最小,几何平均数居中,算术平均数最大,即算术平均数≥几何平均数≥调和平均数

例:

有1、3、6、7、9五个数,计算:各平均数之间的关系1、算术平均数和几何平均数、调和平均数的关412、算术平均数和中位数、众数之间的关系对称分布2、算术平均数和中位数、众数之间的关系对称分布42右偏分布右偏分布43左偏分布左偏分布44

经验表明:当分布数列偏斜适度时,无论是左偏还是右偏,中位数总是居于中间,中位数离算术平均数的距离大约是众数离算术平均数距离的三分之一,离众数的距离大约是众数离算术平均数距离的三分之二。即:左偏分布均值

中位数

众数右偏分布众数中位数均值2121经验表明:当分布数列偏斜适度时,无论是左偏还是右偏,45

从自动包装机包装的食品当中,抽出100袋检查,发现平均重量为1001克,中位数为999克,要求:1)求众数,2)对分配的偏斜情况进行说明。例1解:1)绘制三种平均数之间关系的示意图...从自动包装机包装的食品当中,抽出100袋检查,发现平均重46例2

某批零件,直径小于806mm的占全部的半数,测定结果,多数零件的直径表现为810mm,试估计该批零件直径的算术平均数,并指出零件直径口寸分配的偏斜程度。解:1)绘制三种平均数之间关系的示意图例2某批零件,直径小于806mm的占全部的半数,测定结果47例3“一般来说,一个城市的房价是高度偏态的。”根据你对这句话的理解:(1)画出城市房价的分布示意图;(2)如果要了解房屋价格的变化趋势,你会选择房价的算术平均数还是中位数,为什么?(3)如果未来确定交易费率,并估计相应的税收总额,你会选择算术平均数还是中位数,为什么?

(1)右偏分布;

(2)用中位数张家有个张千万,九个邻居穷光蛋;加在一起一平均,个个都有一百万。(3)税收总额=交易费率*房屋总价(房屋均价*房屋总面积)例3“一般来说,一个城市的房价是高度偏态的。”根据你对这48集中趋势弱、离中趋势强集中趋势强、离中趋势弱集中趋势弱、离中趋势强集中趋势强、离中趋势弱49第四节标志变异指标概念反映总体各单位变量值的差异程度,反映分配数列中以平均数为中心的各变量值变动的范围或离差程度,又称标志变动度。

甲组:5050505050乙组:4045505560丙组:1030507090作用可以衡量平均数的代表性高低;可以反映社会经济活动过程的稳定性和均衡性第四节标志变异指标概念反映总体各单位变量值的差异程度,反50测定指标全距总体各单位变量值中最大值与最小值之差。

全距=最大变量值-最小变量值对于分组资料,全距=最高组上限-最低组下限特点:是描述数据离散程度最简单的测度值,计算简单,易于理解。只反映两个极端变量值的差距,未考虑中间数据的变异情况。对于开口组则无法计算,不能准确描述数据的离散程度。测定指标全距总体各单位变量值中最大值与最小值之差。51平均差总体各单位的变量值与其算术平均数的离差的绝对值的算术平均数。0X1

x2

xn

1.由未分组资料计算平均差设4个人年龄20、21、23、24岁,试计算4个人年龄的平均差。平均差总体各单位的变量值与其算术平均数的离差的绝对值的算术平522.由组距数列计算平均差先计算组中值,以组中值代表各组变量值,再按上述公式计算。

练习:某班学生按考分分组资料如下。考分(分)人数f60以下60-7070-8080-9090以上2481610合计40组中值x5565758595—1102606001360950328054685648130

356优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。2.由组距数列计算平均差先计算组中值,以组中值代表各组变量53方差和标准差各个标志值与其算术平均数的离差平方的算术平均数与它的平方根。简单平均式加权平均式方差:标准差:方差和标准差各个标志值与其算术平均数的离差平方的算术平均数与54例1某班上学期统计学课程考试成绩如下表,试计算标准差成绩(分)组中值x人数f60以下60~7070~8080~9090以上55657585952481610-27-17-7313729289499169145811563921441690合计-40--4840例1某班上学期统计学课程考试成绩如下表,试计算标准差成绩(分55根据例11某地大学生2010年消费情况计算人月消费额的方差和标准差(平均458元)例2月消费额(元)组中值x人数f300以下300~400400~500500~600600~700700以上250350450550650750801804302207020-208-108-892192292432641166464846436864852643461120209952027520186208025804801705280合计—1000——11736000根据例11某地大学生2010年消费情况计算人月消费额的方差和56练习某班学生按考试成绩分组资料如下:考分(分)人数(人)60以下260-70470-80880-901690以上10合计40试计算该班学生考试成绩的标准差。练习某班学生按考试成绩分组资料如下:考分(分)人数(人)57某车间生产100件产品,经检验,90件是合格品,10件是不合格品,计算合格品和不合格品的成数。分组单位数变量值合格不合格901010合计100—例子某车间生产100件产品,经检验,90件是合格品,10件是58其值仅表现为具有某种特征或不具有某种特征两种情况的标志称为是非标志,也称交替标志。是非标志将是非标志的标志表现结果“是”与“非”数量化,设:分组单位数变量值具有某一属性不具有某一属性N1N010合计N—其值仅表现为具有某种特征或不具有某种特征两种情况的标志称为是59令则是非标志的算术平均数为:是非标志的标准差为:令则是非标志的算术平均数为:是非标志的标准差为:60例

某机械厂铸造车间本月生产6000吨铸件,其中合格品5400吨,不合格品600吨。其是非标志的平均数、标准差、方差计算如下:解:设合格品的成数为P,则例某机械厂铸造车间本月生产6000吨铸件,其中61可比?哪个总体离散程度更大?可比?哪个总体离散程度更大?62身高的差异水平:cm体重的差异水平:kg用什么指标可以相互比较可比身高的差异水平:cm体重的差异水平:kg用什么指标可以相互比63标志变异指标再除以算术平均数即标志变异系数(离散系数或变异系数)。标志变异系数常用的标志变异系数有平均差系数和标准差系数1.平均差系数:2.标准差系数:注:标志变异系数越小,总体内部的离散程度越小,平均值的代表性越好。标志变异指标再除以算术平均数即标志变异系数(离散系数或变异系64例

某公司下属67家连锁超市2005年平均销售额为727.09万元,销售额标准差为65.44万元;同期销售利润平均为87.28万元,销售利润额标准差为12.64万元。比较商品销售额与销售利润的离散程度。销售额标准差系数利润额标准差系数

某证券市场A和B二种股票一年来的收盘价格平均数和标准差分别为xA=¥58,sA=¥15;xB=¥27,sB=¥9,这两种股票谁的变异度大?例某公司下属67家连锁超市2005年平均销售额为727.065标志变异系数的适用条件:当比较的两个总体的平均数不相等时。当对比的两个变量计量单位不相同时。总结:关于判断两组数据稳定性或判断两组数据平均值的代表性的题目,解题思路是:第一步,分别计算两组数据的平均值。第二步,若两组数据的平均值大小相等,且单位也相同,则可利用标准差来判断;若两组数据的平均值大小不相等,或单位不同,则要进一步计算标准差系数来判断。标志变异系数的适用条件:66下面的两个直方图分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险,但投资于哪类股票,往往与投资者的类型有一定关系。1)你认为应该用什么样的统计测度值来反映投资的风险?2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?下面的两个直方图分别反映了200种商业类股票和200种高科技67非众数值的次数之和在总次数中所占比重,主要用于测度众数对分配数列的代表程度及各个变量值对众数的离散程度。异众比率异众比率越大,众数的代表性越差;异众比率越小,众数的代表性越好非众数值的次数之和在总次数中所占比重,主要用于测度众数对分配68数据分布的特征和测度峰度偏度数据的特征和测度分布的形状集中趋势离散程度众数中位数离散系数方差和标准差异众比率极差位置平均数数值平均数算术平均数调和平均数几何平均数数据分布的特征和测度峰度偏度数据的特征和测度分布69第五节偏度和峰度用以测定一个数列次数分布的非对称程度的统计指标偏度测定:方法1.利用算术平均数与位置平均数的关系

绝对偏度:偏度=算术平均数—众数

若偏度=0,表明这组频数分布是对称的若偏度等于正值,表明这组频数分布是右偏若偏度等于负值,表明这组频数分布是左偏第五节偏度和峰度用以测定一个数列次数分布的非对称程度的统70相对偏度:绝对偏度与数列原有的标志值的标准差之比,称为偏度系数。计算公式:在计算偏态系数时,如果公式中的众数不易计算,可用中位数代替相对偏度:绝对偏度与数列原有的标志值的标准差之比,称为偏度系71[经济学]第四章统计资料的初步描述课件72例根据某地大学生消费支出资料计算偏态系数,已知平均数为458元,众数454.35元,标准差108.3元,则:表明该地大学生月消费支出的频数分布属于正偏分布,众数对算术平均数的偏斜程度为3.37%,即存在轻微程度的偏态分布例根据某地大学生消费支出资料计算偏态系数,已知平均数为45873方法2.矩法测定偏度系数方法2.矩法测定偏度系数74用以反映数列分布与正态分布相比尖峭程度的统计指标。峰度峰度有三种形态:正态峰度、尖顶峰度和平顶峰度:平顶峰度尖顶峰度用以反映数列分布与正态分布相比尖峭程度的统计指标。峰度峰度有75测定:以四阶中心距为基础。将四阶中心距除以б4,化为相对数,即为峰度的测定值。峰度系数测定:峰度系数76本章小结第一节总量指标总体标志总量和总体单位总量★时期指标和时点指标(3点区别)★第二节相对指标结构相对指标比例相对指标比较相对指标强度相对指标★动态相对指标计划完成程度相对指标★本章小结第一节总量指标77本章小结第三节平均指标算术平均数:总体标志总量/总体单位总量★调和平均数H★几何平均数G中位数Me众数M0第四节标志变异指标全距R平均差A.D.标准差σ★标志变异系数Vσ★本章小结第三节平均指标78本章涉及考题:1.(选择)由总体所有单位的标志值计算的平均数有()A算术平均数B调和平均数C几何平均数D中位数E众数2.名词解释标准差系数众数本章涉及考题:79上学期有三个班的学生选修《统计学》,分别是财务管理、财政、旅游管理。考试结束后考试成绩如下:

1、要了解每个班学生考试成绩如何

2、比较三个班的考试成绩优劣对总体进行分析是通过指标,有总量指标、相对指标、平均指标等。上学期有三个班的学生选修《统计学》,分别是财务管理、财80第四章统计资料的初步描述第四章统计资料的初步描述81第一节总量指标第二节相对指标第三节平均指标第四节标志变异指标第五节偏度和峰度第一节总量指标第二节相对指标第三节平均指标第四节82第一节总量指标概念反映现象在一定时间、地点、条件下的总规模或总水平的统计指标,也称绝对数指标。作用是认识社会经济现象总体特征的起点。是科学管理的基本依据之一。是计算相对数指标和平均数指标的基础。特点只有有限总体才能计算总量指标;总量指标大小随研究范围大小增加或减少。第一节总量指标概念反映现象在一定时间、地点、条件下的总规83分类

1.按反映的内容不同分为总体标志总量总体单位总量2.按反映的时间状况不同分为时点总量指标时期总量指标3.按计量单位不同分为价值量指标实物量指标劳动量指标价值量指标时期总量指标是反映总体在一段时间内达到的规模或水平的总量指标,简称时期指标。时点总量指标是反映总体在某一时点上存在状况的总量指标,简称时点指标。二者区别:(1)时期指标各期数值可直接相加,时点指标一般不能。(2)时期指标数值与计算期长短有关,时点指标没有。(3)时期指标数值往往是通过连续登记获得,时点指标往往通过一次登记获取。注:同一总体不同时点上的值相加无意义,不同总体相加有意义。分类1.按反映的内容不同分为总体标志总量总体单位总量84

单位名称企业数职工人数(人)利润额(万元)工业增加值(万元)纺织局化工局机械局

300250450

800050007000

100020002000

200500300合计1000

20000

5000

1000总体单位总量总体标志总量时点指标时期指标例单位名称企业数利润额(万元)工业增加值(万元)纺织85指出下列指标哪些是时期指标,哪些是时点指标?居民储蓄存款余额森林面积新增林地面积各年末人口数人口出生数社会劳动者人数各月商品销售额旅客周转量指出下列指标哪些是时期指标,哪些是时点指标?居民储蓄存款余额86第二节相对指标概念两个有联系的指标对比的比值,也称为相对数表现形式无名数:系数、倍数、成数、百分数(%)、千分数(‰)有名数:将计算相对数的分子分母的计量单位同时使用的形式。作用揭示现象之间的对比关系,以反映现象的发展速度、密度、结构、比例关系等使某些不能直接对比的现象找到对比的基础。某地区历年GDP的资料如下:年份199519961997199819992000GDP(亿元)3002.73661.24079.34356.64576.15137.7与上年相比的发展速度(%)-121111106105112我们不便看出哪一年发展得快,则计算发展速度如下:第二节相对指标概念两个有联系的指标对比的比值,也称为相对87种类结构相对数总体部分数值与总体全部数值对比,反映总体内部构成。计算公式:例如何比较不同地区生活水平的高低?种类结构相对数总体部分数值与总体全部数值对比,反映总体内部构88比例相对数同一总体中不同部分指标数值对比。计算公式:我国2000年第五次人口普查结果,男女性别比例为106.74:100,这说明以女性为100,男性人口是女性人口数的1.0674倍。简称性比例106.74。

例1

2009年我国GDP抽象化为100,第一产业、第二产业、第三产业的比例为:10.6︰46.8︰42.6。

例2比例相对数同一总体中不同部分指标数值对比。计算公式:89比较相对数同类现象的指标数值在不同空间的比值。计算公式:甲班有学生60人,乙班有学生50人,则甲班人数为乙班人数的120%(即:60/50);例1甲企业人均月工资800元,乙企业人均月工资1000元则甲企业人均月工资为乙企业的80%(即800/1000)例2比较相对数同类现象的指标数值在不同空间的比值。计算公式:甲班90强度相对数两个有联系但性质不同的总量指标对比,表明某一现象在另一现象中发展的强度、密度和普及程度。计算公式:例1例2例3用有名数表示的强度相对数分子分母可以相互颠倒,若颠倒前是个正指标,则颠倒后是个逆指标;反之亦然。如希望指标值越大越好就是正指标,如GDP、人口密度等,如希望指标值越小越好就是逆指标,如成本等。

惯例4某城市人口100万人,营业网点5000个。正指标逆指标强度相对数两个有联系但性质不同的总量指标对比,表明某一现象在91计划完成相对数现象在一定时期内的实际完成数与计划任务数对比,又称计划完成程度。计算公式:情况1情况2情况3由总量指标计算计划完成程度。由相对指标计算计划完成程度。由平均指标计算计划完成程度。

例1:某企业某年某种产品计划产量为500吨,实际产量为600吨,则计划完成程度为:

例2:某企业某种产品产量计划比去年提高8%,实际比去年提高10%,试计算该产品产量的计划完成程度。

例3:某企业计划本生产期原材料平均单耗为5.5千克,实际单耗为5.1千克,则计划完成程度为:

计划完成相对数现象在一定时期内的实际完成数与计划任务数对比,92动态相对数将同一总体不同时间的指标数值对比,反映现象在时间上发展变化的方向和程度,以百分数形式表示。计算公式:注意指标间的可比性:动态相对数将同一总体不同时间的指标数值对比,反映现象在时间上93讨论:经济问题研究中如何寻找合适的指标?1、房价是否存在泡沫?房价收入比:住房价格与城市居民家庭年收入之比。空置率:2、政府刺激经济计划是否拉动了消费?消费率=最终消费/国内生产总值×100%讨论:经济问题研究中如何寻找合适的指标?94第三节平均指标概念在同质总体内,运用一定的方法将总体各单位在某一标志下的数量差异抽象化,以反映总体在一定时间、地点和条件下所达到的一般水平。作用1、可以用来进行对比分析。2、可以用来分析现象之间的依存关系。3、可以反映总体分布的集中趋势。第三节平均指标概念在同质总体内,运用一定的方法将总体各单95种类

1.按计算方法不同分为数值平均数位置平均数算术平均数几何平均数调和平均数众数中位数2.按考核内容不同分为动态平均数静态平均数种类1.按计算方法不同分为数值平均数位置平均数算术平均数96计算方法算术平均数计算公式:算术平均数与强度相对数

相同:二者均是两个总量指标对比的结果。不同:首先,算术平均数对比的分子和分母是同一总体的标志总量和单位总量,而强度相对指标对比的分子分母是两个不同总体现象总量;其次,算术平均数分子中的每一个标志量都是由分母中的每一个单位来承担,分子的标志值个数和分母的单位数存在着对应关系,而强度相对指标对比的分子分母在数量上没有对应关系。另外,强度相对指标反映现象的程度、密度和普遍程度,统计平均数反映现象总体某种数量特征的一般水平。计算方法算术平均数计算公式:算术平均数与强度相对数97

1.简单算术平均数——资料未经分组2.加权算术平均数——资料经过分组单项式数列组距式数列以各组组中值代替各组平均数计算1.简单算术平均数——资料未经分组2.加权算术平均数98例

某贸易公司60名员工月工资分组资料如下:工资(元)组中值x人数(人)f工资总额(元)xf800以下800~10001000~12001200~15001500以上7009001100135016506142610442001260028600135006600合计—6065500工资(元)组中值(元)X人数比重(%)ƒ/∑ƒ工资×比重800以下800~10001000~12001200~15001500以上70090011001350165010.023.343.316.76.770.00209.70476.30225.45110.55合计—100.01092例某贸易公司60名员工月工资分组资料如下:工资组中99[经济学]第四章统计资料的初步描述课件100数学性质简单公式加权公式

各个变量值与算术平均数的离差平方之和为最小值

加权公式简单公式

各个变量值与平均数离差之和等于零数学性质简单公式加权公式各个变量值与算术平均数的101证明:设x0为不等于平均数的任意值,则:代入以x0

为中心的离差平方和,得证明:设x0为不等于平均数的任意值,则:代入以x0为中心102调和平均数变量值倒数的算术平均数的倒数,又称倒数平均数。

1.简单调和平均数有一种蔬菜,早晨的价格每千克0.5元,中午0.2元,晚上0.1元。如果早、中、晚各买1元钱的蔬菜,则当天所买的蔬菜平均价格是多少?例

以公式表示练习:某人在30元/股、50元/股、100元/股的三个不同价位各买进“贵州茅台”股票6000元,则所持该股票的均价是多少?调和平均数变量值倒数的算术平均数的倒数,又称倒数平均数。103

2.加权调和平均数例前进化工厂2009年11月购进三批A原料,每批的

价格及金额如下表,求平均价格。批次价格(元/公斤)x金额(元)m购进数量(公斤)m/x第一批第二批第三批505560110002750018000220500300合计—5650010202.加权调和平均数例前进化工厂2009年11月购进三批A104练习:

法拉利队的车王迈克尔·舒马赫在2004年9月初的一次试车中(F2004),以每小时320公里的速度开了52圈,以每小时345公里的速度开了35圈,而队友巴里切罗以每小时322公里的速度开了45圈,以每小时337公里的速度开了42圈,求两人各自的平均车速。

某鱼摊有两种鲫鱼:大的每公斤18元,小的每公斤12元,并不能还价。一顾客欲各买一条,但提出两条一起称,每公斤15元,鱼摊主答应。问谁占便宜?练习:

法拉利队的车王迈克尔·舒马赫在2004年9月初的一次试车中(F2004),以每小时320公里的速度开了52圈,以每小时345公里的速度开了35圈,而队友巴里切罗以每小时322公里的速度开了45圈,以每小时337公里的速度开了42圈,求两人各自的平均车速。

某鱼摊有两种鲫鱼:大的每公斤18元,小的每公斤12元,并不能还价。一顾客欲各买一条,但提出两条一起称,每公斤15元,鱼摊主答应。问谁占便宜?练习:练习:105几何平均数

1.简单几何平均数当总体数值等于各部分数值之积的时候用几何平均数。

2.加权几何平均数3.应用条件变量值的连乘积等于总比率或总速度的场合几何平均数1.简单几何平均数当总体数值等于各部分数值之积106例1

某公司向银行申请一笔贷款,期限5年.第1、2年利率为3%,第3、4年为4%,第5年为5%,求该笔贷款的平均年利率?

希望机械厂生产的机车要经过三个连续作业车间才能完成。2005年一季度第一车间铸造产品的合格率为95%,第二车间粗加工产品的合格率为93%,第三车间精加工产品的合格率为90%,第四车间组装的合格率为86%,则该企业的产品合格率为多少?例2例1某公司向银行申请一笔贷款,期限5年.第1、2年利率为3107中位数将总体各单位的标志值按大小顺序排列,处于中间位置的就是中位数。Me50%50%计算步骤:

首先确定中点位次;

然后找出中点位次对应的变量值。中位数将总体各单位的标志值按大小顺序排列,处于中间位置的就是108

总体单位数为奇数时,在第位置

总体单位数为偶数时,在第和位置两个标志值的平均

1.由未分组资料确定中位数例1

某一个科室有9人,年龄分别为24、25、25、26、26、27、28、29、55岁,则中位数为26岁。总体单位数为奇数时,在第位置109

2.由已分组资料确定中位数

如果是单项式数列,则所在的组所对应的变量值即为中位数日产零件数(件)工人人数(人)向上累计向下累计26338031101377321427673427545336187226418808合计802.由已分组资料确定中位数如果是单项式数列,则110

如果是组距式数列,应该如何确定中位数?按日产量分组(千克)工人数(人)向上累计向下累计50以下101016460——70192915470——80507913580——90361158590——1002714249100——1101415622110以上81648合计164如果是组距式数列,应该如何确定中位数?按日产量分组(千克111中位数的确定(组距数列)共个单位共个单位共个单位共个单位LU中位数组组距为d共个单位假定该组内的单位呈均匀分布共有单位数

中位数下限公式为

该段长度应为

中位数的确定(组距数列)共个单位共112Me为中位数L为中位数所在组的下限U为中位数所在组的上限Sm-1为中位数所在组以下的累计次数(向上累计)Sm+1为中位数所在组以上的累计次数(向下累计)fm为中位数所在组的次数Σf为总次数i为中位数所在组的组距Me为中位数113

2004年某地大学生消费支出调查资料月消费额组中值(元)调查人数(人)累计人数(人)300以下300~400400~500500~600600~700700以上250350450550650750801804302207020802606909109801000合计——1000——

中位数的位置为1000/2=500,可知月消费金额位居第500位的学生在月消费额400—500元这个组,中位数为:例22004年某地大学生消费114众数众数是变量数列中出现次数最多的变量值。特点:众数既适用于变量数列,也适用于品质数列。当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)数据太少时,不宜用众数。众数众数是变量数列中出现次数最多的变量值。特点:众数既适用于115

1.由未分组资料确定众数

由品质数列或单项数列确定众数,出现次数最多的标志值就是众数。1.由未分组资料确定众数由品质数列或单项数列确定众116

2、由组距数列计算众数先根据各组次数确定众数所在的组,这时应注意各组组距是否相等,如不等则要考虑组距对次数的影响,然后利用下列公式计算众数。下限公式

L:众数组的下限Δ1:众数组次数与前一组次数之差Δ2:众数组次数与后一组次数之差I:众数组的组距上限公式2、由组距数列计算众数下限公式L:众数组的下限上限公式117例1

2008年某地大学生消费支出调查资料月消费额人数(人)300以下300~400400~500500~600600~700700以上801804302207020合计1000

观察众数在400-500这一组,进一步计算得:例12008年某地大学生消费支出118GEFDCABfXf3f2f1dXLXUM0Δ1Δ2众数的两个计算公式可以从几何图形得到证明:GEFDCABfXf3f2f1dXLXUM0Δ1Δ2众数的两119各平均数之间的关系1、算术平均数和几何平均数、调和平均数的关系如果根据同一资料计算,则调和平均数最小,几何平均数居中,算术平均数最大,即算术平均数≥几何平均数≥调和平均数

例:

有1、3、6、7、9五个数,计算:各平均数之间的关系1、算术平均数和几何平均数、调和平均数的关1202、算术平均数和中位数、众数之间的关系对称分布2、算术平均数和中位数、众数之间的关系对称分布121右偏分布右偏分布122左偏分布左偏分布123

经验表明:当分布数列偏斜适度时,无论是左偏还是右偏,中位数总是居于中间,中位数离算术平均数的距离大约是众数离算术平均数距离的三分之一,离众数的距离大约是众数离算术平均数距离的三分之二。即:左偏分布均值

中位数

众数右偏分布众数中位数均值2121经验表明:当分布数列偏斜适度时,无论是左偏还是右偏,124

从自动包装机包装的食品当中,抽出100袋检查,发现平均重量为1001克,中位数为999克,要求:1)求众数,2)对分配的偏斜情况进行说明。例1解:1)绘制三种平均数之间关系的示意图...从自动包装机包装的食品当中,抽出100袋检查,发现平均重125例2

某批零件,直径小于806mm的占全部的半数,测定结果,多数零件的直径表现为810mm,试估计该批零件直径的算术平均数,并指出零件直径口寸分配的偏斜程度。解:1)绘制三种平均数之间关系的示意图例2某批零件,直径小于806mm的占全部的半数,测定结果126例3“一般来说,一个城市的房价是高度偏态的。”根据你对这句话的理解:(1)画出城市房价的分布示意图;(2)如果要了解房屋价格的变化趋势,你会选择房价的算术平均数还是中位数,为什么?(3)如果未来确定交易费率,并估计相应的税收总额,你会选择算术平均数还是中位数,为什么?

(1)右偏分布;

(2)用中位数张家有个张千万,九个邻居穷光蛋;加在一起一平均,个个都有一百万。(3)税收总额=交易费率*房屋总价(房屋均价*房屋总面积)例3“一般来说,一个城市的房价是高度偏态的。”根据你对这127集中趋势弱、离中趋势强集中趋势强、离中趋势弱集中趋势弱、离中趋势强集中趋势强、离中趋势弱128第四节标志变异指标概念反映总体各单位变量值的差异程度,反映分配数列中以平均数为中心的各变量值变动的范围或离差程度,又称标志变动度。

甲组:5050505050乙组:4045505560丙组:1030507090作用可以衡量平均数的代表性高低;可以反映社会经济活动过程的稳定性和均衡性第四节标志变异指标概念反映总体各单位变量值的差异程度,反129测定指标全距总体各单位变量值中最大值与最小值之差。

全距=最大变量值-最小变量值对于分组资料,全距=最高组上限-最低组下限特点:是描述数据离散程度最简单的测度值,计算简单,易于理解。只反映两个极端变量值的差距,未考虑中间数据的变异情况。对于开口组则无法计算,不能准确描述数据的离散程度。测定指标全距总体各单位变量值中最大值与最小值之差。130平均差总体各单位的变量值与其算术平均数的离差的绝对值的算术平均数。0X1

x2

xn

1.由未分组资料计算平均差设4个人年龄20、21、23、24岁,试计算4个人年龄的平均差。平均差总体各单位的变量值与其算术平均数的离差的绝对值的算术平1312.由组距数列计算平均差先计算组中值,以组中值代表各组变量值,再按上述公式计算。

练习:某班学生按考分分组资料如下。考分(分)人数f60以下60-7070-8080-9090以上2481610合计40组中值x5565758595—1102606001360950328054685648130

356优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。2.由组距数列计算平均差先计算组中值,以组中值代表各组变量132方差和标准差各个标志值与其算术平均数的离差平方的算术平均数与它的平方根。简单平均式加权平均式方差:标准差:方差和标准差各个标志值与其算术平均数的离差平方的算术平均数与133例1某班上学期统计学课程考试成绩如下表,试计算标准差成绩(分)组中值x人数f60以下60~7070~8080~9090以上55657585952481610-27-17-7313729289499169145811563921441690合计-40--4840例1某班上学期统计学课程考试成绩如下表,试计算标准差成绩(分134根据例11某地大学生2010年消费情况计算人月消费额的方差和标准差(平均458元)例2月消费额(元)组中值x人数f300以下300~400400~500500~600600~700700以上250350450550650750801804302207020-208-108-892192292432641166464846436864852643461120209952027520186208025804801705280合计—1000——11736000根据例11某地大学生2010年消费情况计算人月消费额的方差和135练习某班学生按考试成绩分组资料如下:考分(分)人数(人)60以下260-70470-80880-901690以上10合计40试计算该班学生考试成绩的标准差。练习某班学生按考试成绩分组资料如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论