概率与数理统计第3章数据分布特征的描述_第1页
概率与数理统计第3章数据分布特征的描述_第2页
概率与数理统计第3章数据分布特征的描述_第3页
概率与数理统计第3章数据分布特征的描述_第4页
概率与数理统计第3章数据分布特征的描述_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3章数据分布特征的描述引例根据国家统计局对全国 31个省(自治区、直辖市)7.4万户农村居民家庭和 6.6万户城 镇居民家庭的抽样调查,2011年城乡居民收入增长情况如下来源于国家统计局网站的统计局公布:2011年全国城乡居民收入增长情况一文。 :2011年全国农村居民人均纯收入6977元,比上年增加1058元,增长17.9%。剔除价格因素影响,实际增长11.4%,增速同比提高0.5个百分点。其中,人均工资性收入2963元,同比增加532元,增长21.9%。工资性收入对全年农村居民增收的贡献率达50.3%。工资性收入占农村居民纯收入的比重达42.5%,同比提高1.4个百分点。2011年农村居

2、民人均纯收入中位数为6194元,比上年增加 995元,增长19.1%。农村居民人均纯收入中位数比人均 纯收入低783元,但增速高1.2个百分点。2011年城镇居民人均总收入23979元,其中,人均可支配收入21810元,比上年增加2701元,增长14.1%。剔除价格因素影响,城镇居民人均可支配收入实际增长8.4%,增速同比提高0.6个百分点。2011年城镇居民人均可支配收入中位数为19118元,比上年增加2279元,增长13.5%。城镇居民人均可支配收入中位数比人均可支配收入低2692元,增速低0.6个百分点。主要是受最低工资标准、城镇居民基本养老金和离退休金以及最低生活保 障标准提高影响,城

3、镇低收入户收入增速较高;同时高收入户也保持了较快的增长速度,所以中等收入户增速相对较慢。2011年城镇居民人均可支配收入与农村居民人均纯收入之比为3.13: 1,2010年该收入比为 3.23:1。本章小结总量指标是说明现象总规模和总水平的数值,又称为绝对数。绝对数的计量单位有实物单位和价值量单位。按反映总体内容不同,总量指标可分为总体单位总量和总体标志总 量;按反映的时间状况不同,总量指标可分为时期指标和时点指标。将两个有联系的数值对比得到的比率称为相对数。相对数既有无名数形式也有复名数形式。根据研究目的和对比基础的不同,有结构相对数、比例相对数、计划完成程度相对数、比较相对数、动态相对数和

4、强度相对数等。计算和应用相对数一定要注意正确选择对比 的标准、两个对比数值具有可比性、要与绝对数结合应用、多种相对数结合运用。3集中趋势的测度主要有数值平均数和位置平均数。数值平均数包括算术平均数、调和平均数和几何平均数。在社会经济统计中,算术平均数是最常用,调和平均数通常是作为加权算术平均数的变形。几何平均数主要用于计算平均比率或平均速度。上述几种平均数又有简单式与加权式之分。权数是权衡各个变量值影响作用轻重的数,可以是绝对数,也可以是相对数。位置平均数主要包括众数和中位数。 集中趋势的测度还可以利用分位数, 常用四分位数、 十分位数和百分位数等。算术平均数与众数、中位数和分位数结合运用,可

5、以详细描述数据 分布的特征。4离中趋势的测度通过变异指标来表示。变异指标主要包括极差、四分位差、平均差、方差、标准差和变异系数。方差和标准差是最常用的变异指标。比较不同性质或不同水平的变量的变异程度时,就须运用变异系数。偏态是指频数分布曲线的非对称的方向和程度,常用基于三阶中心矩 m3的偏态系数来测定。峰态是指频数分布曲线的尖峭程度,一般以四阶中心矩 m4为基础来计算峰度系数。基本知识梳理基本知识点含义或公式统计指标说明总体特征的概念与具体数字。统计指标由指标名称 (概念)、指标数值构成,是有计量单位或形式的数字。总量指标反映社会经济现象总体规模或总水平的指标。总量指标主要是通过计数、 度量得

6、到,一定有计量单位。流量和存量即时期指标和时点指标。流量有时间维度,具有可加性,指标数值大小与时间长短有关;存量不具有时间维度和可加性,指标数值大小与时间间隔没 有直接关系。国内生产总值(GDP)是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果,它 等于所有常住单位创造的增加值之和。相对指标两个有联系的统计数值对比的比率。平均指标反映总体各单位数据在一定时间、地点、条件下一般水平的综合指标。它 是将总体单位间数据差异抽象化后得到的一个代表值。有数值平均数和位 置平均数两种类型。3算术平均数未加权:送x x=n ;加权:x=Z xfZ fZ xfX 1 Z-xf;变形(调和平均数):

7、X几何平均数未加权:Xg=X1X1Xn .加权:Xg =y f,r=如x变异指标反映统计数据差异程度的综合指标,又称标志变动度。Yx-X送 X-x f平均差AD=1AD =未加权,n加权5Z f标准差;(x-x)2G=:送(X-x)2 fI jPF未加权,Yn;加权, Z f方差亠 E (xY)2CT 2=2送(x x) f未加权,n;加权,送f标准差系数V = 坊x主要用于判断数据的分布与正态分布的接近程度。偏态指变量值围绕其均偏态和峰态值的非对称方向和程度。偏度系数m3Skew-3 ;峰态指数据分布曲线的凸a起或平坦程度。峰度系数Kurt =m4-4CT练习题一、单项选择题(在 4个备选答

8、案中选出1个正确答案)1某商场某月商品销售额为1200万元,月末商品库存额为 400万元,这两个总量指标()A.是时期指标B.前者是时期指标,后者是时点指标C.是时点指标D.前者是时点指标,后者是时期指标2.国民总收入与国内生产总值之间相差一个( )A.出口与进口的差额B.固定资产折旧C.来自国外的要素收入净额D.来自国外的经常性转移收入净额3有三批产品,废品率分别为1.5%、2%、1%,相应的废品数量为 25件、30件、45件,则这三批产品平均废品率的计算式应为()A 1.5% 十2%+1%B. 3 1.5% 2% 1%C 1.5% - 2% 1%25 3045D 25 +30 + 45.3

9、0_452% 1%1.5%4下列各项中,超额完成计划的有(利润计划完成百分数103.5%单位成本计划完成百分数103.5%C.建筑预算成本计划完成百分数103.5%D.流通费用率计划完成百分数103.5%5.某厂某种产品生产量 1月刚好完成计划,2月超额完成2%,3月超额完成4%,则该厂该年一季度各月平均超额完成计划的计算方法是(A.2%+4% =6%(2%+4%)吃=3%C.(2%+4%) =2%D.(各月实际数之和 十各月计划数之和)-1甲、乙两组工人的平均日产量分别为18件和15件。若甲乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量(A.上升B

10、.下降C.不变D.可能上升,也可能下降当各个变量值的频数相等时,该变量的(A.众数不存在众数等于均值众数等于中位数D.众数等于最大的数据值 TOC o 1-5 h z 如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?()算术平均数B.几何平均数C.中位数D.众数 某年末某地区城市和乡村平均每人居住面积分别为30.3和33.5平方米,标准差分别为12.8和13.1平方米,则居住面积的差异程度()A.城市大B.乡村大C.城市和乡村一样D. 二者不能比较 下列数列的平均数都是50,在平均数附近散布程度最小的数列是()A. 02040506080100B. 048495051521

11、0001250 9899100D. 04749505153100二、多项选择题(在 5个备选答案中选择 2-5个正确答案)应该用加权算术平均法计算平均数的有()已知各组职工工资水平和各组职工人数,求平均工资已知各组职工工资水平和各组工资总额,求平均工资已知各组计划完成百分数和各组计划产值,求平均计划完成百分数已知各组计划完成百分数和各组实际产值,求平均计划完成百分数已知各组职工的劳动生产率和各组职工人数,求平均劳动生产率2中位数是(A.第2四分位数B.第50百分位数C.第3四分位数D.位置最中间的那个数E.位置平均数3下列表述是正确的有()A.对一个数列的每一项加6,那么平均数也加 6B.对一

12、个数列的每一项加6,那么标准差也加 6对一个数列的每一项乘以一个常数,那么平均数也乘以该常数对一个数列的每一项乘以一个常数,那么标准差也乘以该常数对一个数列的每一项改变符号,那么也改变了标准差的符号A.国民总收入 国内生产总值C.国内生产净值 国民净收入E.国内生产总值 国民净收入 5标志变异指标可以反映(A.平均数的代表性大小C. 一组数据的集中趋势E. 一组数据的分布特征4若国外净要素收入为正数,则以下总量指标的数量关系为(B.国内生产总值 国民总收入国民净收入 国内生产净值)B.社会经济活动过程的节奏性和均匀性一组数据的离中趋势三、判断分析题(判断正误,并简要说明理由)1并非任意一个变量

13、数列都可以计算其算术平均数、中位数和众数。2某企业某年各季度销售额和利润资料如下:季度1234销售额(百万兀)150180200210利润率(%)30323536则该年各季度平均利润率为( 30%+32%+35%+36%)/ 4 = 33.25%。3某企业计划劳动生产率比上年提高10%实际只提高了 5%表明劳动生产率计划只完成了一半。4一个数列的每一项乘以 2,则方差也为原来的 2倍。四、简答题1统计数据的分布特征包括哪些方面进行描述?它们的测度值分布有哪些?某企业在年终分析报告中写道:我厂今年计划实现增加值8000万元,实际完成了9000万元,超额完成计划 12.5 %;销售利润率计划达 1

14、2%,实际达到15%,超额完成计划3%;产品成本计划下降 5%,实际降低了 3%,差2%完成计划;劳动生产率计划较上年增 长8%,实际增长了 10%,劳动生产率计划超额完成25%。”指出上述报告中的错误之处,并将其更正。某企业生产一种产品需顺次经过四个车间,这四个车间某月的废品率分别为1.5%、2.0%、2.5%和1%,该企业该月这种产品的平均废品率是多少?4某班同学共50人,分为甲、乙两组。甲组学生 20人,统计学平均成绩 78分,标准 差8分;乙组学生30人,统计学平均成绩 72分,标准差10分。则该班50名学生的平均成 绩及标准差是多少?某公司管理层决策,对公司所有员工每月增加200元的

15、收入用以交通补贴,则:全体员工月收入的均值、中位数和众数分别会怎样变化?用极差、四分位差、平均差和标准差来衡量员工收入的差异程度,增加收入后各 个变异指标的数值会怎样变化?增加收入后,员工收入分布曲线的偏度和峰度有无变化? 如果是每个员工增加的收入为各自工资的6%,则上述三个问题的答案是什么?五、计算题1某商业企业9月份各天的销售额数据如下(单位:万元) :207226247202188260190186215228221242211231251224217230241208222234218253223213272199219245试计算:该企业日销售额的均值、中位数和众数。去掉两个最高销售

16、额和两个最低销售额的切尾均值。下、上四分位数,极差和四分位差。平均差、标准差和方差。2某调查机构对两个城市居民住房满意程度的状况进行调查,结果如下表所示。回答类别调查结果甲城市(人)乙城市(人)非常不满意2423不满意10872一般9317满意4520非常满意3018试从数据分布的集中趋势和离中趋势来分析两个城市居民各自对住房满意程度。3两地粮食生产情况如下表:甲地乙地播种面积总产量(吨)单产(吨)播种面积总产量(吨)单产(吨)公顷比重()公顷比重(%)山地100030005400丘陵600011905600平原10005250510合计3333340013850(1)计算填出表中空缺的数据;

17、(2)哪个地区的粮食生产情况好些?分析其原因。4某一牧场主每年饲养 600头牛。现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。原品种牛和改良品种牛的利润如下:净利润(元/头)原品种牛改良品种牛频数频率(%)频率(%)-200366.010122.0220018631.05740036661.040合计600100100(1)牧场主应该选择哪一种品种?为什么?(2)改良品种牛的利润和频率可能与上表的计算值有差异。当改良品种牛的利润有什么变化时,牧场主会改变他在(1 )中所做的选择?5上海证券交易所,某周三只汽车行业上市公司的普通股股票的

18、收盘价(单位:元)如下:时间甲公司乙公司丙公司周一7.7011.7123.28周二7.4611.6223.27周三7.5211.3523.21周四7.6211.8422.96周五7.5711.7223.28比较三只股票的风险程度(价格的波动程度)。对某电子元件使用寿命的实验中,50只电子元件在连续 500小时的寿命实验结果如下:实验时间(小时)仍然工作的灯泡数量(个)01002003004005005046341770计算这批电子元件使用寿命的算术平均数、中位数、众数,并指出这批电子元件寿命分布曲线的偏态情况。六、案例分析某市主要年份城市居民按人均可支配收入分组的家庭户占全部家庭户的比重(% )资料如下:按人均可支配收入分组(t-5)年t年(t+1 )年(t+2 )年(元)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论