经济师考试(中级)经济基础全真试题_第1页
经济师考试(中级)经济基础全真试题_第2页
经济师考试(中级)经济基础全真试题_第3页
经济师考试(中级)经济基础全真试题_第4页
经济师考试(中级)经济基础全真试题_第5页
已阅读5页,还剩219页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计数据的描述2.1数据的计量尺度2.2统计数据的计算指标2.3统计数据的来源

2.4统计数据的质量2.5统计数据的整理2.6分布集中趋势的测度12.7分布离散程度的测度2.8分布偏态与峰度的测度2.9茎叶图与箱线图2.10统计表与统计图22.1数据的计量尺度数据的计量尺度定类尺度定序尺度定距尺度定比尺度32.1.1列名尺度对事物进行平行的分类和分组,数据表现为“类别”,之间的关系是并列的。(定类尺度)计量层次最低各类别可以指定数字代码表示使用时必须符合穷尽和互斥的要求具有=或的数学特性42.1.2顺序尺度对事物分类的同时给出各类别的顺序(定序尺度)比定类尺度精确未测量出类别之间的准确差值具有>或<的数学特性52.1.3间隔尺度既能比较事物大小,又可计算差异大小的准确测度(定距尺度)比定序尺度精确数据表现为“数值”,如成绩、温度没有绝对零点(0表示一个数值)具有+或-的数学特性62.1.4比例尺度对事物的准确测度(定比尺度)与定距尺度处于同一层次数据表现为“数值”,如利润1万元。有绝对零点(0表示没有或不存在)具有或的数学特性7!四种计量尺度的比较√比值√√间距√√√排序√√√√分类定比尺度定距尺度定序尺度定类尺度8!数据类型与统计方法数据类型与统计方法定类数据定序数据品质数据数量数据定距数据定比数据参数方法非参数方法92.2统计数据的计算指标时期指标时点指标统计指标相对指标总量指标平均指标比例比率102.2.1总量指标

总量指标的概念和作用总量指标的种类计算和应用总量指标的原则11★总量指标概念

总量指标:是反映社会经济现象在一定时间、地点条件下所达到的总规模、总水平、工作总量及其增减量的综合指标。它的表现形式是绝对数,因此也称为绝对指标。

作用:总量指标是反映一个国家、一个地区或一个企业人力、物力、财力状况和加强宏观经济管理与企业经济核算的基本指标。总量指标是计算相对指标和平均指标的基础指标。12★总量指标的种类总量指标时间状态内容计量单位总体总量标志总量时期指标时点指标实物指标价值指标劳动量指标13按其反映的内容分类总体单位总量:即总体单位数之和,它是由每个总体单位加总而得到的,反映总体规模的大小总体标志总量:是指总体各单位某一数量标志值的总和,反映总体的规模和水平。总体单位总量和总体标志总量,并不是固定不变的,它随着研究目的的不同而变化。14按其时间状态分类时期指标:又称时期数,指反映社会经济现象在一段时期内所达到的总规模、总水平或工作总量。如产品的产值、商品销售额、工资总额等。时点指标:又称为时点数,指反映社会经济现象在某一时点(时刻)所达到的数量状态,如年末人口数(或人口普查中,11月1日零时人口数)、月末商品库存额、季末银行存款余额、年末固定资产净值等。15时期指标与时点指标的区别1)时期指标可以累计相加,各时点指标不能累计相加。2)时期指标数值的大小与时期的长短密切相关,时点指标数值的大小与时期长短无直接的关系。3)时期指标是连续计量,时点指标是间断计量的。

16实物指标:以实物单位计量的总量指标,即以事物的物理属性或自然属性作为计量单位的指标。自然单位,如人口用人,汽车用辆等;度量衡单位,如棉布用米,木材用立方米等;专用单位,如电用度、热量用焦耳等;复合单位,如货物周转量用吨/千米等;标准实物单位,如标准棉纱、标准吨煤等。价值指标:以货币为计量单位的总量指标。劳动量指标:是指以劳动量单位计量的总量指标。即以劳动时间为计量单位的指标。

按计量单位分类17★计算与应用总量指标的原则1、正确确定指标的含义与计算范围。2、计算实物总量指标时只有同类才能相加。3、使用统一计量单位。4、总量指标、相对指标、平均指标要结合运用。182.2.2相对指标

相对指标的概念和作用总量指标的种类与计算计算和应用相对指标的原则19相对指标:是两个有联系的总量指标进行对比的比值,它反映社会经济现象之间数量对比关系,也称为相对数。作用1、说明社会经济现象之间的数量对比关系。2、把社会经济现象的绝对差异抽象化,使原来不能直接对比的统计指标可以进行对比。★相对指标(概念与作用)20★相对指标的表现形式1、无名数:是一种抽象化的数值,通常的表现为成数、系数、倍数、百分数、千分数等。相对指标在很多场合都用无名数表示。2、有名数:是指有具体内容的计量单位的数值,它有单名数和复名数之分。总量指标和部分相对指标用单名数表示,如商品流转速度指标用“次”或“天”表示;有些相对指标如强度相对数,则通常采用分子指标与分母指标的计量单位共同构成的复合单位,即复名数表示。如人口密度用“人/平方千米”表示,人均国民生产总值用“元/人”表示,商业网密度用“人/个”或“个/千人”表示等。21★相对指标的种类与计算强度相对数相对指标计划完成相对数结构相对数动态相对数比较相对数比例相对数22计划完成相对数:是计划期内实际完成数与计划数对比的比值。它表明某一时期内某种计划的完成程度,一般用百分数表示,故又称计划完成程度或计划完成百分数。基本公式1相对指标的计算

——计划完成相对数实际完成数计划完成数×100%计划完成相对数=派生公式1+实际增长率1+计划增长率×100%计划完成相对数=1-实际降低率1-计划降低率×100%计划完成相对数=23将计划末期实际所达到的水平与同期计划规定应达到的水平对比计算计划完成相对数的方法。用水平法在计算提前完成时间时,应以计划期内连续一年(12个月)实际达到计划规定水平为准。计算公式中长期计划完成相对数的计算

——水平法计划期末年实达水平×100%计划完成相对数=计划期末年应达水平24中长期计划完成程度——水平法(算例)第一年第二年上半年上半年一季四季三季二季第四年第三年第三年一季四季三季二季第五年5年合计时间产量11012266743738424953586572775[例2.1]甲企业某五年计划规定,A产品产量在计划期最后一年应达到200万吨,实际执行结果如下表,计算该企业计划完成相对数。计划期末年实达水平×100%=计划完成相对数=计划期末年应达水平20053+58+65+72=124%解:25中长期计划完成相对数的计算

——累计法将计划期内各年累计实际完成数与同期计划规定的累计数对比计算计划完成相对数的方法。适用于检查计划期内构成国民财产存量的经济指标,如固定资产投资、住宅建设等计划完成情况。计算公式计划内各年累计实际完成数×100%计划完成相对数=同期计划规定的累计数26中长期计划完成程度——累计法(算例)[例2.2]某市某五年计划规定,整个计划期间基建投资总额应累计达到500亿元,实际执行结果如下表,试计算该市五年基建投资额计划完成程度和提前完成计划时间。500第一年第二年一季四季三季二季第五年5年合计时间投资额1401354022525第三年第四年70801820解:计划期内各年累计实际完成数×100%计划完成相对数=同期计划规定累计数525=105%=27既可用于检查全期计划完成程度,又可以用来检查计划执行过程的进度。计算公式计划执行进度相对数的计算计划内某月止累计完成数×100%计划执行进度=本期计划完成数28解:1-9月计划执行进度=1125/1500×100%=75%计算结果说明,该公司1-9月份销售额累计完成年计划的75%,其计划执行进度与时间同步,只要第四季度保持前三季度的平均水平或有所提高,则年末就能完成或超额完成全年计划。计划执行进度相对数的计算(算例)[例2.3]某公司某公司2010年计划完成商品销售额1500万元,1-9月止累计实际完成1125万元,计算其计划执行进度。29结构相对数:是总体中某部分数值与该总体数值对比的比值,它反映总体内部构成情况,一般用百分数表示。计算公式2相对指标的计算

——结构相对数注意:同一总体的结构相对数之和应为100%,且结构相对数的分子分母位置不能互换。结构相对数=总体数值总体某部分数值×100%30恩格尔系数与消费结构分析消费结构:是指各类消费支出在总消费支出中所占的比重。恩格尔系数:19世纪德国统计学家恩格尔根据对英国、法国、德国、比利时等国居民家庭收支的分析研究,指出:随着家庭收入增加,家庭收入或总支出中用于食品方面的支出比重越来越小,即恩格尔定律,反映这个定律的系数,称为恩格尔系数。恩格尔系数=食品支出总额/消费支出总额结构相对数的计算

(算例)31恩格尔系数与消费结构分析(算例)[例2.4]已知某地有关资料如下表:50.5147.7445.6842.3540.7240.59恩格尔系数(3)=(2)/(1)186.88384.55605.88820.631047.521200.24

94.39183.58276.77347.54426.55487.18200520062007200820092010人均生活费支出(元)(2)人均食品支出(元)(1)年份从上表数据可看出,该地恩格尔系数不断下降,由2005年的50.51%降至10年的40.59%。说明该地经济发展较好,人民生活水平提高很快。32比例相对数:是同一总体某一部分数值与另一部分数值对比的比值,它反映总体各部分间的内在联系和比例关系,一般用比数表示。计算公式3相对指标的计算

——比例相对数注意:比例相对数的分子分母同属一个总体,而且分子与分母的位置可以互换。比例相对数=总体中另一部分数值总体中某一部分数值人口的性别比例、积累与消费比例、固定资产与流动资产的比例等社会活动中许多重大比例关系,都是通过计算比例相对数来反映事物内部各组成部分的内在联系和比例关系的。33比较相对数:是同一时间的同类指标在不同空间对比的比值,它反映不同国家、不同地区或不同单位之间的差异程度,一般用百分数或倍数表示。计算公式4相对指标的计算

——比较相对数注意:比较相对数与比例相对数类似,分子与分母也可以互换。两者的差别为比例相对数是同一总体的不同部分比较,而比较相对数是同类指标的不同空间比较。比较相对数=乙地区(单位)同一指标数值甲地区(单位)某指标数值×100%34动态相对数:是某一社会经济现象在不同时期两个数值对比的比率。它反映该现象在时间上的发展变化方向和程度,也称为发展速度和指数。计算公式5相对指标的计算

——动态相对数动态相对数=基期指标数值报告期指标数值×100%35强度相对数:是两个性质不同而又有联系的指标对比的比率,它反映现象的强度、密度和普及程度,是一种特殊形式的相对数。计算公式6相对指标的计算

——强度相对数注意:强度相对数一般以有名数表示,如商品流转次数用单名数“次”表示,人均粮食产量用复名数“千克/人”表示;也可以采用百分数、千分数等无名数表示,如商品流通费用率用百分数表示。强度相对数=另一有联系指标数值某一指标数值36有些强度相对数的分子和分母可以互换,形成正指标与逆指标两种计算方法。正指标数值大小与其反映的强度、密度和普及程度成正比;逆指标的数值大小与其反映的强度、密度和普及程度成反比[例2.5]某地区2010年零售商业网点为50000个,年平均人口为800万人,则:零售商业网密度=50000/800 =62.5(个/万人)(正指标)零售商业网密度=800/50000=0.016(万人/个)=160(人/个)(逆指标)强度相对数37计算和应用相对指标的原则1、两个对比指标要有可比性2、相对指标要与总量指标结合运用3、各种相对指标结合运用38有两个台湾观光团到日本伊豆半岛旅游,路况很坏,到处都是坑洞。一位导游连声说路面简直像麻子一样。而另一个导游却诗意盎然地对游客说:“我们现在走的正是赫赫有名的伊豆迷人酒窝大道。”

——思想是何等奇妙的事,如何去想,决定权在你。392.3统计数据的来源2.3.1间接获取的数据(第二手数据)报纸图书杂志统计年鉴调查公司网络(政府网站)402.3.2直接获取的数据(组织形式)统计数据搜集的组织形式统计报表抽样调查普查重点调查典型调查411统计表报

(概念要点)按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据统计调查方式之一过去曾经是我国主要的数据收集方式有各种各样的类型制度性:依法颁布、强制执行、制定统计报表要遵循适用与精简原则。422普查

(概念要点)5.费时间、人力、物力和财力6.应用范围比较狭窄,如国情、国力433抽样调查

(概念要点)1、从总体中随机抽取一部分单位(样本)进行调查2、目的是推断总体的未知数字特征3、最常用的调查方式4、具有经济性、时效性强、适应面广、准确性高等特点444重点调查和典型调查重点调查1.一种非全面调查,它是在调查对象中只选择其中的一部分为数不多但举足轻重的重点单位所进行的调查。2.重点单位:是指那些标志值在总体标志总量中占有很大的比重的单位,它能够反映出总体的基本情况。典型调查1.从调查对象的全部单位中选择少数典型单位进行调查452.3.3统计数据的搜集方法数据的搜集方法统计调查法科学实验法访问调查电话调查邮寄调查电脑辅助座谈会个别深访直接观测法461直接观测法

(概念要点)由调查人员深入调查现场,根据研究目的,运用感觉器官或借助科学仪器,对调查对象进行现场直接观察、点数、计量或测量,以此获取所需数据资料的一种调查方法。如农产品抽样调查中的实割实测、商品库存盘点、车辆流量调查、旅客流量调查等都采用直接观测法。472访问调查

(概念要点)调查者与被调查者通过面对面地交谈而获得资料有标准式访问和非标准式访问标准式访问通常按事先设计好的问卷进行非标准式访问事先一般不制作问卷483邮寄调查

(概念要点)通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷寄回指定收集点(也称邮寄问卷调查)是一种标准化调查调查者与被调查者没有直接的语言交流,信息的传递依赖于问卷问卷或表格的发放方式有邮寄、宣传媒介传送、专门场所分发三种

494调查

(概念要点)调查者利用与被调查者进行语言交流以获得信息时效快、成本低问题的数量不宜过多 505电脑辅助调查

(概念要点)电脑与相结合完成调查的全过程(又称电脑辅助调查)一般需借助专门的软件进行硬件设备要求较高 516座谈会

(概念要点)1. 将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得资料(也称集体访谈)2. 参加座谈会的人数不宜过多,一般为6~10人3. 侧重于定性研究527个别深度访问

(概念要点)一次只有一名受访者参加、针对特殊问题的调查适合于较隐秘的问题,如个人隐私问题;或较敏感的问题,如政治方面的问题侧重于定性研究538实验法

(概念要点)在设定的特殊实验场所、特殊状态下,对调查对象进行实验以获得所需资料有室内实验法和市场实验法549其它报告报表法互联网调查法遥感法552.3.4调查方案设计调查方案的内容调查目的调查对象调查单位调查项目和调查表调查时间调查实施561调查目的调查要达到的具体目标回答“为什么调查?”调查之前必须明确572调查对象和调查单位调查对象:调查研究的总体或调查范围调查单位:需要对之进行调查的单位。可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)回答“向谁调查?”58附:2009年中国房地产价格

调查对象及单位(1)各级政府房地产行政主管部门,如房管局、土管局、房屋土地交易中心等。(2)房地产企业。(3)房地产经营机构。(4)物业管理企业。(5)有关企事业单位、机关团体及部分居民。593调查项目和调查表

1.调查项目:调查的具体内容2.调查表:表现调查项目的表格或问卷3.回答“调查什么?”Q1…………Q2…………Q3…………Q4…………60附:2009年中国房地产价格

调查内容(1)房屋销售价格。包括新建房和二手房销售价格两个部分。(2)房屋租赁价格。主要指各类房屋的市场租金,包括住宅租金和非住宅租金。(3)物业管理价格。(4)土地交易价格。指房地产开发商或其他建设单位在开发之前,为取得土地使用权而实际支付的价格,不包括土地的后续开发费用、税费、各种手续费和拆迁费等。61

1)调查时间:统计资料所属时间统计调查工作进行的时间及期限2)调查方法:包括资料的搜集方法和调查的组织形式需要与调查对象和调查单位的实际结合使用4调查时间与调查方法

62附:2009年中国房地产价格

调查方法(1)该调查为“非全面调查”,采用重点调查与典型调查相结合、统计报表与调查员实地采价相结合的方式方法。(2)所选调查单位的房地产营业额总值一般应占本地区总额的75%以上。(3)调查样本的选取原则:选取正常销售的房屋;在同一个房屋类型里,从销售量较大(楼层、套型、朝向等)的房屋中抽选。635调查工作的组织实施计划调查工作的领导机构和办事机构;调查人员的组织调查资料的报送办法调查前的宣传、培训、调查文件的准备工作调查经费的预算和开支办法调查方案的传达、试点及其他工作64附:调查问卷设计

一、问卷设计的目标

1、根本目标:符合调研与预测需要及获取足够、适用和准确的信息资料。

2、具体目标

1)便于为管理者提供必要的决策信息。2)便于应答者回答。3)便于编辑和数据处理。

3、调查问卷的功能

把研究目标转化为特定问题;使问题和回答标准化;通过措辞、问题流程与卷面设计来促进合作;记载记录原始数据;加快数据分析过程;进行有效性测试。65附:问卷设计

二、问卷设计的原则1、合理性

====体现调查主题其实质是在问卷设计之初要找出与“调查主题相关的要素”。如:“调查某化妆品的用户消费感受”——从问题出发,特别是结合一定的行业经验与商业知识,要素是能够被寻找出来的:一是使用者(可认定为购买者);二是购买力和购买欲;三是产品本身。

66附:调查问卷设计

2、一般性

====问题的设置是否具有普遍意义,避免带有一定常识性的错误。如问题:你通常选择哪一种广告媒体:答案:a、报纸;b、电视;c、杂志;d、广播;e、其它答案:a、报纸;b、车票;c、电视;d、墙幕广告;e、汽球;f、大巴士;g、广告衫;h、……

67附:调查问卷设计

3、逻辑性:要有整体感问题与问题之间要具有逻辑性。如问题:

1、你通常每日读几份报纸?

a、不读报;b、l份;c、2份;d、3份以上;

2、你通常用多长时间读报?

a、10分钟以内;b、半小时左右;c、l小时;d、l小时以上;

3、你经常读的是下面哪类(或几类)报纸?

a、×市晚报;b、×省日报;c、人民日报;d、参考消息;e、中央广播电视报;f、足球4、明确性:命题是否准确?提问是否清晰明确、便于回答;被访问者是否能够对问题作出明确的回答等。如:问题:您的婚姻状况:答案:I、已婚;Ⅱ、未婚;

68附:调查问卷设计

5、非诱导性:非诱导性指的是问题要设置在中性位置、不参与提示或主观臆断,完全将被访问者的独立性与客观性摆在问卷操作的限制条件的位置上。===如:问题:你认为这种化妆品对你的吸引力在哪里?

答案:a、色泽;b、气味;c、使用效果;d、包装;e、价格;f、……

答案设置:a、迷人的色泽;b、芳香的气味;c、满意的效果;d、精美的包装6、便于整理、分析。

69附:调查问卷设计

三、问卷的基本结构

1.开头部分:问候语、填表说明、问卷编号。

2.甑别部分:

3.主体部分:问题及答案。

4.背景部分:70附:调查问卷设计

四、问卷设计的方法1、自由记述式2、填答式3、二元选择式4、多元选择式5、排序式6、利克特量表(评定尺度法)====它是让被调查者在“非常同意”、“同意”、“中立”、“有点不同意”、“很不同意”这五个等级上做出与其想法一致的选择。利克量表既能用于邮寄调查,也能用于访问。7、语义差异量表语义差异量表是用两极修饰词来评价某一事物,在两极修饰词之间共有七个等级,分别表示被调查者的态度程度。8、数值分配量表9、双向列联法71五、问卷设计的步骤

1、明确调研目的:与决策者沟通;访问行业专家;收集并分析二手资料;定性调研。

2、确定数据收集方法

3、确定问题的回答方式:开放式、封闭式。4、决定问题的措辞

1)用词必须清楚2)选择词语以避免引起应答者误差。不应该诱导受访者回答特定答案。3)考虑到应答者回答问题的能力问题不应该超越受访者的能力与经验。问题中涉及的细节不应超出受访者的记忆能力。4)考虑到应答者回答问题的意愿。有问题应答者不愿意给出真实的回答,或回答时故意朝合乎社会需要的方向歪曲。725、确定问卷流程和编排

1)问题的典型排列顺序:过滤性问题——热身性问题——过渡性问题——主题性问题——较复杂或难以回答的问题——分类与人文统计问题?

2)关于问卷流程的基本准则如下:运用过滤性问题识别合格应答者;只有合格应答者参加访谈,才能得到每类合格应答者的最小数量(配额)。以一个令人感兴趣的问题开始访谈(用一个年龄或收入问题作为初始问题是一大错误。)。先问一般性问题。使人们先开始考虑有关概念、公司或产品类型,然后再问具体的问题。6、评估问卷,获得各方的认可

专家评价:上级评价:被调查者评价;自我评价。7、预先测试和修订

8、准备最终的问卷文本,制表、打印和印刷问卷

===一份完整的问卷在使用前还应准备访问指导书、督导员手册、访问执行表、访问执行总表、调研样本分配表、访问实施过程表、受访者态度应对表等材料。732.4统计数据的质量2.4.1统计数据误差1非抽样误差(登记性误差)•由于调查中的各环节的工作失误造成,包括:调查方案规定或解释不明导致,不完整的抽样框导致,调查中的不回答导致•理论上可避免•瞒报触犯《统计法》742抽样误差抽样误差:是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标与总体指标之间的绝对离差。影响抽样误差大小的因素:1)总体各单位标志值的差异程度。2)样本的单位数。3)抽样方法及抽样调查的组织形式。•客观存在为主(偏差;代表性误差)•可以计量和控制:随机原则、样本容量752.4.2统计数据的审核数据的审核(原始数据)审核的内容完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全准确性审核检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否有错误,计算是否正确等76数据的审核(原始数据)

审核数据准确性的方法逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象主要用于对定类数据和定序数据的审核计算检查检查调查表中的各项数据在计算结果和计算方法上有无错误主要用于对定距和定比数据的审核77数据的审核(第二手数据)

1.适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要2.时效性审核应尽可能使用最新的统计数据3.确认是否必要做进一步的加工整理782.4.3数据的筛选1.对审核过程中发现的错误应尽可能予以纠正2.当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选==数据筛选的内容包括:将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出79同样是小学三年级的学生,他们将来志愿同是当小丑。中国老师斥之为:“胸无大志,孺子不可教也!”外国老师则会说:“愿你把欢笑带给全世界!”

——身为长辈的我们,不但要求多于鼓励,更以狭窄界定了成功的定义。802.5统计数据的整理812.5.1数据的排序

1.排序的意义1)发现一些明显的特征或趋势,找到解决问题的线索2)有助于对数据检查纠错,以及为重新归类或分组等提供依据3)在某些场合,排序本身就是分析的目的之一822.排序的方法

1)定类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分2)定距和定比数据的排序递增排序:设一组数据为X1,X2,…,XN,递增排序可表示为:X(1)<X(2)<…<X(N)递减排序可表示为:X(1)>X(2)>…>X(N)832.5.2统计数据的整理过程2.5.2.1数据整理的基本问题1.要弄清所面对的数据类型:1)对定类数据和定序数据主要是做分类整理2)对定距数据和定比数据则主要是做分组整理2.数据整理的一般内容:

1)选择分类或分组的名称2)确定分类或分组的界限3)计算频数、频率、累计频数等

4)编表或绘图842.5.2.2品质数据的整理过程定类数据的整理(显示)定序数据的整理(显示)851.定类数据的整理

(基本过程)1、列出各类别2、计算各类别的频数3、制作频数分布表4、用图形显示数据86定类数据的整理

(可计算的指标)频数:又称次数,是落在各类别中的数据个数。频率:某一类别数据的频数占总体单位个数的比重。87定类数据整理—频数分布表

(实例)【例2.6】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”

1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招聘广告;6.其他广告。表2-1

某城市居民关注广告类型的频数分布

广告类型人数(人)频率频率(%)商品广告服务广告金融广告地产广告招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计200110088定类数据的图示—条形图条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。条形图有单式、复式等形式。在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率。绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。89定类数据的图示—条形图

(由Excel绘制的条形图)人数(人)5191610211204080120

商品广告

服务广告

金融广告

房地产广告

招生招聘广告

其他广告广告类型

图2-1某城市居民关注不同类型广告的人数分布90定类数据的图示—圆形图1.也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形。2.主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。3.在绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的。===关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为3600×25.5%=0,其余类推。91定类数据的图示—圆形图

(由Excel绘制的圆形图)

其他广告1.0%

房地产广告8.0%

商品广告56.0%

金融广告4.5%

服务广告25.5%

招生招聘广告5.8%图2-2某城市居民关注不同类型广告的人数构成922.定序数据的整理

(可计算的指标)1.累计频数:将各类别的频数逐级累加2.累计频率:将各类别的频率逐级累加93定序数据频数分布表A

(实例)

【例2.7】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?

1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。

表2-2

甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————94定序数据频数分布表B(实例)

表2-3乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0————95定序数据图示—累计频数分布图243001322252700100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(a)向下累积27616830300750100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(b)向上累积图2-3甲城市家庭对住房状况评价的累积频数分布96定序数据的图示—环形图环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环环形图可用于进行比较研究环形图可用于展示定类和定序的数据97品质数据的图示—环形图

(由Excel绘制的环形图)8%36%31%15%7%33%26%21%13%10%

非常不满意

不满意

一般

满意

非常满意

图2-4甲乙两城市家庭对住房状况的评价982.5.2.3数值型数据的整理过程99频数分布表的编制(实例)

117122124129138107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115138128124121【例2.8】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。1001编制频数分布表的步骤确定组数编制频数分布表的步骤确定组距计算频数编表绘图1012统计分组方法分组方法等距分组异距分组单变量值分组组距分组102单变量值分组法

(要点)1.将一个变量值作为一组的方法。2.特点:适合于离散变量适合于变量值较少的情况103单变量值分组表(实例)

表2-4某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137138211122112104组距式分组法

(要点)1.将变量值的一个区间作为一组的方法。2.特点:适合于连续变量适合于变量值较多的情况遵循“不重不漏”的原则~~~~~105组距式分组(步骤)

1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K2.确定各组的组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即

组距=(最大值-最小值)÷组数3.确定组限4.计算频数或频率5.编表或绘图

106组距分组

(几个概念)1.下限:一个组的最小值2.上限:一个组的最大值3.组距:上限与下限之差4.组中值:下限与上限之间的中点值下限值+上限值2组中值=107等距分组表

(上下组限重叠)表2-5某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计50100108等距分组表

(上下组限间断)表2-6某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计50100109等距分组表

(使用开口组)表2-7某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合计501001103分组数据—直方图

(直方图的制作)1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)1111分组数据—直方图

(直方图的绘制)频数(人)1512963105110115120125130135140日加工零件数(个)直方图下的面积之和等于1图2-5

某车间工人日加工零件数的直方图112分组数据—直方图

(直方图与条形图的区别)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列113分组数据—折线图

(折线图的制作)折线图也称频数多边形图(Frequencypolygon)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉。折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的。1141512963105110115120125130135140日加工零件数(个)频数(人)折线图下的面积与直方图的面积相等!分组数据—折线图

(折线图的绘制)图2-6某车间工人日加工零件数的折线图1154几种常见的频数分布的类型对称分布右偏分布左偏分布正J型分布反J型分布U型分布116自算某大学管理学院教职工年龄如下,试编制组距为10的等距式分布数列。===19212829313738303041414850425059515852594040117妻子正在厨房炒菜。丈夫在她旁边一直唠叨不停:“慢些、小心!火太大了。赶快把鱼翻过来、油放太多了!”妻子脱口而出:“我懂得怎样炒菜。”丈夫平静地答道:“我只是要让你知道,我在开车时,你在旁边喋喋不休,我的感觉如何……”

——学会体谅他人并不困难,只要你愿意认真地站在对方的角度和立场看问题。1182.6分布集中趋势的测度数据分布主要特征:集中趋势(位置)离中趋势

(分散程度)偏态和峰度(形状)119数据分布特征的测度:数据的特征和测度分布的形状集中趋势离散程度众数中位数离散系数方差和标准差四分位差异众比率位置平均数数值平均数算术平均数调和平均数几何平均数偏态峰度120集中趋势

(平均指标)1.一组数据向其中心值靠拢的倾向和程度,测度集中趋势就是寻找数据一般水平的代表值或中心值(即计算平均指标)。3.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据4.选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定1212.6.1众数Mo

(概念要点)1.定义:一组数据中出现次数最多的变量值,是集中趋势的测度值之一。(稳健性)4.主要用于定类数据,也可用于定序数据和数值型数据5.假定:数据分布具有明显的集中趋势,且众数组的频数在该组内是均匀分布的122众数

(众数的唯一性?)无众数

原始数据:10591268无众数

原始数据:252828

364242一个众数

原始数据:65

98551231定类数据的众数

(算例)【】根据表2-8中的数据,计算众数表2-8

某城市居民关注广告类型的频数分布

广告类型人数(人)比例频率(%)商品广告服务广告金融广告地产广告招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100解:这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即

Mo=商品广告1242定序数据的众数(算例)

【】根据表2-9中的数据,计算众数表2-9

甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510合计300100.0解:这里的数据为定序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即

Mo=不满意1253数值型分组数据的众数

(要点及计算公式)1.众数的值与相邻两组频数的分布有关4.

该公式假定众数组的频数在众数组内均匀分布2.相邻两组的频数相等时,众数组的组中值即为众数Mo3.相邻两组的频数不相等时,众数采用下列近似公式计算MoMo126数值型分组数据的众数(算例)

【例2.11】根据表2-10中的数据,计算50名工人日加工零件数的众数表2-10某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—1272.6.2中位数Me(概念要点)

1.一组数据排序后处于中间位置上的值,集中趋势的测度值之一。2.不受极端值的影响(稳健性)3.主要用于定序数据,也可用数值型数据4.各变量值与中位数的离差绝对值之和最小,即Me50%50%1281未分组数据的中位数的计算129数值型未分组数据的中位数计算

(5个数据的算例)原始数据:2422212620排序: 2021222426位置: 123 45Me=22130数值型未分组数据的中位数

(6个数据的算例)原始数据:105 91268排序:56891012位置: 123

4

56===位置:n/2=3,(n+1)/2=4Me

8+928.51312定序数据的中位数(算例)

【例2.12】根据表2-11中的数据,计算甲城市家庭对住房满意状况评价的中位数表2-11

甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—解:中位数的位置为(累计达到):

∑f/2=300/2=150从累计频数看,中位数的在“一般”这一组别中。因此

Me=一般1323数值型分组数据的中位数计算公式.:该公式假定中位数组的频数在该组内均匀分布×ifS∑fLMmme-+=-12&133数值型分组数据的中位数算例

【例2.13】根据表2-12中的数据,计算50名工人日加工零件数的中位数。表2-12

某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—1342.6.3四分位数(四分位点)

(概念要点)1.一组数据排序后处于25%和75%位置上的值,是集中趋势的测度值之一。QLQMQU25%25%25%25%2.不受极端值的影响(包含中间50%数据的分布)3.主要用于定序数据,也可用于数值型数据,但不能用于定类数据135四分位数位置的确定未分组数据:组距分组数据:下四分位数(QL)位置=N+14上四分位数(QU)位置

=3(N+1)4下四分位数(QL)位置=∑f4上四分位数(QL)位置

=3∑f4136定序数据的四分位数算例【例2.14】根据表2-13中的数据,计算甲城市家庭对住房满意状况评价的四分位数表2-13

甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—解:下四分位数(QL)的位置为

QL位置=(300)/4=75上四分位数(QL)的位置为:QU位置=(3×300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中。因此

QL

=不满意

QU

=一般137数值型未分组数据的四分位数

(7个数据的算例)原始数据:

2321 3032 282526排序:

2123

25

26283032位置:

123

4567

7+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4

==6N+1QL=21QU

=30138数值型未分组数据的四分位数

(6个数据的算例)原始数据:

232130 282526排序:212325262830位置:123 4 56QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QL=21+0.75(23-21)=22.5QU=28+0.25(30-28)139数值型分组数据的四分位数计算公式:上四分位数:

下四分位数:

140数值型分组数据的四分位数计算【例2.15】根据表2-14中的数据,计算50名工人日加工零件数的四分位数表2-14

某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—QL位置=50/4=QU位置=3×50/4=141自算:某地区农民家庭收入分布计算:Mo、Me、QL、QU1422.6.4均值1.均值(Mean)也称为算术平均数(Arithmeticmean),是全部数据算术平均的结果。

均值=总体标志总量÷总体单位总量2.一组数据的重心所在3.是进行统计分析和统计推断的基础4.最基本、最常用的集中趋势的测度值5.易受极端值的影响6.仅用于数值型数据143均值计算公式(1)设一组数据为:X1,X2,…,XN

简单均值的计算公式为:(2)设分组后的数据为:X1,X2,…,XK

相应的频数为:F1,F2,…,FK

加权均值的计算公式为:144简单均值(算例)

原始数据: 10 5 9 13 6 8145加权均值(自算)

【例2.16】根据表2-15中的数据,计算50名工人日加工零件数的均值。表2-15某车间50名工人日加工零件均值计算表按零件数分组频数(Fi)105~110110~115115~120120~125125~130130~135135~140358141064合计50146权数对算术平均数的影响甲乙两组各有10名学生,他们的考试成绩及其分布数据如下:甲组:考试成绩(X):020100

人数分布(F):118乙组:考试成绩(X):020100

人数分布(F):811X甲0×1+20×1+100×8∑F10i=1X

F82(分)X乙0×8+20×1+100×1∑F10i=1XF12(分)147权数的选择某公司所属10个企业资金利润率分组资料,求平均资金利润率。(自算)148简单均值(简单算术平均数)的数学性质1.各变量值与均值的离差之和等于零2.

各变量值与均值的离差平方和最小1492.6.5切尾均值P301502.6.6调和平均数(概念要点)

1.定义:2.是均值的另一种表现形式3.易受极端值的影响4.用于定比数据5.计算公式为151调和平均数(算例)

【】某蔬菜批发市场三种蔬菜的日成交数据如下表,计算三种蔬菜该日的平均批发价格表2-16某日三种蔬菜的批发成交数据蔬菜名称批发价格(元)成交额(元)甲乙丙1.200.500.8018000125006400合计—36900152计算与思考五泉市场上早、中、晚菠菜的价格分别是早晨:元/公斤,中午元/公斤,晚上元/公斤。计算该蔬菜的平均价格??1532.6.7几何平均数(概念要点)

1.定义:N个变量值乘积的N次方根2.适用于特殊的数据:当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时。3.计算公式为:154几何平均数(算例)

【】一位投资者持有一种股票,2006年、2007年、2008年和2009年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。

平均收益率=103.84%-1

=

3.84%155自算某地区GDP2000~2005年平均发展速度为107.2%,2006~2008年平均发展速度为108.7%,2009~2011年平均发展速度为110%。求该地区2000~2011年间的平均发展速度。

1562.6.8几种平均数的关系157.1众数、中位数和均值的关系左偏分布算术平均数

中位数

众数对称分布

算术平均数=中位数=众数右偏分布众数

中位数

算术平均数1581.当数据具有单一众数且频数分布对称时2.当频数分布呈现右偏态时,>>3.当频数分布呈现左偏态时<<

4.数量关系:159.2算术平均数、调和平均数和几何平均数的关系1.当一组数据中所有数据不尽相同时:

算术平均数>几何平均数>调和平均数2.当一组数据中所有的数据都相同时:算术平均数=几何平均数=调和平均数3.当一组数据中出现极端值时:

对算术平均数的影响最大,对几何平均数的影响次之,对调和平均数的影响最小。160数据类型与集中趋势测度值(小结)表2-17数据类型和所适用的集中趋势测度值数据类型定类数据定序数据定距数据定比数据适用的测度值众数中位数算术平均数算术平均数—四分位数众数调和平均数—众数中位数几何平均数——四分位数中位数———四分位数———众数红色为该数据类型最适合用的测度值161一辆载满乘客的公共汽车沿着下坡路快速前进着,有一个人在后面紧紧追赶着这辆车子。一个乘客从车窗中伸出头来对追车子的人说:“老兄!算啦,你追不上的!”“我必须追上它,”这人气喘吁吁地说:“我是这辆车的司机!”

——有些人必须非常认真努力,因为不这样的话,后果就十分悲惨了!然而也正因为必须全力以赴,潜在的本能和不为人知的特质终将充分展现出来。1622.7分布离散程度的测度

离中趋势(标志变异指标)★变量值的差异越大,数值的集中趋势越弱;变量值的差异越小,数据的集中趋势越强。因此,要全面描述数据的分布特征,除了要对数据集中趋势加以度量外,还要对数据的差异程度进行度量。数据的差异程度就是各变量值远离其中心值的程度,因此也称为离中趋势。

1.离中趋势的各测度值是对数据离散程度所作的描述,从另一个侧面说明了集中趋势测度值的代表程度2.不同类型的数据有不同的离散程度测度值163★标志变异指标的作用1.反映总体各单位变量值分布的均衡性。2.判断平均指标对总体各单位变量值代表性的高低。3.在实际工作中,借助标志变异指标还可以对社会经济活动过程的节奏性进行评价。4.标志变异指标是衡量风险大小的重要指标。1642.7分布离散程度的测度1.定类数据:异众比率2.定序数据:四分位差3.定距和定比数据:全距平均差方差及标准差离散系数1652.7.1定类数据:异众比率1.非众数组的频数占总频数的比率。2.离散程度的测度值之一3.用于衡量众数的代表性4.计算公式为:166异众比率(算例)

表2-18

某城市居民关注广告类型的频数分布

广告类型人数(人)频率(%)

商品广告服务广告金融广告地产广告招聘广告其他广告1125191610256.025.54.58.05.01.0合计200100解:

Vr=200-112200

=1-

112

200

=0.44

=44%1672.7.2定序数据:四分位差1.上四分位数与下四分位数之差,也称为内距或四分间距,是离散程度的测度值之一。

QD

=QU-QL2.特点:反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性168四分位差(定序数据的算例)

【例2.18】根据2-19中的数据,计算甲城市家庭对住房满意状况评价的四分位差。表2-19

甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5

已知QL=不满意=2

QU=

一般=

3四分位差:

QD

=QU

=

QL

=3–2

=11692.7.3定距和定比数据1全距2内距3平均差4方差和标准差5离散系数1701全距(极差)1.一组数据的最大值与最小值之差。未分组数据R=max(Xi)-min(Xi)组距分组数据R=最高组上限-最低组下限2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布78910789101712内距1.两个四分位数之差:

内距=上四分位数-下四分位数=QU-QL

2.是集中趋势中四分位数对应的离散程度的测度值3.反映中间50%的数值大小的差异、基本不受极端值的影响1723平均差未分组数据组距分组数据1.各变量值与其均值离差的绝对值的均值。2.能全面反映一组数据的离散程度3.数学性质较差,实际中应用较少173平均差自算过程表2-20某车间50名工人日加工零件平均差计算表按零件数分组频数(Fi)105~110110~115115~120120~125125~130130~135135~140358141064合计501744方差和标准差1.定义:2.反映了各变量值与均值的平均差异,能准确地反映出数据的差异程度,是最常用的离散程度的测度值之一3.类型:总体方差或标准差样本方差或标准差175总体方差和标准差计算公式方差的计算公式标准差的计算公式未分组数据:未分组数据:组距分组数据:组距分组数据:176总体标准差自算过程50合计358141064105~110110~115115~120120~125125~130130~135135~140频数(Fi)按零件数分组表2-21某车间50名工人日加工零件标准差计算表177样本方差和标准差的计算公式方差的计算公式标准差的计算公式未分组数据:未分组数据:组距分组数据:组距分组数据:178样本方差的自由度1.一组数据中可以自由取值的数据的个数。1)当样本数据的个数为

n时,若样本均值x

确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值。2)也指(xi-x

)误差的个数。2.样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量。179样本方差算例原始数据:10 591368180样本标准差算例原始数据:

10591368181方差简化计算公式总体方差样本方差182方差的数学性质

各变量值对均值的方差小于对任意值的方差证明提示:设X0为不等于X的任意数,D2为对X0的方差,则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论