《调查数据分析》PPT课件_第1页
《调查数据分析》PPT课件_第2页
《调查数据分析》PPT课件_第3页
《调查数据分析》PPT课件_第4页
《调查数据分析》PPT课件_第5页
已阅读5页,还剩137页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计数据分析,2009年5月,基本内容,统计数据分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动,以便探求客观现象发展变化的规律性,为各级领导的实际决策提供依据。,统计数据分析概述,1,概念,应用统计方法是统计数据分析的重要特点之一。 统计数据分析方法可分为描述统计分析方法、推断统计分析方法和现代多元统计分析方法等。,特点,定量与定性分析相结合是统计数据分析的另一个重要特点。 与统计数据分析密切相关的经济学、社会学、管理学等学科阐述的许多概念、范畴和规律,既是统计定量认识的前提,又是统计数据分析的重要依据。,统计数据分析还具有总体性的特点。 从总体上对客观事物进行

2、认识,可以避免以偏概全。,生活水平划分表,E系数,1.数据分析是调查研究不可缺少的环节。,意义1,调查研 究环节,意义2,2.数据分析是充分发挥调查研究作用的重要保证。,通过数据分析,可以掌握事物的本质特征、内在联系和发展变化规律,使统计认识得到进一步深化。,3.数据分析是增进社会了解统计的重要窗口。 数据分析可以综合表现和传播多种统计信息,因而它可以成为充分展示各种统计成果的重要窗口。,意义3,1.实事求是的原则 2.“一分为二”的原则 正确评价成绩,客观反映缺点和问题。,原则,4.发展的原则 数据分析,凡是有条件的,都应该与统计预测结合起来。预测也是分析的内容。,3.数字和情况相结合的原则

3、 应避免调查分析成为统计数据的简单堆砌。,1.主动参与决策的观念 每个统计人员都应积极主动地开展数据分析,探求客观规律,撰写决策备选方案,为科学决策提供依据。,分析者的观念,2.导航员的观念 3.开拓创新的观念 要有敏锐的目光,选新课题,有新思想、新观点,提出新思路、新对策。反对公式化、千篇一律的数据分析。 不能墨守陈规,要使数据分析具有时代气息,适应时代的要求。,分类法是根据调查对象的异同点,将统计对象分为不同的种类,以形成一定从属关系的不同等级的逻辑分析法。,分类分析,2,作 用,A.划分现象的类型,好人,坏人,男人,女 人,婴儿,青 年,老人,B.是统计数据结构分析的基础,中国人口规模

4、与结构变化图,C.分析现象间的依存关系,身高与体重有关系吗?,哇!,咦!,应用原则,A.要正确确定分类标准,B.要注意分类层次的逻辑顺序,C.要保持分类的穷尽性和互斥性,构成分析以分类法为基础,通过有关相对指标反映总体的内部构成状况。 构成分析可使用结构相对指标和比例相对指标来进行。,构成分析,3,结构相对数(比重),反映总体内部的构成状况。,全班学生性别结构,女生所占比重%,例,特点,总体各部分比重之和为100%,壹,贰,分子必须是分母的一部分,分子、分母属于同类指标,叁,人口死亡率是否为结构相对数?,N,国内生产总值构成%,反映事物构成特征,反映现象结构 变化规律,我国人口城乡构成%,比例

5、相对数,反映总体中各部分的数量对比关系。,我国总人口性别比1978年 106.152006年 106.29,性别比,正常情况下新生婴儿性别比由生物学规律决定,应为103-107。,比例相对数与结构相对数可以相互转换。,A,C,B,比例 转 结构,A :B :C,AA+B+C,BA+B+C,CA+B+C,比例,结构,结构相似性的判断,判断两种结构是否有显著的差异。2检验法。,1.建立假设 H0(原假设):两种比重数不存在明显差异 H1(备择假设):两种比重数存在明显差异2.确定显著水平3.计算统计量的2值: Oi:报告期第i个比重;Ei:基期第i个比重4.根据自由度k-1(比重个数-1)和显著水

6、平查2分布表求临界值5.判断:如果2 拒绝H0,接受H1;反之2 接受H0,拒绝H1。,检验步骤,因为k-1=5,设=0.05,查表得因为2 拒绝H0,接受H1,两年结构有显著差异。,4,比较分析,反映不同空间数量差异程度,横比,比较,美中相比军费6120/702=8.7或702/6120=11.5%,人均军费2040/53=38.5或53/2040=2.6%,日本国土为中国的1/25 人口为中国的1/10 军费为中国的83% 人均军费为中国的9倍,中日比较,5,动态分析,这是纵向对比分析方法。 动态是指现象在不同时间的发展变动状态。,动态分析可以反映事物发展变化过程、方向和结果,从而研究事物

7、发展变化的规律和预测未来。,四川规模以上工业增加值增长速度,地震、金融危机对 四川经济的影响,例,四川生产总值累计增速与分季度增速,发展水平是时间序列中各具体时间条件下的数值,反映事物发展变化在一定时期内或时点上所达到的水平。,发展水平a,进行动态分析需要计算一系列动态分析指标,我国手机用户数,期初水平a0 期末水平an 中间水平a1 a2an-1 基期水平 报告期水平,增长量反映现象发展水平报告期比基期增加或减少的数量。,增长量=报告期水平一基期水平,正:增加量,负:减少量,例:某企业实现利润07年为200万元,08年为150万元。增长量等于多少? 50万元,增长量,种类: 逐期增长量:ai

8、-ai-1 累计增长量:ai-a0 年距增长量:ai-ai,注意: 各逐期增长量之和等于相应的累计增长量。,我国手机用户数,增长量,累计,逐期, 0.6 0.7 0.9 0.9, 0.6 1.3 2.2 3.1,发展速度,发展速度是报告期水平与基期水平之比,说明报告期水平已发展到(增加到)基期水平的若干倍或百分之几。,100% 发展 = 100% 持平 100% 下降,注意:发展速度不能为负数。,例:李四出生时4斤,20年后增加到140斤。发展速度为多少? 140/4=35倍,能预测他40岁时的体重吗?,环比发展速度:是报告期水平与前期水平之比,说明现象逐期发展的程度。,发展 速度%,环比,定

9、基, 118.2 117.9 119.6 116.4,定基发展速度:是报告期水平与固定基期水平之比,说明报告期水平已发展到固定基期水平的若干倍或百分之几。,环比,定基, 118.2 117.9 119.6 116.4,100.0 118.2 139.4 166.7 193.9,发展 速度 %,年距发展速度:是报告期水平与去年同期水平之比,说明现象跨年发展的相对程度。,便于消除季节因素的影响。,增长速度,增长速度是增长量与基期水平之比,说明报告期水平较基期水平增减的相对程度。,=发展速度-1,0 增长 = 0 持平 0 下降,环比增长速度,环比增长速度是逐期增长量与前期水平之比,反映现象逐期增长

10、的相对程度。,环比,定基, 118.2 117.9 119.6 116.4,100.0 118.2 139.4 166.7 193.9,发展 速度 %,增长 速度 %,环比,定基, 18.2 17.9 19.6 16.4, 18.2 39.4 66.7 93.9,定基增长速度,定基增长速度是累计增长量与固定基期水平之比,反映现象在较长时间内总的增长速度。,国家统计局发布数据显示,3月份全国70个大中城市房屋销售价格同比下降1.3%,比2月份降幅扩大0.1个百分点,环比上涨0.2%。,年距增长速度:是报告期水平与去年同期水平相比的增长速度,说明现象跨年增长的相对程度。,用于消除季节因素的影响。,

11、同比,注意1,例1:我国GDP2005年比2000年增长了0.85倍,2008年比2005年增长了63.2%。2008年比2000年增长多少?,定基增长速度并不等于环比增长速度的连乘积。两者相互换算是必须借助发展速度。,2.02倍,例2:我国大学毕业生人数,2008年比1990年增长了7.34倍,2000年比1990年增长了55.7%,2008年比2000增长多少?,4.36倍,注意2,当报告期水平和基期水平数据的符号不同时,不宜计算发展速度和增长速度。,例:某厂实现利润2007年为300万元,2008年为亏损50万元。发展速度、增长速度为多少?,它是指在基期水平的基础上,每增长1%相当于增加

12、的绝对数量,用来反映增长速度的实际效果。,增长1%的绝对量,例:2006年美国GDP132018亿美元,增长1%为1320.2亿美元。2006年中国的GDP为26681亿美元,增长1%为266.8亿美元。美国增长1%,相对于中国增长4.9%。 2006年美国GDP增长6.3%,中国需要增长30.87%才行。,相对数应用原则,前述结构分析、比较分析、动态分析都是通过计算和分析一系列相对指标来进行的。在计算和应用这些相对指标时要注意一些基本原则。,汽车VS飞机谁更安全?,有人列举统计数据说全世界每年公路交通上惨死的人达25万,而车祸死亡乘客也有10万人;航空方面死亡人数却只有2000人,所以民航飞

13、机的安全程度比汽车高49倍。 但有人反驳说:汽车事故死亡人数虽然比飞机多,然而汽车乘客比飞机乘客多得多,故不能下结论说飞机更安全。,这里存在一个如何应用相对数的问题。,2009年3月24日,龙泉阳光城,包括对比的基数、分子分母的总体范围、计算方法等均要可比。此为基本原则。,例1:某校的报告说:“我校今年文科招生人数增长50%,而理科只增长10%,因此文科新生的增长为理科的5倍”。,此报告的说法是否准确?为什么?,原则1:保持对比指标的可比性,例2:甲、乙两企业生产的饮料不合格率分别为6%和10%,问哪个企业的不合格饮料数量更多?,原则2:相对数与绝对数结合应用,列宁指出:“一些小得可笑的数字用

14、百分法来计算它们的增长速度永远是很大的。如果一个乞丐有三个戈比,你又给了他5个戈比,那么他的财产立即就有了很大的增加,整整增加了167%”。,列宁1870-1923,现实,网络,原则3:多种相对数结合应用,2008年统计公报: 2008年末全国总人口为132802万人,比上年末增加673万人。全年出生人口1608万人,出生率为12.14;死亡人口935万人,死亡率为7.06;自然增长率为5.08。出生人口性别比为120.56。,2006年底中国有猪49440.7万头,比,2006年底世界有猪97516.2万头 中国占50.7%,1988年占41.4%,平均2.6人喂有一头猪,比上年下降1.2%

15、,96年以来第一次下降,四川 5757万头 河南 4679万头 湖南 4380万头 西藏 32万头 青海 106万头 宁夏 118万头,特别要注意将纵比与横比相互结合才能得出正确结论。 从纵向来看,我国经济发展速度很快,是世界上发展速度最快的国家之一。 从横向来看,我国与世界发达国家又有巨大的差距。,原则4:纵比与横比相结合,GDP年均增长速度,2007年人均GDP最高的十个国家,原则5:共同点比较与差异点比较相结合,共同点比较是将两个或两个以上的调查对象加以比较,从中找出共同点,达到异中求同; 差异点比较是把两个或两个以上的调查对象加以比较,从中找出差异点,达到同中求异。 例如:对某地的工业

16、企业的经营状况进行调查,把经营效益好的归为一类,然后归纳它们的共同特征,这就是异中求同; 并与经营效益差的进行比较,归纳它们的差异,达到同中求异。,分析现象在一段较长时间内发展变化的趋势和方向。 长期趋势因素是在较长时期内比较稳定的、经常起作用的根本性因素。,6,趋势分析,季节变动,季节变动是指现象由于受自然条件或经济因素变化的影响,而在一年内出现的周期性波动。,龙泉归来不看花,火锅,1978-2008年四川经济增长率,循环变动,循环变动是指现象以若干年为周期的涨跌起伏相间的变动。,图表法,通过观察时间序列及其散点图,大致确定现象发展变化趋势及变动类型。,例,某公司电脑销售量,千台,时距扩大法

17、,时距扩大法就是将时间间隔距离扩大,从而消除偶然因素和季节因素的影响,以反映现象的长期趋势的方法。步骤为: 扩大时距 合并指标值 编制新数列 分析现象长期趋势,例,某公司电脑销售量,千台,1989 7.54万台,2006 9336万台,玩电脑,某公司电脑销售量,移动平均法,对原有的时间序列,按照事先规定的移动时期长度来扩大时距,逐项向后推移,边移动边平均,计算一系列序时平均数,形成新的时间序列。 这一新的时间序列消除了短期的偶然因素的影响,显示出长期趋势。,三项移动,3,3.3,3.8,4.8,4,四项移动,3 3.5 4 4.25,3.25 3.75 4.125,二项移动,从“工具”菜单中选

18、择“数据分析”项,在弹出“分析工具”中选择“移动平均”,输入数据区域,确定间隔数n,选择输出区域,点“确定”,操作步骤,用Excel进行移动平均,例,注意,假如现象变动有周期性,则以周期长度为移动平均项数。,移动平均后所得修匀数列比原数列项数少。,采用奇数项移动平均,只需移动一次;采用偶数项移动平均,则需进行两项移动平均。,趋势模型法,见教材 第5、6章,统计平均数,是反映若干统计数据一般水平或集中趋势的综合指标。它表明总体内各单位某一数量标志的一般水平。,7,平均分析,概念,总体:甲小组学生,总体单位:,该组每位学生,标志:,姓名、,身高、,体重、,年龄、,爱好,20,18,17,19,18

19、,19,标志值:20、19、19、18、17、19,用哪个数值来代表该小组学生年龄大小?,甲组,甲乙哪个组年龄更大?,乙组,平均数是一个代表值。,特点1,抽象了总体各单位间的数量差异,反映各单位标志值的一般水平。,特点2,平均前,平均后,平均过程,即“截长补短”的过程,作用1,用于对比不同总体的一般水平,1上海市 34345 2广州市 34328 3北京市 34191 4深圳市 32476 5杭州市 30580,6台州市 30550 7南京市 29342 8拉萨市 28561 9东莞市 28253 10宁波市 27986,2007年各大城市职工平均工资,37 济南市 20756 41 青岛市

20、20022 51 徐州市 18849 52 烟台市 18764 61 莱芜市 18282 72 淄博市 17166 105威海市 15785 109济宁市 15639 130枣庄市 14831 154潍坊市 14085 174滨州市 13549 183临沂市 13457 190泰安市 13371 200日照市 13043 238聊城市 12052 264德州市 10997 280菏泽市 9869,职工平均工资,作用2,用于反映总体一般水平的发展变化,这个消息刚一发布,就在网络上引起了一片热议。北京一网友发帖戏称:“张村有个张千万,9个邻居穷光蛋,人均收入算一算,个个都是张百万。”尽管这是个调侃

21、,但这至少说明群众对这个统计结果的质疑并不无道理。,2008年全国城镇单位在岗职工平均工资为29229元,日平均工资为111.99元。扣除物价因素,实际增长11.0%。,作用3,用于指标间的相互推算,例如,用抽样调查得到的部分农田粮食平均亩产量推算粮食总产量。 粮食总产量=样本平均亩产量粮食总播种面积,动态平均数,静态平均数,统计平均数,数值平均数,位置平均数,算术平均数,调和平均数,几何平均数,众数,分位数,种类,基本公式,例,某班有40人,助学金总额为1040元,则人平助学金为: 1040元/40人=26元 这就是一个算术平均数。,算术平均数,简单算术平均数,是直接将总体各单位的标志值加总

22、,除以总体单位数而求得的平均数。,例,张三一家人的手指头个数如图,11根,10根,10根,10根,平 均 手指数,11+10+10+10 4,10.25根, 总和符号,算术平均数,标志值,变量值的个数,标志值总量,总体单位总数,变量值,权数,xf为总体标志值总量;,标志值 总量,总体单 位总数,x为各组标志值水平;,f为各组标志值出现的次数,即频数,叫权数;,f为总体单位总数;,xf为各组标志值总量;,加权算术平均数,调和平均数是标志值倒数的算术 平均数的倒数,也叫倒数平均数。,概念,调和平均数,简单调和平均数,甲、乙两个工人,甲制造一个零件花4分钟, 乙制造一个零件花6分钟。问在一段时间内

23、生产一件零件平均花几分钟?,例,甲,乙,计算见黑板,公式,为调和平均数,n为标志值个数,x为标志值水平,加权调和平均数,例,某天学生食堂菜销售价格,求平均价格。,1.91元,公式,m为各组标志值总量,即xf;,m 为总体标志值总量;,m/x=f为各组单位数,为总体单位总数,标志值总量,总体单 位总数,众数是一组数据中出现次数最多的标志值,即最普遍出现的标志值。,20,19,17,19,18,19,f,x,众数=?,众数,有时,可用众数代替算术平均数说明现象的一般水平。,Mo,如,要调查某天同安市场猪肉价格,用该日市场上最普遍成交价即可。,而且,在某些场合,只有众数才适合作为总体的代表值。,Mo

24、,例如,鞋子、成衣的生产和销售,工厂和商店所关心的不是这些商品的号码、尺寸的算术平均数,而是出现最多的号码、尺寸。,中位数是指将总体各单位标志值按照大小顺序排列后,处于中间位置的那个标志值。,1.75,1.65,1.50,1.61,1.64,Me,f,x,中位数,由于中位数不受极端值的影响,许多时候需要使用中位数来说明总体一般水平。,例如,在社会成员收入悬殊的国家,用社会成员年收入的中位数比用平均年收入更能代表中等社会成员年收入水平。 “张村有个张千万,9个邻居穷光蛋,人均收入算一算,个个都是张百万。”,全世界 26岁 非洲 21岁 欧洲 36岁 日本 41岁 也门 15岁,中国 1964 1

25、9.4岁 1975 21岁 1982 22.9岁 1990 26.1岁2005 32.26岁 男性:31.87岁 女性:32.67岁,再如,用中位数判断人口总体类型。人口学家认为: 人口年龄中位数 20以下 年轻型人口 20-30 中年型人口 30以上 老年型人口,1.吉斯莫先生有一个小工厂,生产超级小玩意儿。,2.管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。,骗人的平均数,案例,3.现在吉斯莫先生正在接见萨姆,谈工作问题。 吉斯莫:我们这里报酬不错。平均薪金是每周300元。你在学徒期间每周得75元,不过很快就可以加工

26、资。,4.萨姆工作了几天之后,要求见厂长。萨姆:你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?,5.吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。,6.吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?,7.萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。,8.吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平

27、均工资,而是中等工资。,9.萨姆:每周100元又是怎么回事呢? 吉斯莫:那称为众数,是大多数人挣的工资。,10.吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。 萨姆:好,现在我可懂了。我我辞职!,报纸上报道有个人在一条河中淹死了,这条河的平均深度仅只2尺。这不使人吃惊吗?不!你要知道,这个人是在一个10多尺深的陷坑处沉下去的。,应用平均数的原则,平均的对象必须是同质的,原则1,1898-1976,上海东方明珠,甘肃农村小学,四川民居,上海外滩夜景,09上海车展,贵州轮胎回收厂工人,比尔盖茨的豪车,三轮车夫,盖茨的豪宅,小煤窑工人,用组平均数补充总平均数,原则2,831,99

28、0,630,1300,600,1250,计算并对比甲、乙两厂的平均单位成本。,用频数分布补充说明总平均数,原则3,平均数相等,但分布状态差别很大。,计算得: 平均完成定额105%。,如何分析?,全厂来看,分车间看,咦!,把平均数与典型事例相结合,原则4,平 均,哇!,2008年全国城镇单位在岗职工平均工资为29229元,日平均工资为111.99元。,平均指标将总体各单位标志值的差异抽象化了,以反映一般水平。为了全面认识总体特征,还应将平均数所掩盖的差异反映出来。,掩盖了 地区间差异 行业间差异 不同单位差异,8,离散程度分析,2008年全国城镇单位在岗职工平均工资为29229元,日平均工资为1

29、11.99元。,地区差异,北京44715元,江西21000元,平均工资高于全国平均水平的有9个省,低于全国平均水平的有22个省。 东部 34316元 西部 25602元 东北 25101元 中部 24390元,行 业 差 距,最高与最低行业平均工资之比为11:1,上海证券交易所,离中趋势是指一组数据中各数据值以不同程度的距离偏离其中心(平均数)的趋势。,离中趋势指标是用来综合反映数据的离中程度的一类指标,它反映总体各单位标志值差异程度或离散程度。,极差,分位差,平均差,方差,标准差,离散系数,涵义,反映分布数列的离散程度。,A,B,C,离散程度:CB A,用途,评价平均数的代表性高低。,奖学金

30、: 甲组:60 60 60 60 60 乙组:40 60 60 60 80 丙组:100 20 80 40 60,平均数 极差 60 0 60 20 60 80,平均数代表性:甲乙 丙,标志变异指标越大 平均数代表性越低,说明现象和过程的稳定性和均衡性。,第1月 2月 3月 4月 5月 张毛毛 8.0 8.5 9.0 9.4 10 李二狗 6 8 5 7 11,极差 2 6,平稳增加,波动较大,张毛毛,李二狗,两婴儿出生后的体重(斤):,极差,(Range),极差是最大变量值与最小变量值之差。,R=Xmax.-Xmin.,极差计算简便,反映变量值变化范围。 但没有反映中间变量值的差异。,例,A数列:4 6 6 6 8 平均数=6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论