版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、引例:公司销售情况如何?某百货公司连续40天的商品销售额如下(单位:万元) 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35 原始数据 25 26 28 29 30 30 32 33 34 34 35 35 36 36 36 36 37 37 37 37 37 38 38 38 39 40 41 42 42 43 43 44 44 44 45 45 46 46 47 49 数据排序后销售额 天数 百分比(万元
2、) (天) (%) 2530 4 103035 6 153540 15 37.54045 9 22.54550 6 15合 计 40 100.0数据分组后天数1512963253035404550图 某商场日销售额的直方图我一眼就看出来了,大多数的日销售额在3540之间!0作图后 调查得到的原始的统计资料必需整理加工 根据统计研究的任务,对统计调查阶段所收集的大量的原始统计资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合数量规律性的工作过程。 便于做进一步的统计分析。第3章 统计数据的整理与显示-化繁为简 主要内容和学习目标 统计数据的预处理(了解)统计数据的分组整理(重点
3、掌握)统计数据的图表显示(掌握常用图表)一、统计数据的预处理选择恰当的数据 数据的审核 数据的筛选 数据的排序 1原始数据的审核: 完整性 准确性 逻辑检查 准确性审核的方法 计算检查 2次级数据的审核: 完整性 准确性 适用性 时效性 数据的审核 1将某些不符合要求的数据 或有明显错误的数据予以剔除; 2将符合某种特定条件的数据筛选出来, 不符合特定条件的数据予以剔除。 数据的筛选 数据的排序 1升序 2降序例:公司销售情况如何?某百货公司连续40天的商品销售额如下(单位:万元) 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33
4、 44 35 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35 原始数据 25 26 28 29 30 30 32 33 34 34 35 35 36 36 36 36 37 37 37 37 37 38 38 38 39 40 41 42 42 43 43 44 44 44 45 45 46 46 47 49 数据排序后销售额 天数 百分比(万元) (天) (%) 2530 4 103035 6 153540 15 37.54045 9 22.54550 6 15合 计 40 100.0数据分组后二、统计数据的分组整理 分组整理中
5、需要掌握的基本知识(掌握) 品质型数据的分组整理 数值型数据的分组整理 (重点掌握) 分组整理的概念 (掌握) 分组整理的步骤 (重点掌握)思考:08经济学专业的男女生比例为何?方法与步骤经济学专业男女比例统计按性别分组男 生女 生合 计人数(人)百分比()分组整理:就是按照统计研究的目的和要求,选择一个或几个变量(标志)将总体分为若干组,并将数据分别列入对应的组内进行汇总。 分组整理的概念 分组整理的核心:选择分组标志幻灯片 20分组标志的种类:品质标志和 数量标志分组整理的结果及表述形式:“分与合”幻灯片 22 组内具有同质性 组间具有差异性分组整理的步骤:选择分组标志进行分组数数并计算各
6、组单位数制表幻灯片 23 分组整理概念的要点分析 经济学专业男女比例统计按性别分组男 生女 生合 计人数(人)百分比()某厂职工家庭人口统计幻灯片 19按家庭人口分组1合 计职工户数百分比()23456例: 某厂职工人数统计表按性别分组男 职 工女 职 工合 计人数(人)百分比()25311536868.7531.25100.00总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。 分组整理结果的表述形式幻灯片 19分组标志各组单位数各组单位数占总体单位总数的比重组别一组别二合计分组整理中需要掌握的基本知识统计分组的原则统计分组的种类几大基
7、本概念(掌握)频数、频率、累计频数、累计频率频数分布表穷尽原则:使总体中的每一个单位都有组可归互斥原则:使总体中的每一个单位只有一组可归 统计分组的原则 练习:从业人员按文化程度分组 小学毕业 中学毕业(含中专) 大学毕业 小学毕业及以下中学毕业(含中专)大专毕业大学及大学以上 ()()按分组标志的多少按分组标志的性质不同统计分组的种类 简单分组按年龄分组:20岁及以下2135岁3650岁5155岁5660岁按文化程度分组:小学、识字不多或文盲初中中专、技工高中大专及大专以上 复合分组按经济类型分组按投资规模分组国有经济投资:大型中型小型集体经济投资:大型中型小型外商经济投资:大型中型小型其他
8、经济投资:大型中型小型(数量分组)数值型数据的分组(品质分组)品质型数据的分组按分组标志的性质异距分组等距分组组距分组单项式分组P34品质型数据分组按品质标志分组单项式分组把每一个标志值作为一组组距分组用一个数值区间作为一组数值型数据分组按数量标志分组几大基本概念频数(Frequency,亦称为次数)是指落入各组中的数据的个数或次数频率(Relative frequency,亦称比重或百分比)是指各组中的数据个数或次数占全部数据总数的比重(一般用百分比表示)按性别分组男 职 工女 职 工合 计人数(人)百分比()25311536868.7531.25100.00频数频率 销售额(百万元)商店数
9、频率()累计次数累计频率()向上累计向上累计5以下51010151520202525以上41016134382032268641430434750828608694100合计50100练习:销售额在万元以下的商店总数?累积频数(频率)针对各有序分组从最大组开始,将各组频数(频率)逐次向最小组累加向下累积频数(频率)说明某一组下限以上的总次数(总百分比)向下累积向上累积 从最小组开始,将各组频数(频率)逐次向最大组累加向上累积频数(频率)说明某一组上限以下的总次数(总百分比) 销售额(百万元)商店数频率()累计次数累计频率()向上累计向下累计向上累计向下累计5以下5101015152020252
10、5以上410161343820322686414304347505046362073828608694100100927240146合计50100练习:销售额在万元以上的商店总数? 练习:某城市家庭对住房状况满意度为多少? 满意 程度户数(户)百分比()向上累积向下累积户数(户)百分比()户数(户)百分比()非常不满意248248.0300 100不满意1083613244.0276 92一般933122575.0168 56满意451527090.075 25非常满意3010300100.030 10合计300100频数分布表(亦称次数分布(配)表)分组整理结果的表述形式 (Frequenc
11、y distribution)是各组及其相应的频数(还可包括频率、累积频数和累积频率)依一定的次序排列(由标志值而定)形成的表格某厂职工人数的频数分布表按性别分组男 职 工女 职 工合 计人数(人)百分比()25311536868.7531.25100.00某城市家庭对住房状况满意度频数分布表 满意 程度户数(户)百分比()向上累积向下累积户数(户)百分比()户数(户)百分比()非常不满意248248.0300 100不满意1083613244.0276 92一般933122575.0168 56满意451527090.075 25非常满意3010300100.030 10合计300100频数
12、分布表的基本形式(P32-33)分组频数(个)频率(%)合计100次数分布(频数)频率分布练习:下列两个统计分组数列中,属于频数分布的是(1)某校教师分组情况职称平均年龄(岁)教授65 副教授50讲师42助教28教辅人员38全校40(2)某校教师分组情况职称人数(人)教授副教授讲师助教教辅人员全校501504502501001000 分组整理的步骤 第一步:选择分组标志选择标志对数据进行分组第二步:数数并计算计算各组的频数、频率、累积频数和累积频率第三步:制表编制频数分布表 各类数据的分组整理 思考:品质型数据的分组整理如何完成? 例:某城市居民关注广告类型的频数分布广告类型人数(人)频率()
13、商品广告11256.0服务广告5125.5金融广告94.5房地产广告168.0招生招聘广告105.0其 他 广 告21.0合 计200100.0 品质型数据的分组整理品质型数据的分组整理步骤:把每一个标志(变量)值作为一组(如有顺序则由劣到优)-数数并计算-制表分类数据的频数分布表可以包括:分组、频数和频率顺序数据的频数分布表可以包括:分组、频数、频率、累积频数和累积频率 某城市家庭对住房状况满意程度的频数分布 满意 程度户数(户)百分比()向上累积向下累积户数(户)百分比()户数(户)百分比()非常不满意248248.0300 100不满意1083613244.0276 92一般933122
14、575.0168 56满意451527090.075 25非常满意3010300100.030 10合计300100思考:数值型数据的分组整理如何完成?例:某200名手机使用者目前已更换手机数量的频数分布表更换手机数量人数(人)频率()063182412763833618合 计200100 数值型数据的分组整理单项式分组:把每一个具体的变量值作为一组-数数并计算-制表适用于变量值较少的离散变量的情况如何做组距分组? 组距式分组:幻灯片 50将全部变量值依次划分为若干个数值区间(由小到大),每一个数值区间作为一个组-数数并计算-制表幻灯片 53适合于变量值较多的离散变量和连续变量的情况数值型的频
15、数分布表可以包括:分组、频数、频率、累积频数和累积频率零件数(个)频数(人)频率()105110361101155101151208161201251428125130102013013561213514048合 计50100例:某车间工人日加工零件数频数分布表幻灯片 49合适做单项式分组有12名工人看管机器台数资料如下:2,5,4,4,3,3,4,3,4,4,2,2工人看管机器台数(台)2345人数(人)3351合计12不适合做单项式分组表 某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)10710811011211311411511711
16、8121211133119120121122123124125126127121443223128129130131133134135137139211122112变量值过多,单项式分组看不出数据分布的特征零件数(个)频数(人)频率()105110361101155101151208161201251428125130102013013561213514048合 计50100幻灯片 51如何做组距分组?基本概念等距分组的步骤(重点掌握)组距分组的注意事项基本概念指每组两端表示各组界限的数据值,各组的最小值为下组限,最大值为上组限组限每组数据取值变动的区间长度, 为上下组限之差组距每组取值范围的
17、中点数值 组中值组中值=例:某地区100个百货商店月销售额情况销售额(万元)商店数(个)50以下50100100200200300300以上1020302515上组限下组限如:组距=100-50=50(万元)如:组中值=(50+100)/2=75(万元)各组组距相等各组组距不完全相等等距分组异距分组组距式分组图:1978、2007年城市数量选择编制异距数列的常见情况 事物自身的发展特点。(P34)现象的数据变异的范围较大。现象的分布存在明显的偏斜状态。零件数(个)频数(人)频率()105110361101155101151208161201251428125130102013013561213
18、514048合 计50100思考:如何进行等距分组等距分组的步骤确定组数等距分组的步骤确定组距确定组限编制表格计算全距数数并计算;制表选择分组标志后确定各组等距分组的步骤(P35)(1)排序并计算全距R: 或 R最大值组的上限最小值组的下限 (不建议使用) (2)确定组数K: 经验公式(修改P34): (3)确定组距d:一个组的上限与下限之差 (4)确定组限:(5)编制频数分布表 例题分析某生产车间50名工人日加工零件数资料(单位:个)11712212412913910711713012212510813112511712213312612211810811011812312613313412
19、7123118112112134127123119113120123127135137114120128124115139128124121试采用组距式分组法编制频数分布表排序表107108108110112112113114115117117117118118118119120120121122122122122123123123123124124124125125126126127127127128128129130131133133134134135137139139解:最大值139,最小值107(1) 计算全距。R139107=32(P36说明)(2) 计算组数。 ,取k=7为宜。(3
20、) 计算组距。d=327=4.5715(4) 确定组限。 (P36说明)(5) 编制频数分布表。 组距式分组的解题过程零件数(个)频数(人)频率()105110361101155101151208161201251428125130102013013561213514048合 计50100某生产车间50名工人日加工零件数连续式分组思考:1、数据的特征有哪些?2、组数如何根据经验公式选取?3、组距如何确定?4、各组组限如何确定?5、组中值的作用?组距分组的注意事项(P35)好的分组整理的标准尽量真实反映总体内各个单位(数据)的实际分布特征集中、离散(差异)和形态。 分组时要首先观察排序后的数据,
21、考虑大部分数据集中在什么范围,以及全部数据的全距及离散的程度,同时尽可能观察出数据变化的形态特点,然后再使用公式完成分组。 1、根据经验公式灵活决定,以反映组数的多少以能显示数据分布的特征和规律为宜。 2、一般组数不小于5,且不多于20() 3、组数过多或过少都不行确定组数的细节问题(1)某班数学考试成绩表考分(分)人数(人)5660 26064 36468 496100 4合计40n=40 d4 k11(2)某班数学考试成绩表 考分(分) 人数(人) 5660 2 60100 38合计40例:成绩分组 1、组距可以任意,宜取5或10的倍数,且d*K要略大于并只略大于R 2、使用连续式组限时幻
22、灯片 77 各组的组距本组的上限本组的下限 3、开口组通常以相邻组的组距为其组距幻灯片 78 确定组距的细节问题零件数(个)频数(人)频率()105110361101155101151208161201251428125130102013013561213514048合 计50100连续式组距分组的组距为多少?幻灯片 76使用连续式组限时:各组的组距本组上限本组下限 例:某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50100100200200300300以上102030251514.211.410.19.28.5如:组距=1
23、00-50=50(万元)组距=300-200=100(万元)确定组限的细节问题(P35)遵循从集中组往两端依次确定的原则遵循不重不漏的原则:即每一个数据能且只能分到唯一的一个组中。连续式分组:遵循“上组限不在本组内”的原则零件数(个)频数(人)频率()105110361101155101151208161201251428125130102013013561213514048合 计50100连续式组距分组频数分布表3、正确选择第一组的下限和最后一组的上限 第一组的下限:应略小于或等于最小变量值 最后一组的上限:应略大于或等于最大变量值幻灯片 794、在全体数据的最大值与最小值与其他数据相差悬殊
24、时,为避免空白组出现,正确使用开口组形式幻灯片 80 第一组:采取“以下” 最后一组:采取“以上”幻灯片 82例:若 X 88,X 42,则:首组:4050,末组:8090幻灯片 76maxmin例:某年某地区20个企业产值资料如下(单位:万元)8,21,100,150,200,220,250,280300,350,340,360,370,395,400,450,452,505,980,1225按产值分组(万元)企业个数(个) 100以下 2 100200 2 200300 4 300400 6 400500 3500以上 3合计20幻灯片 76零件数(个)频数(人)频率()105110361
25、101155101151208161201251428125130102013013561213514048合 计50100 连续式组距分组组中值的作用?销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50100100200200300300以上102030251514.211.410.19.28.5组中值=? 开口组组中值的确定? 1、组距式分组时通常使用组中值作为各组数据的代表值 连续式组限 : 组中值(本组下限值本组上限值)/22、开口组组中值的确定方法 “以上”组: 组中值本组下限值相邻组组距/2 “以下”组: 组中值本组上限值相邻组组距/2 组中值的确定及作用间
26、断式分组频数和频率密度其他的细节问题 1、间断式分组的理解 2、间断式分组的组限幻灯片 92 各组的组距本组的上限前组的上限 3、间断式分组的组中值幻灯片 94 各组组中值(本组下限值后组下限值)/2幻灯片 95 间断式分组零件数(个)频数(人)频率()105109361101145101151198161201241428125129102013013461213513948合 计50100 间断式组距分组频数分布表零件数(个)频数(人)频率()105110361101155101151208161201251428125130102013013561213514048合 计50100连续式
27、组距分组频数分布表零件数(个)频数(人)频率()105109361101145101151198161201241428125129102013013461213513948合 计50100 间断式组距分组的组距使用间断式组限时: 各组的组距本组上(下)限前组上(下)限 零件数(个)频数(人)频率()105110361101155101151208161201251428125130102013013561213514048合 计50100连续式组距分组的组距使用连续式组限时:幻灯片 89组距本组上限本组下限本组上(下)限前组上(下)限 零件数(个)频数(人)频率()1051093611011
28、45101151198161201241428125129102013013461213513948合 计50100 间断式组距分组的组中值幻灯片 89不等距分组时需要计算 频数密度频数/组距 频率密度频率/组距频数密度和频率密度三、统计数据的图表显示 统计表 统计图具有容量大、方便计算等特点统计表以纵横交叉的线条所形成的表格来表现统计资料的形式表 国有及国有控股企业在工业主要经济指标中的比重 ( 单位:%)甲栏分组国有及国有控股企业比重2005200620072008企业单位数10.11 8.27 6.14 5.00 工业总产值(当年价格)33.28 31.24 29.54 28.34 资产
29、总计48.05 46.41 44.81 43.78 利润总额44.04 43.51 39.75 29.66 税金总额48.50 46.26 43.68 38.10 从业人数27.19 24.52 22.13 20.30 统计表的构成要素和结构20032004年城镇居民家庭基本情况表项目单位2003年 2004年 调查户数 平均每户家庭人口 平均每户就业人口 平均每户就业面 平均每人全部年收入 平均每人消费性支出户人人%元元 480283.011.5852.49061.26510.94 50430 2.98 1.56 52.35 10128.51 7182.10资料来源:中国统计年鉴2005,中
30、国统计出版社。注:本表为城镇居民家庭收支抽样调查材料。 行标题列标题数字资料表头附加表头(总标题):表明全部统计资料所属范围和内容,一般写在表的上端(一般居中);行标题和列标题:表明总体名称或分类名称及说明总体的各种项目。行标题常是总体的分类(组)名称,一般位于表的左边;列标题一般是说明总体的各种项目(指标),一般位于表的上方;表2:国内生产总值(1-4季度)绝对额(亿元)比去年同期增长(%)国内生产总值300670 9.0 第一产业34000 5.5 第二产业146183 9.3第三产业1204879.5 注1:绝对额按现价计算,增长速度按不变价计算。注2:该表为初步核算数据。数字资料:横行
31、和纵行相交叉处的数据信息,由横行和纵行的内容所限定表脚(表外附加):对表内容的相关说明,比如资料来源统计表的设计原则:“科学、实用、简练、美观”表的形式要长、宽比例适中,一般以长方形为好;通常情况下,统计表的左右两端不封口,上下两条横线一般用粗线或双线封口,其他线用细线,且一般列标题之间用竖线隔开,行标题一般不必用横线隔开,切记不要用斜线;编制统计表应注意的问题要合理安排统计表的结构,横行标题和纵行标题要各归其位,相互对应,尽量反映所列内容之间的逻辑关系;选择合适的总标题:总标题既要简明扼要,又要能确切的说明表中的内容(what ),且应标明资料所属的时间(when) 和地区(where) ;
32、表中的数据应有计量单位。如表中的计量单位全相同时,可放在表的右上角标明,如“单位:万元”等字样。 如不同时应放在每个变量后或单列出一列“计量单位”标明;表中的数据一般是右对齐,而且同类数据小数点的位数应统一;(P38表3-9修改)数据栏不能有空白,对于无数字的空格,一般用“”表示,遇到相同的数字时要照写,不能用“同上”“同左”字样。当缺乏某项资料时,用符号“”表示,以免使人误以为是漏项;对于免于填报的资料,用符号“”填满。总之表内各行各栏不应用空格。表内应列出合计项,便于核对和运用。必要时,统计表应加以注解,连同数字资料的来源等一般在表的下方加上注释。统计图以点、线条、面积等方法描述、显示统计
33、数据的形式具有直观、醒目、易于理解等特点组成:坐标系图形图例19782007年三次产业增加值比重变化情况 常用的统计图有:柱形图和条形图、饼图和圆环图、累积频数分布图和累积频率分布图、直方图、折线图和曲线图散点图、气泡图和雷达图 统计图例1 某城市居民关注广告类型的频数分布表广告类型人数(人)频率()商品广告11256.0服务广告5125.5金融广告94.5房地产广告168.0招生招聘广告105.0其 他 广 告21.0合 计200100.0柱形图通常用于显示分类数据和顺序数据的分布特征以及变量值较少的离散数据的分布特征 柱形图19782007年三次产业增加值比重变化情况 例2 甲乙两城市对住房满意程度的频数分布表条形图一个饼形图只能显示一个总体的结构比例 饼形图圆环图可以显示多个总体的结构比例,每一环表示一个总体 圆环图线图(添加)例3 某生产车间50名工人加工零件个数频数分布表零件数(个)频数(人)频率()105110361101155101151208161201251428125130102013
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 招标投标流程培训
- 2024年饲料及宠物食品项目资金需求报告代可行性研究报告
- 矿棉项目可行性研究报告
- 隔热垫项目可行性研究报告
- 新建雷贝拉唑钠肠溶片项目立项申请报告
- 年产xxx尖尾棘轮扳手项目可行性研究报告(可行性分析)
- 年产xx橡胶木饰面项目可行性研究报告(投资方案)
- 慕课职业生涯规划
- 2023-2024学年广东省深圳市龙岗区三年级(上)期末英语试卷
- 4.3海-气相互作用课件高中地理人教版(2019)选择性必修一
- 高中化学-探究亚铁盐和铁盐的性质及转化教学设计学情分析教材分析课后反思
- 空气压缩机技术规范标准
- 铜及铜合金物理冶金基础-相图、紫铜
- 国家有关安全生产的方针政策法律法规
- 《临床输血技术规范》之输血指南
- 色彩的三属性与色立体
- 大国工匠彭祥华PPT
- 怒江水电开发的工程伦理案例分析
- 海南省文昌市龙楼镇赤筠村矿区石英采矿权出让收益评估报告
- SMM英国建筑工程标准计量规则中文 全套
- ICU脓毒血症护理查房
评论
0/150
提交评论