统计数据的整理与显示._第1页
统计数据的整理与显示._第2页
统计数据的整理与显示._第3页
统计数据的整理与显示._第4页
统计数据的整理与显示._第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、描述统计描述统计统计数据统计数据的收集的收集数据分布特征数据分布特征的测度的测度统计数据统计数据的整理与显示的整理与显示第第3讲讲 统计数据的整理与显示统计数据的整理与显示 主要内容和学习目标主要内容和学习目标 统计数据的预处理统计数据的预处理(掌握)(掌握)统计数据的分组整理统计数据的分组整理(掌握)(掌握)统计数据的图表显示统计数据的图表显示(掌握)(掌握)一、统计数据的预处理一、统计数据的预处理 数据的审核数据的审核 数据的筛选数据的筛选 数据的排序数据的排序 1 1原始数据的审核原始数据的审核: : 完整性完整性 准确性准确性 2 2次级数据的审核次级数据的审核: : 完整性完整性 准

2、确性准确性 适用性适用性 时效性时效性 逻辑检查逻辑检查 准确性审核的方法准确性审核的方法 计算检查计算检查 数据的审核数据的审核 1 1将某些不符合要求的数据将某些不符合要求的数据 或有明显错误的数据予以剔除;或有明显错误的数据予以剔除; 2 2将符合某种特定条件的数据筛选出来,将符合某种特定条件的数据筛选出来, 不符合特定条件的数据予以剔除。不符合特定条件的数据予以剔除。 数据的筛选数据的筛选 数据的排序数据的排序 1升序升序 2降序降序ExcelExcel在统计数据预处理中的应用在统计数据预处理中的应用 利用利用ExcelExcel的相关命令可以自动完成数据的预处理的相关命令可以自动完成

3、数据的预处理 有效性命令有效性命令 “ “数据数据”菜单菜单 筛选命令筛选命令( (自动筛选和高级筛选自动筛选和高级筛选) ) 排序命令排序命令统计数据的预处理统计数据的预处理统计数据的分组整理统计数据的分组整理统计数据的图表显示统计数据的图表显示统计数据的分组整理统计数据的分组整理 统计分组的原则统计分组的原则 品质型数据的分组整理品质型数据的分组整理 数值型数据的分组整理数值型数据的分组整理 分组整理的概念分组整理的概念 分组整理的步骤分组整理的步骤 分组整理:分组整理:按照统计研究的目的和要求,按照统计研究的目的和要求,选择一选择一个或几个变量(标志)个或几个变量(标志)将总体分为若干组

4、,并将将总体分为若干组,并将数据分别列入对应的组内进行汇总。数据分别列入对应的组内进行汇总。l统计分组的核心:统计分组的核心:选择分组标志选择分组标志l统计分组的标志:统计分组的标志:品质标志品质标志 数量标志数量标志l统计分组的结果:统计分组的结果: 组内具有同质性组内具有同质性 组间具有差异性组间具有差异性 分组整理的概念分组整理的概念 年份项目19781980198519891990(一)国民生产总值中三次产业比例第一产业28.430.429.726.627.5第二产业48.64945.245.745.3第三产业2320.624.827.727.2(二)国民收入使用额中积累与消费比例积累

5、36.531.53534.734.2消费63.568.56565.365.8(三)工农业总产值中农轻重比例农业24.827.227.122.924.3轻工业32.434.334.337.737.5重工业42.838.538.639.438.2表3l 我国国民经济主要比例关系()资料来源:国家统计局:中国统计年鉴(1995),116页,l版,北京,中国统计出版社,1995。统计分组的种类统计分组的种类简单分组简单分组复合分组复合分组品质分组品质分组数量分组数量分组类型分组类型分组结构分组结构分组分析分组分析分组按分组标志的多少按分组标志的多少按分组标志的性质不同按分组标志的性质不同按分组的作用和

6、任务不同按分组的作用和任务不同l统计分组的种类统计分组的种类品质分组品质分组(Attributive grouping)数量分组数量分组 (Variable grouping) 即总体即总体按按品质品质标标志进行分志进行分组。组。 即总体即总体按按数量数量标标志进行分志进行分组。组。简单分组简单分组(Simple grouping) 复合分组复合分组 (Composite grouping) 即总体按一个即总体按一个标志进行分组。标志进行分组。它只能从某一它只能从某一方面说明总体方面说明总体的分布状况和的分布状况和内部结构。内部结构。 复合分组是指对复合分组是指对所研究的总体按两所研究的总体按

7、两个或两个以上的标个或两个以上的标志进行的多层次分志进行的多层次分组。可用于对事物组。可用于对事物多方面、多层次的多方面、多层次的分析研究。分析研究。 对教师对教师的分类的分类按职称分类按职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+2按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232对教师对教师的分类的分类 简单分组和平行分组体系简单分组和平行分组体系按年龄分组:按年龄分组:按文化程度分组:按文化程度分组:2020岁及岁及2020岁以下岁以下大专及大专以上大专及大专以

8、上21213535岁岁中专、技工中专、技工36365050岁岁高中高中51515555岁岁初中初中56566060岁岁小学、识字不多或文盲小学、识字不多或文盲 复合分组和复合分组体系复合分组和复合分组体系按经济类型分组按经济类型分组按投资规模分组按投资规模分组国有经济投资:国有经济投资:大型大型中型中型小型小型集体经济投资:集体经济投资:大型大型中型中型小型小型外商经济投资:外商经济投资:大型大型中型中型小型小型其他经济投资:其他经济投资:大型大型中型中型小型小型穷尽原则:穷尽原则:使总体中的每一个单位都有组可归使总体中的每一个单位都有组可归互斥原则:互斥原则:使总体中的每一个单位只有一组可归

9、使总体中的每一个单位只有一组可归 统计分组的原则统计分组的原则 分组整理的步骤分组整理的步骤 第一步:对数据进行分组第一步:对数据进行分组第二步:计算各组的频数、频率、第二步:计算各组的频数、频率、 累积频数和累积频率累积频数和累积频率第三步:编制频数分布表第三步:编制频数分布表频数分布表频数分布表(Frequency distributionFrequency distribution)是各组及其相应的频数(还可包括频率、累积频数是各组及其相应的频数(还可包括频率、累积频数和累积频率)依一定的次序排列而成的表格和累积频率)依一定的次序排列而成的表格分组分组频数频数频率()频率()合合 计计1

10、00100 XXX频数分布表频数分布表频数频数(FrequencyFrequency,亦称为次数亦称为次数)是指落入各组中的数据的个数或次数是指落入各组中的数据的个数或次数频率频率(Relative frequencyRelative frequency,亦称比重或百分比),亦称比重或百分比)是指各组中的数据个数或次数占全部数据总数的比例是指各组中的数据个数或次数占全部数据总数的比例累积频数累积频数(Cumulative frequenciesCumulative frequencies)是将各有序类别或组的频数逐级累加起来是将各有序类别或组的频数逐级累加起来累积方法:较小制累计、较大制累计累

11、积方法:较小制累计、较大制累计累积频率累积频率(Cumulative percentagesCumulative percentages)是将各有序类别或组的频率逐级累加起来是将各有序类别或组的频率逐级累加起来累积方法:较小制累计、较大制累计累积方法:较小制累计、较大制累计 是以最小组的频率或频数为始点逐是以最小组的频率或频数为始点逐项累计各组频数或频率。项累计各组频数或频率。 是以最大组的频率或频数为始点逐是以最大组的频率或频数为始点逐项累计各组频数或频率。项累计各组频数或频率。 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()5以下以下51010

12、151520202525以上以上410161343820322686合计合计50100fff1005016 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()较小较小累计累计较小较小累计累计5以下以下51010151520202525以上以上41016134382032268641430434750828608694100合计合计50100fff 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()较小较小累计累计较大较大累计累计较小较小累计累计较大较大累计累计5以下以下51010151520202525以上以上

13、410161343820322686414304347505046362073828608694100100927240146合计合计50100fff 品质型数据的分组整理品质型数据的分组整理品质型数据的分组方法:品质型数据的分组方法:把每一个变量值作为一组把每一个变量值作为一组1.1.分类数据的频数分布表可以包括:分类数据的频数分布表可以包括:分组、频数和频率分组、频数和频率2.2.顺序数据的频数分布表可以包括:顺序数据的频数分布表可以包括:分组、频数、频率、累积频数和累积频率分组、频数、频率、累积频数和累积频率 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布广告类型广告类

14、型人数(人)人数(人)频率()频率()商品广告商品广告11211256.056.0服务广告服务广告515125.525.5金融广告金融广告9 94.54.5房地产广告房地产广告16168.08.0招生招聘广告招生招聘广告10105.05.0其其 他他 广广 告告2 21.01.0合合 计计200200100.0100.0 某城市家庭对住房状况满意程度的频数分布某城市家庭对住房状况满意程度的频数分布 满意满意 程度程度户数户数(户)(户)百分比百分比()()向上累积向上累积向下累积向下累积户数户数(户)(户)百分比百分比()()户数(户)户数(户)百分比百分比()()非常非常不满意不满意2424

15、8 824248.08.0300 300 100100不满意不满意108108363613213244.044.0276 276 9292一般一般9393313122522575.075.0168 168 5656满意满意4545151527027090.090.075 75 2525非常非常满意满意30301010300300100.0100.030 30 1010合计合计300300100100 数值型数据的分组整理数值型数据的分组整理数值型数据的分组方法:数值型数据的分组方法:单项式分组和组距式分组单项式分组和组距式分组数值型的频数分布表可以包括:数值型的频数分布表可以包括:分组、频数、

16、频率、累积频数和累积频率分组、频数、频率、累积频数和累积频率 l单项式分组:单项式分组:把每一个具体的变量值作为一组把每一个具体的变量值作为一组:适用于变量值较少的离散变量的情况:适用于变量值较少的离散变量的情况 l组距式分组:组距式分组:将全部变量值依次划分为若干个将全部变量值依次划分为若干个 数值区间,每一个数值区间作为一个组。数值区间,每一个数值区间作为一个组。:适合于变量值较多的离散变量和连续变量的情况:适合于变量值较多的离散变量和连续变量的情况 某某200200名手机使用者目前已更换手机数量的名手机使用者目前已更换手机数量的 频数分布表频数分布表更换手机数量更换手机数量人数(人)人数

17、(人)频率()频率()0 06 63 31 1828241412 2767638383 3及以上及以上36361818合合 计计200200100100 组距式(等距)分组的步骤组距式(等距)分组的步骤(1 1)计算全距)计算全距R R: 或或 RR最大值组的上限最小值组的下限最大值组的上限最小值组的下限 (2 2)确定组数)确定组数K K:组数的多少以能显示数据分布的特征组数的多少以能显示数据分布的特征 和规律为宜。和规律为宜。 经验公式:经验公式: NKlg3 .31minmaxxxR (3 3)确定组距)确定组距d d:一个组的上限与下限之差一个组的上限与下限之差 NxxKRdlg3.3

18、1minmax(4 4)确定组限:)确定组限:应遵循应遵循“不重不漏不重不漏”原则原则 为便于计算,组距宜取为便于计算,组距宜取5 5或或1010的倍数的倍数 首先确定最小值组的下限,然后利用首先确定最小值组的下限,然后利用组限和组距的关系依次确定其他组限。组限和组距的关系依次确定其他组限。(5 5)编制频数分布表)编制频数分布表 1 1、 正确使用组限,遵循正确使用组限,遵循“上限不在内上限不在内” ” 原则原则 2 2、正确选择第一组的下限和最后一组的上限、正确选择第一组的下限和最后一组的上限 第一组的下限:应略小于或等于最小变量值第一组的下限:应略小于或等于最小变量值 最后一组的上限:应

19、略大于或等于最大变量值最后一组的上限:应略大于或等于最大变量值 3 3、正确使用开口组形式、正确使用开口组形式 第一组:采取第一组:采取“以下以下” 最后一组:采取最后一组:采取“以上以上” ” 确定组限的细节问题确定组限的细节问题 1 1、使用组限时、使用组限时 各组的组距本组的上限本组的下限各组的组距本组的上限本组的下限 2 2、开口组通常以相邻组的组距为其组距、开口组通常以相邻组的组距为其组距 确定组距的细节问题确定组距的细节问题例题分析例题分析某生产车间某生产车间5050名工人日加工零件数原始资料(单位:个)名工人日加工零件数原始资料(单位:个)11711712212212412412

20、9129139139107107117117130130122122125125108108131131125125117117122122133133126126122122118118108108110110118118123123126126133133134134127127123123118118112112112112134134127127123123119119113113120120123123127127135135137137114114120120128128124124115115139139128128124124121121试采用组距式分组法编制频数分布表试采用组

21、距式分组法编制频数分布表排序表排序表107107108108108108110110112112112112113113114114115115117117117117117117118118118118118118119119120120120120121121122122122122122122122122123123123123123123123123124124124124124124125125125125126126126126127127127127127127128128128128129129130130131131133133133133134134134134135135

22、137137139139139139解:解:最大值最大值139139,最小值,最小值107107(1) (1) 计算全距。计算全距。R R139139107140-105=35107140-105=35(2) (2) 计算组数。计算组数。 , ,取取k=7k=7为宜。为宜。(3) (3) 计算组距。计算组距。d=35d=357=57=5(4) (4) 确定组限。第一组的下限取确定组限。第一组的下限取105105,其他组限依次利用组限,其他组限依次利用组限和组距的关系确定。和组距的关系确定。(5) (5) 编制频数分布表。经分组整理后,可形成一个采用连续式编制频数分布表。经分组整理后,可形成一个

23、采用连续式组限编制的频数分布表,也可形成一个采用间断式组限编制组限编制的频数分布表,也可形成一个采用间断式组限编制的频数分布表。的频数分布表。 组距式分组的解题过程组距式分组的解题过程1 3.3lg50 6.6K 零件数(个)零件数(个)频数(人)频数(人)频率()频率()1051051101103 36 61101101151155 510101151151201208 8161612012012512514142828125125130130101020201301301351356 612121351351401404 48 8合合 计计5050100100组距分组频数分布表组距分组频数

24、分布表使用组限时:各组的组距本组上限本组下限使用组限时:各组的组距本组上限本组下限 1 1、组距式分组时通常使用、组距式分组时通常使用组中值组中值作为各组数据的代表值作为各组数据的代表值 组中值(本组下限值本组上限值)组中值(本组下限值本组上限值)/2/2 2 2、开口组组中值的确定方法、开口组组中值的确定方法 “ “以上以上”组:组: 组中值本组下限值相邻组组距组中值本组下限值相邻组组距/2 /2 “ “以下以下”组:组: 组中值本组上限值相邻组组距组中值本组上限值相邻组组距/2/2其他的细节问题其他的细节问题ExcelExcel在统计数据分组整理中的应用在统计数据分组整理中的应用 利用利用

25、ExcelExcel的相关函数、命令和工具可以自动完成的相关函数、命令和工具可以自动完成 数据的分组整理数据的分组整理 品质型数据:品质型数据: COUNTIFCOUNTIF、数据透视表和数据透视图、数据透视表和数据透视图 数值型数据:数值型数据: COUNTIFCOUNTIF、数据透视表和数据透视图、数据透视表和数据透视图 (单项式分组)(单项式分组) FREQUENCY FREQUENCY 直方图工具直方图工具 (组距式分组)(组距式分组) 统计数据的图表显示统计数据的图表显示统计图统计图统计表统计表常用的统计图有:常用的统计图有:柱形图和条形图、饼图和圆环图、柱形图和条形图、饼图和圆环图

26、、散点图、气泡图和雷达图、散点图、气泡图和雷达图、累积频数分布图和累积频率分布图、累积频数分布图和累积频率分布图、直方图、折线图和曲线图直方图、折线图和曲线图 统计图统计图例例1 1 某城市居民关注广告类型的频数分布表某城市居民关注广告类型的频数分布表广告类型广告类型人数(人)人数(人)频率()频率()商品广告商品广告11211256.056.0服务广告服务广告515125.525.5金融广告金融广告9 94.54.5房地产广告房地产广告16168.08.0招生招聘广告招生招聘广告10105.05.0其其 他他 广广 告告2 21.01.0合合 计计200200100.0100.0柱形图通常用

27、于显示分类数据和顺序数据的分布特征柱形图通常用于显示分类数据和顺序数据的分布特征以及变量值较少的离散数据的分布特征以及变量值较少的离散数据的分布特征 柱形图柱形图饼形图只能显示一个总体的结构比例饼形图只能显示一个总体的结构比例 饼形图饼形图例例2 2 甲乙两城市对住房满意程度的频数分布表甲乙两城市对住房满意程度的频数分布表条形图通常用于显示分类数据和顺序数据的分布特征条形图通常用于显示分类数据和顺序数据的分布特征以及变量值较少的离散数据的分布特征以及变量值较少的离散数据的分布特征 条形图条形图圆环图可以显示多个总体的结构比例,每一环表示一个总体圆环图可以显示多个总体的结构比例,每一环表示一个总

28、体 圆环图圆环图累积频数图用于显示顺序数据和数值型数据的分布特征累积频数图用于显示顺序数据和数值型数据的分布特征 累积频数图累积频数图累积频率图累积频率图累积频率图用于显示顺序数据和数值型数据的分布特征累积频率图用于显示顺序数据和数值型数据的分布特征 温度温度/降雨量降雨量/mm/mm产量产量/kg/k/kg/k6 62525225022508 8404034503450101058584500450013136868575057501414110110580058001616989875007500212112012082508250例例3 小麦产量与降雨量和温度的数据小麦产量与降雨量和温度

29、的数据散点图是用于展示两个变量之间关系的一种图形散点图是用于展示两个变量之间关系的一种图形 散点图散点图气泡大小表示产量气泡图是用于展示三个变量之间关系的一种图形气泡图是用于展示三个变量之间关系的一种图形 气泡图气泡图项目项目城镇居民城镇居民农村居民农村居民食品食品 37.73 37.73 41.59 41.59 衣着衣着 9.56 9.56 11.75 11.75 家庭设备用品及服务家庭设备用品及服务 5.67 5.67 8.20 8.20 医疗保健医疗保健 7.35 7.35 5.06 5.06 交通通信交通通信 11.75 11.75 2.24 2.24 教育文化娱乐服务教育文化娱乐服务

30、 14.38 14.38 8.36 8.36 居住居住 10.21 10.21 21.66 21.66 杂项商品与服务杂项商品与服务 3.34 3.34 1.13 1.13 合计合计100.00 100.00 100.00 100.00 例例4 4 某地区城乡居民家庭平均每人全年消费性支出构成()某地区城乡居民家庭平均每人全年消费性支出构成()雷达图是显示多个变量的常用方法,也称为蜘蛛图雷达图是显示多个变量的常用方法,也称为蜘蛛图 雷达图雷达图直方图直方图(histogram)1.1.用矩形的宽度和高度来表示频数分布的图形,用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组

31、的频数分布实际上是用矩形的面积来表示各组的频数分布2.2.在直角坐标中,用横轴表示数据分组,纵轴表在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一示频数或频率,各组与相应的频数就形成了一个矩形,即直方图个矩形,即直方图3.3.直方图下的总面积等于直方图下的总面积等于1 1 (Histography)02468101214506 0708 0901 00分 数人数频率(%)5060607070808090901002711128517.527.53020合 计40100 折线图折线图(frequency polygon)1.1.折线图也称频数多边形图折线图也称频数

32、多边形图2.2.把直方图顶部的中点把直方图顶部的中点( (组中值组中值) )用直线连接起来,再用直线连接起来,再把原来的直方图抹掉把原来的直方图抹掉3.3.折线图的两个终点要与横轴相交折线图的两个终点要与横轴相交4.4.第一个矩形的顶部中点通过竖边中点(即该组频数第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴与其竖边中点连接到横轴5.5.折线图下所围成的面积与直方图的面积相等,二者折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的所表示的频数分布是一致的例例5 5 某生

33、产车间某生产车间5050名工人加工零件个数频数分布表名工人加工零件个数频数分布表零件数(个)零件数(个)频数(人)频数(人)频率()频率()1051051101103 36 61101101151155 510101151151201208 8161612012012512514142828125125130130101020201301301351356 612121351351401404 48 8合合 计计5050100100直方图和折线图主要用于显示数值型数据的分布特征直方图和折线图主要用于显示数值型数据的分布特征 直方图和折线图直方图和折线图直方图与柱形图和条图有何区别?直方图与柱形

34、图和条图有何区别?注意:注意:v1 1、对于等距分组的数据,可用距形的高度直接表示、对于等距分组的数据,可用距形的高度直接表示频数的分布;对于不等距分组的数据,用距形的面积频数的分布;对于不等距分组的数据,用距形的面积(而不是高度)表示各组的频数分布。(而不是高度)表示各组的频数分布。v2 2、从本质上说,直方图应用频数密度来绘制,这样、从本质上说,直方图应用频数密度来绘制,这样可使直方图总面积为可使直方图总面积为1 1。曲线图主要用于显示组数较多的数值型数据的分布特征曲线图主要用于显示组数较多的数值型数据的分布特征 频数分布曲线图频数分布曲线图 频数分布的类型频数分布的类型分类数据的显示:柱形图、条形图、分类数据的显示:柱形图、条形图、 饼图、饼图、 圆环图圆环图顺序数据的显示:柱形图、条形图、顺序数据的显示:柱形图、条形图、 饼图、饼图、 圆环图、圆环图、 累积频数分布图、累积频数分布图、 累积频率分布图累积频率分布图数值数据的显示:直方图、折线图、曲线图数值数据的显示:直方图、折线图、曲线图两个变量之间的关系:散点图两个变量之间的关系:散点图三个变量之间的关系:气泡图三个变量之间的关系:气泡图多个变量之间的关系:雷达图多个变量之间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论