统计数据的整理与显示_第1页
统计数据的整理与显示_第2页
统计数据的整理与显示_第3页
统计数据的整理与显示_第4页
统计数据的整理与显示_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第3章章 统计数据的整理与显示统计数据的整理与显示 主要内容和学习目标主要内容和学习目标 统计数据的预处理统计数据的预处理(掌握)(掌握)统计数据的分组整理统计数据的分组整理(掌握)(掌握)统计数据的图表显示统计数据的图表显示(掌握)(掌握)一、统计数据的预处理一、统计数据的预处理 数据的审核数据的审核 数据的筛选数据的筛选 数据的排序数据的排序 1 1原始数据的审核原始数据的审核: : 完整性完整性 准确性准确性 2 2次级数据的审核次级数据的审核: : 完整性完整性 准确性准确性 适用性适用性 时效性时效性 逻辑检查逻辑检查 准确性审核的方法准确性审核的方法 计算检查计算检查 数据的审核

2、数据的审核 1 1将某些不符合要求的数据将某些不符合要求的数据 或有明显错误的数据予以剔除;或有明显错误的数据予以剔除; 2 2将符合某种特定条件的数据筛选出来,将符合某种特定条件的数据筛选出来, 不符合特定条件的数据予以剔除。不符合特定条件的数据予以剔除。 数据的筛选数据的筛选 数据的排序数据的排序 1升序升序 2降序降序ExcelExcel在统计数据预处理中的应用在统计数据预处理中的应用 利用利用ExcelExcel的相关命令可以自动完成数据的预处理的相关命令可以自动完成数据的预处理 有效性命令有效性命令 “数据数据”菜单菜单 筛选命令筛选命令( (自动筛选和高级筛选自动筛选和高级筛选)

3、) 排序命令排序命令返回返回二、统计数据的分组整理二、统计数据的分组整理 统计分组的原则统计分组的原则 品质型数据的分组整理品质型数据的分组整理 数值型数据的分组整理数值型数据的分组整理 分组整理的概念分组整理的概念 分组整理的步骤分组整理的步骤 分组整理:分组整理:就是按照统计研究的目的和要求,就是按照统计研究的目的和要求,选择选择一个或几个变量(标志)一个或几个变量(标志)将总体分为若干组,并将将总体分为若干组,并将数据分别列入对应的组内进行汇总。数据分别列入对应的组内进行汇总。l统计分组的核心:统计分组的核心:选择分组标志选择分组标志l统计分组的标志:统计分组的标志:品质标志品质标志 数

4、量标志数量标志l统计分组的结果:统计分组的结果: 组内具有同质性组内具有同质性 组间具有差异性组间具有差异性 分组整理的概念分组整理的概念 统计分组的种类统计分组的种类简单分组简单分组复合分组复合分组品质分组品质分组数量分组数量分组类型分组类型分组结构分组结构分组分析分组分析分组按分组标志的多少按分组标志的多少按分组标志的性质不同按分组标志的性质不同按分组的作用和任务不同按分组的作用和任务不同l统计分组的种类统计分组的种类 简单分组和平行分组体系简单分组和平行分组体系按年龄分组按年龄分组人数人数按文化程度分组按文化程度分组人数人数2020岁及岁及2020岁以下岁以下大专及大专以上大专及大专以上

5、21213535岁岁中专、技工中专、技工36365050岁岁高中高中51515555岁岁初中初中56566060岁岁小学、识字不多或文盲小学、识字不多或文盲 复合分组和复合分组体系复合分组和复合分组体系 投资规模投资规模经济类型经济类型大型大型中型中型小型小型国有经济国有经济集体经济集体经济私营经济私营经济个体经济个体经济联营经济联营经济外商投资经济外商投资经济其他经济其他经济穷尽原则:穷尽原则:使总体中的每一个单位都有组可归使总体中的每一个单位都有组可归互斥原则:互斥原则:使总体中的每一个单位只有一组可归使总体中的每一个单位只有一组可归 统计分组的原则统计分组的原则 分组整理的步骤分组整理的

6、步骤 第一步:对数据进行分组第一步:对数据进行分组第二步:计算各组的频数、第二步:计算各组的频数、频率、累积频数和累积频率频率、累积频数和累积频率第三步:编制频数分布表第三步:编制频数分布表频数频数(FrequencyFrequency,亦称为次数亦称为次数)是指落入各组中的数据的个数或次数是指落入各组中的数据的个数或次数频率频率(Relative frequencyRelative frequency,亦称比重或百分比),亦称比重或百分比)是指各组中的数据个数或次数占全部数据总数的比例是指各组中的数据个数或次数占全部数据总数的比例累积频数累积频数(Cumulative frequencies

7、Cumulative frequencies)是将各有序类别或组的频数逐级累加起来是将各有序类别或组的频数逐级累加起来累积方法:向上累积、向下累积累积方法:向上累积、向下累积 累积频率累积频率(Cumulative percentagesCumulative percentages)是将各有序类别或组的频率逐级累加起来是将各有序类别或组的频率逐级累加起来累积方法:向上累积、向下累积累积方法:向上累积、向下累积频数分布表频数分布表(Frequency distributionFrequency distribution)是各组及其相应的频数(还可包括频率、累积频数是各组及其相应的频数(还可包括频

8、率、累积频数和累积频率)依一定的次序排列而成的表格和累积频率)依一定的次序排列而成的表格分组分组频数频数频率()频率()合合 计计100100 XXX频数分布表频数分布表 品质型数据的分组整理品质型数据的分组整理品质型数据的分组方法:品质型数据的分组方法:把每一个变量值作为一组把每一个变量值作为一组分类数据的频数分布表可以包括:分类数据的频数分布表可以包括:分组、频数和频率分组、频数和频率顺序数据的频数分布表可以包括:顺序数据的频数分布表可以包括:分组、频数、频率、累积频数和累积频率分组、频数、频率、累积频数和累积频率 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布广告类型广

9、告类型人数(人)人数(人)频率()频率()商品广告商品广告11211256.056.0服务广告服务广告515125.525.5金融广告金融广告9 94.54.5房地产广告房地产广告16168.08.0招生招聘广告招生招聘广告10105.05.0其其 他他 广广 告告2 21.01.0合合 计计200200100.0100.0 某城市家庭对住房状况满意程度的频数分布某城市家庭对住房状况满意程度的频数分布 满意满意 程度程度户数户数(户)(户)百分比百分比()()向上累积向上累积向下累积向下累积户数户数(户)(户)百分比百分比()()户数(户)户数(户)百分比百分比()()非常非常不满意不满意24

10、248 824248.08.0300 300 100100不满意不满意108108363613213244.044.0276 276 9292一般一般9393313122522575.075.0168 168 5656满意满意4545151527027090.090.075 75 2525非常非常满意满意30301010300300100.0100.030 30 1010合计合计300300100100 数值型数据的分组整理数值型数据的分组整理数值型数据的分组方法:数值型数据的分组方法:单项式分组和组距式分组单项式分组和组距式分组数值型的频数分布表可以包括:数值型的频数分布表可以包括:分组、频

11、数、频率、累积频数和累积频率分组、频数、频率、累积频数和累积频率 l单项式分组:单项式分组:把每一个具体的变量值作为一组把每一个具体的变量值作为一组适用于变量值较少的离散变量的情况适用于变量值较少的离散变量的情况 l组距式分组:组距式分组:将全部变量值依次划分为若干个将全部变量值依次划分为若干个 数值区间,每一个数值区间作为一个组。数值区间,每一个数值区间作为一个组。适合于变量值较多的离散变量和连续变量的情况适合于变量值较多的离散变量和连续变量的情况 某某200200名手机使用者目前已更换手机数量的名手机使用者目前已更换手机数量的 频数分布表频数分布表更换手机数量更换手机数量人数(人)人数(人

12、)频率()频率()0 06 63 31 1828241412 2767638383 3及以上及以上36361818合合 计计200200100100 组距式(等距)分组的步骤组距式(等距)分组的步骤(1 1)计算全距)计算全距R R: 或或 RR最大值组的上限最小值组的下限最大值组的上限最小值组的下限 (2 2)确定组数)确定组数K K:组数的多少以能显示数据分布的特征组数的多少以能显示数据分布的特征 和规律为宜。和规律为宜。 经验公式:经验公式: NKlg3.31 minmaxxxR (3 3)确定组距)确定组距d d:一个组的上限与下限之差一个组的上限与下限之差 NxxKRdlg3.31m

13、inmax(4 4)确定组限:)确定组限:应遵循应遵循“不重不漏不重不漏”原则原则 为便于计算,组距宜取为便于计算,组距宜取5 5或或1010的倍数的倍数 首先确定最小值组的下限,然后利用首先确定最小值组的下限,然后利用组限和组距的关系依次确定其他组限。组限和组距的关系依次确定其他组限。(5 5)编制频数分布表)编制频数分布表 1 1、 正确使用间断式组限和连续式组限正确使用间断式组限和连续式组限 间断式组限:保证无数据项落在相邻两组上下限之间间断式组限:保证无数据项落在相邻两组上下限之间 连续式组限:遵循连续式组限:遵循“上限不在内上限不在内” 原则原则 2 2、正确选择第一组的下限和最后一

14、组的上限、正确选择第一组的下限和最后一组的上限 第一组的下限:应略小于或等于最小变量值第一组的下限:应略小于或等于最小变量值 最后一组的上限:应略大于或等于最大变量值最后一组的上限:应略大于或等于最大变量值 3 3、正确使用开口组形式、正确使用开口组形式 第一组:采取第一组:采取“以下以下” 最后一组:采取最后一组:采取“以上以上” 确定组限的细节问题确定组限的细节问题 1 1、使用间断式组限时、使用间断式组限时 各组的组距本组的上限前组的上限各组的组距本组的上限前组的上限 2 2、使用连续式组限时、使用连续式组限时 各组的组距本组的上限本组的下限各组的组距本组的上限本组的下限 3 3、开口组

15、通常以相邻组的组距为其组距、开口组通常以相邻组的组距为其组距 确定组距的细节问题确定组距的细节问题 1 1、不等距分组时需要计算、不等距分组时需要计算频数密度频数密度和和频率密度频率密度 频数密度频数频数密度频数/ /组距组距 频率密度频率频率密度频率/ /组距组距 2 2、组距式分组时通常使用、组距式分组时通常使用组中值组中值作为各组数据的代表值作为各组数据的代表值 连续式组限连续式组限 : 组中值(本组下限值本组上限值)组中值(本组下限值本组上限值)/2/2 间断式组限间断式组限 : 组中值(本组下限值后组下限值)组中值(本组下限值后组下限值)/2/2 3 3、开口组组中值的确定方法、开口

16、组组中值的确定方法 “以上以上”组:组: 组中值本组下限值相邻组组距组中值本组下限值相邻组组距/2 /2 “以下以下”组:组: 组中值本组上限值相邻组组距组中值本组上限值相邻组组距/2/2其他的细节问题其他的细节问题例题分析例题分析某生产车间某生产车间5050名工人日加工零件数原始资料(单位:个)名工人日加工零件数原始资料(单位:个)117117122122124124129129139139107107117117130130122122125125108108131131125125117117122122133133126126122122118118108108110110118118

17、123123126126133133134134127127123123118118112112112112134134127127123123119119113113120120123123127127135135137137114114120120128128124124115115139139128128124124121121试采用组距式分组法编制频数分布表试采用组距式分组法编制频数分布表排序表排序表1071071081081081081101101121121121121131131141141151151171171171171171171181181181181181181191

18、19120120120120121121122122122122122122122122123123123123123123123123124124124124124124125125125125126126126126127127127127127127128128128128129129130130131131133133133133134134134134135135137137139139139139解:解:最大值最大值139139,最小值,最小值107107(1) (1) 计算全距。计算全距。R R139139107140-105=35107140-105=35(2) (2) 计算组

19、数。计算组数。 , ,取取k=7k=7为宜。为宜。(3) (3) 计算组距。计算组距。d=35d=357=57=5(4) (4) 确定组限。第一组的下限取确定组限。第一组的下限取105105,其他组限依次利用组限,其他组限依次利用组限和组距的关系确定。和组距的关系确定。(5) (5) 编制频数分布表。经分组整理后,可形成一个采用连续式编制频数分布表。经分组整理后,可形成一个采用连续式组限编制的频数分布表,也可形成一个采用间断式组限编制组限编制的频数分布表,也可形成一个采用间断式组限编制的频数分布表。的频数分布表。 组距式分组的解题过程组距式分组的解题过程13.3lg506.6K 零件数(个)零

20、件数(个)频数(人)频数(人)频率()频率()1051051101103 36 61101101151155 510101151151201208 8161612012012512514142828125125130130101020201301301351356 612121351351401404 48 8合合 计计5050100100 连续式组距分组频数分布表连续式组距分组频数分布表使用连续式组限时:各组的组距本组上限本组下限使用连续式组限时:各组的组距本组上限本组下限 零件数(个)零件数(个)频数(人)频数(人)频率()频率()1051051091093 36 611011011411

21、45 510101151151191198 8161612012012412414142828125125129129101020201301301341346 612121351351391394 48 8合合 计计5050100100 间断式组距分组频数分布表间断式组距分组频数分布表使用间断式组限时:各组的组距本组上限前组上限使用间断式组限时:各组的组距本组上限前组上限 ExcelExcel在统计数据分组整理中的应用在统计数据分组整理中的应用 利用利用ExcelExcel的相关函数、命令和工具可以自动完成的相关函数、命令和工具可以自动完成 数据的分组整理数据的分组整理 品质型数据:品质型数

22、据: COUNTIFCOUNTIF、数据透视表和数据透视图、数据透视表和数据透视图 数值型数据:数值型数据: COUNTIFCOUNTIF、数据透视表和数据透视图、数据透视表和数据透视图 (单项式分组)(单项式分组) FREQUENCY FREQUENCY 直方图工具直方图工具 (组距式分组)(组距式分组) 返回返回三、统计数据的图表显示三、统计数据的图表显示 统计表统计表 统计图统计图统计表的结构统计表的结构20032004年城镇居民家庭基本情况表年城镇居民家庭基本情况表项目项目单位单位2003年年 2004年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就

23、业人口 平均每户就业面平均每户就业面 平均每人全部年收入平均每人全部年收入 平均每人消费性支出平均每人消费性支出户户人人人人%元元元元 480283.011.5852.49061.26510.94 50430 2.98 1.56 52.35 10128.51 7182.10资料来源:中国统计年鉴2005,中国统计出版社。注:本表为城镇居民家庭收支抽样调查材料。 统计表的统计表的构成要素:构成要素: 表头、表头、 行标题、行标题、 列标题、列标题、 数字资料数字资料 表外附加表外附加统计表的设计原则:统计表的设计原则:“科学、实用、简练、美观科学、实用、简练、美观” 1 1、总标题的表述、总标题

24、的表述2 2、行、列标题的排列、行、列标题的排列 3 3、计量单位的安排、计量单位的安排4 4、合计栏的安排、合计栏的安排5 5、表格线的绘制、表格线的绘制6 6、指标数值的填写、指标数值的填写7 7、表外附加的设置、表外附加的设置统计表的设计统计表的设计表表A A 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布广告类型广告类型人数人数( (人人) )频率频率(%)(%) 商品广告商品广告11256.0 服务广告服务广告 5125.5 金融广告金融广告 9 4.5 房地产广告房地产广告 16 8.0 招生招聘广告招生招聘广告 10 5.0 其他广告其他广告 2 1.0合计合计

25、200 100统计表的设计统计表的设计表表B B 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布广告类型广告类型人数人数(人人)频率频率(%) 商品广告商品广告11256.0 服务广告服务广告 5125.5 金融广告金融广告 9 4.5 房地产广告房地产广告 16 8.0 招生招聘广告招生招聘广告 10 5.0 其他广告其他广告 2 1.0合计合计200100统计表的设计统计表的设计表表C C 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布广告类型广告类型人数人数( (人人) )频率频率(%)(%) 商品广告商品广告11256.0 服务广告服务广告 5125

26、.5 金融广告金融广告 9 4.5 房地产广告房地产广告 16 8.0 招生招聘广告招生招聘广告 10 5.0 其他广告其他广告 2 1.0合计合计200100常用的统计图有:常用的统计图有:柱形图和条形图、饼图和圆环图、柱形图和条形图、饼图和圆环图、累积频数分布图和累积频率分布图、累积频数分布图和累积频率分布图、直方图、折线图和曲线图直方图、折线图和曲线图散点图、气泡图和雷达图散点图、气泡图和雷达图 统计图统计图分类数据的显示:柱形图、条形图、分类数据的显示:柱形图、条形图、 饼图、饼图、 圆环图圆环图顺序数据的显示:柱形图、条形图、顺序数据的显示:柱形图、条形图、 饼图、饼图、 圆环图、圆

27、环图、 累积频数分布图、累积频数分布图、 累积频率分布图累积频率分布图数值数据的显示:直方图、折线图、曲线图数值数据的显示:直方图、折线图、曲线图两个变量之间的关系:散点图两个变量之间的关系:散点图三个变量之间的关系:气泡图三个变量之间的关系:气泡图多个变量之间的关系:雷达图多个变量之间的关系:雷达图各种统计图的用途各种统计图的用途例例1 1 某城市居民关注广告类型的频数分布表某城市居民关注广告类型的频数分布表广告类型广告类型人数(人)人数(人)频率()频率()商品广告商品广告11211256.056.0服务广告服务广告 51 5125.525.5金融广告金融广告 9 9 4.5 4.5房地产

28、广告房地产广告 16 16 8.0 8.0招生招聘广告招生招聘广告 10 10 5.0 5.0其其 他他 广广 告告 2 2 1.0 1.0合合 计计200200100.0100.0柱形图通常用于显示分类数据和顺序数据的分布特征柱形图通常用于显示分类数据和顺序数据的分布特征以及变量值较少的离散数据的分布特征以及变量值较少的离散数据的分布特征 柱形图柱形图饼形图只能显示一个总体的结构比例饼形图只能显示一个总体的结构比例 饼形图饼形图例例2 2 甲乙两城市对住房满意程度的频数分布表甲乙两城市对住房满意程度的频数分布表条形图通常用于显示分类数据和顺序数据的分布特征条形图通常用于显示分类数据和顺序数据

29、的分布特征以及变量值较少的离散数据的分布特征以及变量值较少的离散数据的分布特征 条形图条形图圆环图可以显示多个总体的结构比例,每一环表示一个总体圆环图可以显示多个总体的结构比例,每一环表示一个总体 圆环图圆环图累积频数图用于显示顺序数据和数值型数据的分布特征累积频数图用于显示顺序数据和数值型数据的分布特征 累积频数图累积频数图累积频率图累积频率图累积频率图用于显示顺序数据和数值型数据的分布特征累积频率图用于显示顺序数据和数值型数据的分布特征 例例3 3 某生产车间某生产车间5050名工人加工零件个数频数分布表名工人加工零件个数频数分布表零件数(个)零件数(个)频数(人)频数(人)频率()频率()1051051101103 3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论