(应用统计学经济与管理中的数据分析)第二章统计数据的收集、整理与展示_第1页
(应用统计学经济与管理中的数据分析)第二章统计数据的收集、整理与展示_第2页
(应用统计学经济与管理中的数据分析)第二章统计数据的收集、整理与展示_第3页
(应用统计学经济与管理中的数据分析)第二章统计数据的收集、整理与展示_第4页
(应用统计学经济与管理中的数据分析)第二章统计数据的收集、整理与展示_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、( (应用统计学经济与管理中的数据分析应用统计学经济与管理中的数据分析) )第二章统计数据的收集、整理与展示第二章统计数据的收集、整理与展示2第二章 统计数据的收集、整理与展示【本章导读及学习目标】【本章导读及学习目标】统计数据是统计研究的根底。为了保证统计数据统计数据是统计研究的根底。为了保证统计数据的客观、准确、可靠,统计数据的收集和整理就的客观、准确、可靠,统计数据的收集和整理就成为统计分析中尤其重要的环节。统计数据的收成为统计分析中尤其重要的环节。统计数据的收集和整理是依据统计分析的目的和要求,有组织集和整理是依据统计分析的目的和要求,有组织、有方案地收集资料,并对这些资料进行科学的、

2、有方案地收集资料,并对这些资料进行科学的处理,并用统计图表将整理后的数据加以展示的处理,并用统计图表将整理后的数据加以展示的过程。通过本章的学习,应掌握统计数据收集、过程。通过本章的学习,应掌握统计数据收集、整理和图表展示的方法,为进一步进行统计分析整理和图表展示的方法,为进一步进行统计分析奠定根底。奠定根底。3第一节第一节 统计资料的收集统计资料的收集统计数据的收集是根据统计研究预定的目的要求统计数据的收集是根据统计研究预定的目的要求和任务,运用抽样调查或实验的方法,有方案、和任务,运用抽样调查或实验的方法,有方案、有组织地收集数据资料的过程。统计数据的收集,有组织地收集数据资料的过程。统计

3、数据的收集,在整个统计研究过程中,担负着提供根底数据的在整个统计研究过程中,担负着提供根底数据的任务,是统计研究中的一个关键环节。任务,是统计研究中的一个关键环节。4一、统计数据的来源一、统计数据的来源(一一)统计数据的直接来源统计数据的直接来源(二二)统计数据的间接来源统计数据的间接来源(1) 准确性(2) 及时性(3) 全面性(4) 系统性5二、统计资料的收集方法二、统计资料的收集方法(一一)原始资料的收集方法原始资料的收集方法1. 直接观察法2. 报告法3. 登记法4. 访问法5. 实验法(二二)次级资料收集的方法次级资料收集的方法1. 直接引用法2. 参考文献查找法3. 检索工具查找法

4、6三、统计资料收集的技术工具三、统计资料收集的技术工具(一一)调查表调查表(1) 根据调查目的和要求,先拟订需要调查的工程根据调查目的和要求,先拟订需要调查的工程(标志或指标标志或指标)。一般应包括被调查者的根本情况,调查的主体内容和相关工程三一般应包括被调查者的根本情况,调查的主体内容和相关工程三个层面。个层面。(2) 根据调查工程的多少和使用要求,确定调查表的设计形式。根据调查工程的多少和使用要求,确定调查表的设计形式。(3) 列入调查表的工程,要求含义明确,能取得客观的资料。列入调查表的工程,要求含义明确,能取得客观的资料。(4) 列入调查表的工程应注意相互衔接和排列的逻辑性。列入调查表

5、的工程应注意相互衔接和排列的逻辑性。(5) 应编制必要的填表说明,其中包括对各个工程含义的解释、应编制必要的填表说明,其中包括对各个工程含义的解释、有关数字的计算方法,以及填写时应注意的事项等。有关数字的计算方法,以及填写时应注意的事项等。(二二)问卷问卷(1) 标题要概括,突出调查的主题。标题要概括,突出调查的主题。(2) 引言和注释应交代调查的目的,以求得被调查者的合作。引言和注释应交代调查的目的,以求得被调查者的合作。(3) 问题项要精练明确,表达调查的内容。问题项要精练明确,表达调查的内容。(4) 答案设计要注意准确,力求全面。答案设计要注意准确,力求全面。(5) 要防止诱导性提问,对

6、个人隐私问题不要涉及,问题的排列要防止诱导性提问,对个人隐私问题不要涉及,问题的排列要合理。一般先根本问题,后具体问题;先封闭性问题,后开放要合理。一般先根本问题,后具体问题;先封闭性问题,后开放性问题;先一般性问题,后敏感性问题。性问题;先一般性问题,后敏感性问题。7四、统计调查的组织方式四、统计调查的组织方式(一一)统计报表统计报表(二二)普查普查(1) 规定统一的标准时点,标准时点是指对被调查规定统一的标准时点,标准时点是指对被调查对象登记时所依据的统一时点。对象登记时所依据的统一时点。(2) 确定统一的普查期限。确定统一的普查期限。(3) 规定普查的工程和指标。规定普查的工程和指标。(

7、三三)重点调查重点调查(四四)典型调查典型调查(五五)抽样调查抽样调查(六六)网上调查网上调查8五、统计资料收集方案设计五、统计资料收集方案设计(一一)确定调查的目的和内容确定调查的目的和内容(二二)确定调查对象、调查单位和填报单位确定调查对象、调查单位和填报单位(1) 调查对象确实定。调查对象确实定。(2) 调查单位确实定。调查单位确实定。(3) 填报单位确实定。填报单位确实定。(三三)确定调查工程,拟定调查表和问卷确定调查工程,拟定调查表和问卷(四四)确定调查的方式和方法确定调查的方式和方法(1) 调查方式确实定。调查方式确实定。(2) 调查单位数目确实定。调查单位数目确实定。(3) 调查

8、方法确实定。调查方法确实定。(五五)确定调查的时间和期限确定调查的时间和期限(1) 确定调查时间。确定调查时间。(2) 确定调查期限。确定调查期限。(六六)制订调查的组织实施方案制订调查的组织实施方案9第二节第二节 统计数据的整理统计数据的整理统计整理是根据统计研究的需要,对统计调查获得统计整理是根据统计研究的需要,对统计调查获得的原始资料进行分类、汇总列表,或对次级资料进的原始资料进行分类、汇总列表,或对次级资料进行再加工的工作过程。一般来说,收集得到的统计行再加工的工作过程。一般来说,收集得到的统计资料反映的是个体的信息,不能反映总体的综合数资料反映的是个体的信息,不能反映总体的综合数量特

9、征。统计数据整理的任务就在于把调查收集到量特征。统计数据整理的任务就在于把调查收集到的、大量的、反映总体单位特征的个体资料,进行的、大量的、反映总体单位特征的个体资料,进行科学的加工和综合汇总,使之系统化、条理化,得科学的加工和综合汇总,使之系统化、条理化,得出能够反映现象总体特征及其开展规律的综合性资出能够反映现象总体特征及其开展规律的综合性资料并以简明的方式加以表达。一般来说,统计数据料并以简明的方式加以表达。一般来说,统计数据整理的内容主要包括统计资料的审核、统计资料的整理的内容主要包括统计资料的审核、统计资料的分组和汇总、编制统计表或绘制统计图。分组和汇总、编制统计表或绘制统计图。10

10、一、统计数据的审核一、统计数据的审核统计数据收集以后,首先需要进行审核,以保证统计数据的质量,为进统计数据收集以后,首先需要进行审核,以保证统计数据的质量,为进一步的数据整理打下根底。从不同渠道取得的统计数据,在审核内容和一步的数据整理打下根底。从不同渠道取得的统计数据,在审核内容和方法上都有所不同。方法上都有所不同。对于通过直接调查取得的原始数据主要应从完整性和准确性两个方面去对于通过直接调查取得的原始数据主要应从完整性和准确性两个方面去审核。完整性的审核主要是检查被调查的对象是否有遗漏,所有的调查审核。完整性的审核主要是检查被调查的对象是否有遗漏,所有的调查工程或指标是否填写齐全。准确性审

11、查的内容主要包括两个方面:一是工程或指标是否填写齐全。准确性审查的内容主要包括两个方面:一是检查数据资料是否真实地反映了调查对象的客观实际情况,内容是否符检查数据资料是否真实地反映了调查对象的客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确。准确性审查方法主合实际;二是检查数据是否有错误,计算是否正确。准确性审查方法主要有逻辑检查要有逻辑检查(定性定性)和计算检查和计算检查(定量定量)。对于通过其他途径取得的二手资料,除了对其完整性和准确性进行审核对于通过其他途径取得的二手资料,除了对其完整性和准确性进行审核外,应着重审核数据的适应性和时效性。作为使用者来说,首先应清楚外,

12、应着重审核数据的适应性和时效性。作为使用者来说,首先应清楚数据的来源、数据的口径以及有关的背景资料,弄清楚收集得到的数据数据的来源、数据的口径以及有关的背景资料,弄清楚收集得到的数据是否适合自己的研究需要,是否需要重新进行加工整理等。此外,还要是否适合自己的研究需要,是否需要重新进行加工整理等。此外,还要对数据的时效性进行审核,尽可能使用最新的统计数据,否那么可能失对数据的时效性进行审核,尽可能使用最新的统计数据,否那么可能失去研究的意义去研究的意义11二、统计分组二、统计分组(一一)统计分组的概念统计分组的概念(二二)统计分组的种类统计分组的种类1. 按分组标志的多少,可分为简单分组与分组体

13、系(1) 简单分组(2) 分组体系 平行分组体系平行分组体系 复合分组体系复合分组体系2. 按分组标志的性质不同,可分为品质标志分组和数量标志分组(1) 品质标志分组(2) 数量标志分组12二、统计分组二、统计分组(三三)统计分组的方法统计分组的方法1. 品质标志分组方法2. 数量标志分组方法(1) 单变量值分组(2) 变量值组距分组 间断组距式分组和连续组距式分组间断组距式分组和连续组距式分组 等距组距式分组和异距组距式分组等距组距式分组和异距组距式分组13三、频数分布三、频数分布(一一)频数分布的根本概念频数分布的根本概念(二二)频数分布数列的编制频数分布数列的编制1. 品质变量分布数列品

14、质变量分布数列2. 数量变量分布数列数量变量分布数列(三三)累积频数累积频数(频率频率)分布分布1. 品质变量累积频数品质变量累积频数(频率频率)分布分布2. 数量变量累积频数数量变量累积频数(频率频率)分布分布14第三节第三节 统计表与统计图统计表与统计图统计数据经过收集和整理后,可以用直观的统计数据经过收集和整理后,可以用直观的形式展示出来,常用的形式有统计表和统计形式展示出来,常用的形式有统计表和统计图两种。图两种。15一、统计表一、统计表(一一)统计表的构成统计表的构成(二二)统计表的设计原那么统计表的设计原那么(1) 合理安排统计表的结构。合理安排统计表的结构。(2) 表头一般包括表

15、号、总标题和表中数据的表头一般包括表号、总标题和表中数据的单位。单位。(3) 表中的上下两道横线一般用粗线,中间的表中的上下两道横线一般用粗线,中间的其他线应用细线,使人看来清楚、醒目。其他线应用细线,使人看来清楚、醒目。16二、统计图二、统计图统计图统计图(statistical chart)是在统计表的根底上,用是在统计表的根底上,用几何图形或具体形象来表述统计资料的一种方法。几何图形或具体形象来表述统计资料的一种方法。 统计图可以直观地展示统计表中枯燥的数据,使数统计图可以直观地展示统计表中枯燥的数据,使数据资料形象化,帮助我们从众多的数据中发现规律据资料形象化,帮助我们从众多的数据中发

16、现规律,更迅速、更有效地传递信息。因而,绘制统计图,更迅速、更有效地传递信息。因而,绘制统计图是统计整理的重要内容之一。是统计整理的重要内容之一。统计图一般由图标题、坐标轴、绘图区、图例等几统计图一般由图标题、坐标轴、绘图区、图例等几个局部组成。个局部组成。统计图的种类,按其形式大体上可分为以下三类。统计图的种类,按其形式大体上可分为以下三类。(1) 几何图。几何图。(2) 象形图。象形图。(3) 统计地图。统计地图。17第四节第四节 品质数据的图形展示品质数据的图形展示一、条形图一、条形图条形图条形图(bar chart)或柱形图或柱形图(column chart)是以一是以一簇宽度相等、相

17、互别离的条状图形的长度簇宽度相等、相互别离的条状图形的长度(或高度或高度)来表示频数分布的统计图。绘制时,将各类别放在来表示频数分布的统计图。绘制时,将各类别放在纵轴时,称为条形图;将各类别放在横轴时,称为纵轴时,称为条形图;将各类别放在横轴时,称为柱形图。条形图适用于定类尺度和定序尺度计量的柱形图。条形图适用于定类尺度和定序尺度计量的数据。数据。条形图可根据表现资料的内容不同,分为单式条形条形图可根据表现资料的内容不同,分为单式条形图和复式条形图。以例图和复式条形图。以例2-2中的表中的表2-1数据为例,绘数据为例,绘制的单式条形图、复式条形图分别如图制的单式条形图、复式条形图分别如图2-2

18、和图和图2-3所示。所示。18一、条形图从图2-2中可以看出,样本中对A香型香水的偏好人数最多,有124人;从图2-3可以看出,3个年龄组对A香型香水的偏好高于其他4种香型;5种香型按不同的年龄组进行同类型比较,其中对A和E香型的香水,青年人的偏好要高于老年人和中年人,而对B和D香型的香水,中年人的偏好要高于老年人和青年人。条形图或柱形图还可用于单变量数据分组数列的图示,可以将每个变量的取值定义为一个类。例2-3中某种型号的三极管批不合格品数分布数列绘制的柱形图如图2-4所示。从图2-4可以看出,该种型号的三极管检查的500批中不合格品数为1、2的居多。19二、饼图二、饼图饼图饼图(pie c

19、hart)也称为圆形图,是以圆形以及圆内扇形的面积来描述数也称为圆形图,是以圆形以及圆内扇形的面积来描述数值大小的图形。饼图通常用来描述在各个类中的测量值分别在总数中所值大小的图形。饼图通常用来描述在各个类中的测量值分别在总数中所占的比率,对于研究结构性问题相当有用,适用于定类尺度和定序尺度占的比率,对于研究结构性问题相当有用,适用于定类尺度和定序尺度计量的数据。计量的数据。在绘制饼图时,各个类别所占的比率用圆内的各个扇形面积描述,其中在绘制饼图时,各个类别所占的比率用圆内的各个扇形面积描述,其中心角按各扇形百分比占心角按各扇形百分比占360的相应比例来确定。的相应比例来确定。在例在例2-2中

20、,偏好香型中,偏好香型A的消费者占总调查人数的的消费者占总调查人数的62%,那么其扇形面积,那么其扇形面积的中心角应该为的中心角应该为360,其余各项以此类推。根据表,其余各项以此类推。根据表2-1中的数据绘制的中的数据绘制的饼图如图饼图如图2-5所示。所示。20三、累积频数三、累积频数(频率频率)分布图分布图对于定序尺度计量的品质数据除了可以用条形图和对于定序尺度计量的品质数据除了可以用条形图和饼图进行展示外,还可以用累积频数饼图进行展示外,还可以用累积频数(频率频率)分布图分布图进行展示。累积频数进行展示。累积频数(频率频率)分布图是根据累积频数分布图是根据累积频数或累积频率绘制的,可以反

21、映各顺序排序的类别的或累积频率绘制的,可以反映各顺序排序的类别的频数逐级累加的结果,具有明显的统计意义。频数逐级累加的结果,具有明显的统计意义。我们将例我们将例2-5中表中表2-6的累积统计结果绘制成累积频的累积统计结果绘制成累积频率折线图,如图率折线图,如图2-6所示。所示。21第五节第五节 数量数据的图形展示数量数据的图形展示一、直方图一、直方图直方图直方图(histogram),是用一系列宽度相等、高度,是用一系列宽度相等、高度不等的矩形表示数据分布的图。矩形的宽度表示数不等的矩形表示数据分布的图。矩形的宽度表示数据范围的间隔,矩形的高度表示在给定间隔内数据据范围的间隔,矩形的高度表示在

22、给定间隔内数据出现的次数出现的次数(频数频数)。对于等距分组数列可以直接根。对于等距分组数列可以直接根据频数或频率作出直方图;而对于异距分组数列,据频数或频率作出直方图;而对于异距分组数列,要计算出频数密度或频率密度,并将其作为纵轴,要计算出频数密度或频率密度,并将其作为纵轴,即可作出直方图,这样便于观察比较。即可作出直方图,这样便于观察比较。直方图与柱形图不同。首先,柱形图用宽度表示类直方图与柱形图不同。首先,柱形图用宽度表示类别,且宽度都相等,而直方图用宽度表示组距,宽别,且宽度都相等,而直方图用宽度表示组距,宽度可以不相等。其次,柱形图是分开排列的,而由度可以不相等。其次,柱形图是分开排

23、列的,而由于分组数据具有连续性,直方图是连续排列的。最于分组数据具有连续性,直方图是连续排列的。最后,柱形图主要用于表示品质变量分组数列和单变后,柱形图主要用于表示品质变量分组数列和单变量数量分组数列,而直方图主要用于表示组距数量量数量分组数列,而直方图主要用于表示组距数量分组数列。分组数列。22二、折线图二、折线图折线图折线图(polygon)也称为频数多边形图,它是在直方图的根底上,用线也称为频数多边形图,它是在直方图的根底上,用线段顺次连接各个矩形顶部的中点,并延伸到在直方图左右两侧的位于横段顺次连接各个矩形顶部的中点,并延伸到在直方图左右两侧的位于横轴的假想组中值,使线段与横轴相交所形

24、成的图形。轴的假想组中值,使线段与横轴相交所形成的图形。以例以例2-3为例说明折线图的绘制方法。首先,在表为例说明折线图的绘制方法。首先,在表2-5的根底上,计算延的根底上,计算延伸到在直方图左右两侧的位于横轴的伸到在直方图左右两侧的位于横轴的2个假想点的坐标数据,得到表个假想点的坐标数据,得到表2-9的数据。然后,根据表的数据。然后,根据表2-9中的第中的第(3)和和(5)列数据绘制列数据绘制50个灯泡耐用时数个灯泡耐用时数的频数分布直方图和折线图,如图的频数分布直方图和折线图,如图2-8所示。所示。23二、折线图二、折线图24三、累积折线图三、累积折线图25三、累积折线图三、累积折线图26

25、四、茎叶图四、茎叶图前面讨论的直方图和折线图都是根据分组数据或频数分布绘制的,对于前面讨论的直方图和折线图都是根据分组数据或频数分布绘制的,对于未分组的原始数据可以用茎叶图来观察频数分布。茎叶图未分组的原始数据可以用茎叶图来观察频数分布。茎叶图(stem-and-leaf display)又称枝叶图,顾名思义,是由又称枝叶图,顾名思义,是由“茎和茎和“叶组成的,它把叶组成的,它把每个数据分解成每个数据分解成“茎和茎和“叶两个局部,高位数字为茎,低位数字为叶叶两个局部,高位数字为茎,低位数字为叶;茎数字按列排列,叶数字按行排列。;茎数字按列排列,叶数字按行排列。绘制茎叶图的步骤:决定茎和叶如何规

26、定;将茎按由小到大的顺序绘制茎叶图的步骤:决定茎和叶如何规定;将茎按由小到大的顺序排成一列;将数据集中每个观察值置于相应的茎内。排成一列;将数据集中每个观察值置于相应的茎内。茎叶图的优点:将统计分组和频数分布两项工作一次完成,图形直观茎叶图的优点:将统计分组和频数分布两项工作一次完成,图形直观且保存了原始数据的全部信息,均值、中位数和众数均可依据原始信息且保存了原始数据的全部信息,均值、中位数和众数均可依据原始信息方便地计算出来;从茎叶图可以看出数据的分布形状以及数据的离散方便地计算出来;从茎叶图可以看出数据的分布形状以及数据的离散状况,比方,分布是否对称,数据是否集中,是否有极端值等。茎叶图

27、状况,比方,分布是否对称,数据是否集中,是否有极端值等。茎叶图的缺点:茎叶图在茎的选择上有时灵活性不够。的缺点:茎叶图在茎的选择上有时灵活性不够。27五、频数五、频数(频率频率)分布曲线分布曲线(一一)钟形分布钟形分布(1) 对称分布(2) 偏斜分布(二二)U形分布形分布(三三)J形分布形分布28第六节第六节 统计软件的应用统计软件的应用一、品质数据的图形展示一、品质数据的图形展示(一)条形图1. 单式条形图2. 复式条形图(二)饼图29二、数量数据的图形展示二、数量数据的图形展示(一一)频数分布表与直方图频数分布表与直方图(二二)折线图折线图(三三)累积折线图累积折线图(四四)茎叶图茎叶图3

28、0本本 章章 小小 结结(1) 统计数据的来源渠道分为直接来源渠道和间接来源渠道。原始资料统计数据的来源渠道分为直接来源渠道和间接来源渠道。原始资料的收集方法有直接观察法、报告法、登记法、访问法和实验法;次级资的收集方法有直接观察法、报告法、登记法、访问法和实验法;次级资料收集的方法有直接引用法、参考文献查找法和检索工具查找法。调查料收集的方法有直接引用法、参考文献查找法和检索工具查找法。调查表和问卷是统计资料收集的重要技术工具。表和问卷是统计资料收集的重要技术工具。(2) 统计调查按组织方式可分为统计报表和专门调查两种,其中专门调统计调查按组织方式可分为统计报表和专门调查两种,其中专门调查又包括普查、重点调查、抽样调查、典型调查、网上调查。查又包括普查、重点调查、抽样调查、典型调查、网上调查。(3) 统计调查方案设计包括:确定调查的目的和内容;确定调查对象、统计调查方案设计包括:确定调查的目的和内容;确定调查对象、调查单位和填报单位;确定调查工程,拟

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论