版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
社会统计学任课教师:徐依婷578012689@教材:中央广播电视大学出版社,陈卫社会统计学任课教师:徐依婷578012689@qq
第三章数据的组织与展示第三章数据的组织与展示学习目标:
1、了解数据的筛选与排序,掌握使用SPSS进行数据的筛选与排序
2、了解常用统计图和统计表,明确不同统计图和统计表适用的数据类型。
3、能使用SPSS绘制统计图表。
学习目标:
1、了解数据的筛选与排序,掌握使用SPSS进行统计数据的整理:
是对统计数据的加工处理过程,以使统计数据系统化、条理化、符合统计分析的需要,它是收集数据与数据分析之间的必要环节。收集数据数据分析↑数据整理统计数据的整理:
是对统计数据的加工处理过程,以使统计数据第一节数据的整理
一、数据整理
数据整理是使用数据之前对数据进行必要的处理,包括数据的审核、筛选和排序等。这样可以保证数据的质量,并且选择符合研究要求的数据,为数据的使用与分析打下坚实的基础。(一)数据审核
数据审核是指从数据的完整性、准确性、适用性及时效性等方面对数据进行检查,保障数据质量,为之后进一步的分析打下基础。数据审核数据筛选
数据排序123第一节数据的整理
一、数据整理(一)数数据审核:完整、准确、适用、时效完整性:数据是否完整、调查单位是否全面覆盖、调查项目问题是否全部回答。总体不漏人,个体不漏项准确性:数据是否真实、准确,数据是否真实反映实际情况,数据是否有误。适用性:审核数据的来源、口径、背景等是否符合研究需要,若不符合研究需要则不应该生搬硬套。时效性:审核数据是否滞后、是否具有研究意义。数据审核:完整、准确、适用、时效完整性:数据是否完整、调查单对于原始数据,只需要从完整性和准确性两方面进行审核。对于二手数据,不仅需要。。。还需要进行适用性和时效性审核。
(二)数据筛选
数据筛选是指将不符合要求的数据或者有明显错误的数据剔除掉,或者将某些不符合研究需要的数据剔除掉,只留下符合需要的数据。数据经过筛选后使其结果符合研究需要,为以后研究打下良好基础。
对于原始数据,只需要从完整性和准确性两方面进行审核。对于二手(三)数据排序
数据排序是指按照一定顺序对数据进行排列,为数据分组、分析数据提供方便。
不同数据的排序标准不同。对于分类数据,排序方式多种多样,可以按照字母顺序进行排序,如按姓氏首字母对姓名进行排序,也可以按照姓氏笔画进行排序;而对于数值型数据,则只有递增和递减两种排序方式,如按照收入从高到低对某类人进行排序,也可以从低到高排序。(三)数据排序
数据排序是指按照一定顺序对数据进行二、数据分组
针对数值型数据
数据分组就是根据研究需要,按照某种标准将原始数据分为不同的组,分组后的数据叫做分组数据。包括单变量分组和组距分组,其中组距分组又包括等距分组和不等距分组两类。
(一)单变量分组
在分组时将每一个变量作为一组。
只适合离散变量。例如,将妇女生育数0,1,2,3,4,5,6,7,8...分别分组。二、数据分组
针对数值型数据
数据分组就是根据(二)组距分组(重点)
组距分组是指将全部变量值按照次序划分为多个区间,每一区间里的值作为一组。
组距分组适合连续变量且数据较多的情况。
上限值:每一组最大的值
下限值:每一组最小的值
组距:上限值-下限值
操作步骤:1、对数据进行排序
2、确定分组数。K=1+lgn/lg2(其中n为数据总个数)
3、确定组距。组距=(最大值-最小值)/组数(二)组距分组(重点)
组距分组是指将全部变量值按照次序划分(二)组距分组原则
不重不漏:一个数据必须属于且仅属于一组,不能重复出现,也不能遗漏。
上限值不在组内:当相邻两组的上限值与下限值重叠时,恰好等于某一组上限值的变量值不放在该组内,而放在下一组。
当存在极端值,使得最大值和最小值相差悬殊时,我们可以将第一组改为“XX以下”,或将最后一组改为“XX以上”,避免遗漏。(二)组距分组原则
不重不漏:一个数据必须属于且仅属于一(三)等距分组和不等距分组
在分组时,如果各组组距相等,则称为等距分组;
如果各组组距不相等,则称为不等距分组。
不等距分组eg:婴幼儿组(0~6岁)
少年儿童组(7~17岁)
中青年组(18~59岁)
老年人组(60岁及以上)(三)等距分组和不等距分组
在分组时,如果各组组距相等,三、应用SPSS对数据进行整理与分组
1、排序
点击Date→SortCases
指定需要进行排序的变量到Sortby框中,同时在SortOrder中选择是升序排列还是降序排列。
升序:Ascending
降序:Descending
三、应用SPSS对数据进行整理与分组
1、排序
点击Da电大社会统计学第三章数据的组织与展示三、应用SPSS对数据进行整理与分组
2、筛选
点击Date→SelectCases然后选择何种方式筛选个案。
ifconditionissatisfied是根据某特定条件选择个案randomsampleofcase是随机选取个案
然后指定未选中个案的处理方式。
filteroutunselectedcases表示在那些未选中的个案号码上做一个/标记;deleteunselectedcases表示删除未选中的个案;copyselectedtoanewdetaset表示将选中的个案复制为一个新文件。三、应用SPSS对数据进行整理与分组
2、筛选
点击Da电大社会统计学第三章数据的组织与展示三、应用SPSS对数据进行整理与分组
3、分组
相当于变量的重新编码。首先选中要赋值的变量,点击箭头进入它右边的空白框中。在OutputVariable下面的NameandLabel框中填写要新生成的变量的名称和标签,点击change按钮,则对中间的新旧变量名配对,然后点击OldandNewValue进行变量的重新赋值,赋值完毕之后点击OK即可。操作示范三、应用SPSS对数据进行整理与分组
3、分组
相当于变第二节频数分布表
(一)相关概念
1、频数频数就是某个类别或某个小组中的数据个数,也称次数。例如根据测试成绩,将学生分为优、良、及格、不及格四个组,如果18个同学为优,那么这组的频数就是18。
2、频率或比例频率就是一个总体(或者样本中),某一类别或某一小组中数据个数(即频数)占总数据个数的比重,也称为比例。例如根据测试成绩,将100个学生分为优、良、及格、不及格四个组,如果四个组人数分别为18、52、21、9,那么四个组的频率分别为0.18、0.52、0.21、0.09。比例通常用于反应总体的构成情况,一个数据中各部分比例之和为1。第二节频数分布表
(一)相关概念第二节频数分布表
(一)相关概念
3、百分比
百分比就是一个总体中某一类别或某一小组中数据个数(频数)占总体数据的比重乘以100,各个小组百分比之和为100,即频率乘以100。它是将对比的基数抽象为100而计算出来的,用%号表示,数值表示每100个分母中包含多少个分子。上面例子中,优、良、及格、不及格四个组的百分比分别为18%、52%、21%、9%。
4、比率
比率就是各个不同类别或小组的数值之间的比值。例如,上面例子中,优与良的比率为18/52≈0.35。
第二节频数分布表
(一)相关概念频数分布表频数分布表是各类别及其对应的频数形成的分布。表某专业一年级学生平均上网时间的频数分布频数分布表频数分布表是各类别及其对应的频数形成的分布。二、累积频数和累积频率
(一)相关概念
1、累积频数
累积频数就是将各类别或组的频数逐级累加起来,这样可以很清楚的看出某一类别或组以上或以下的频数之和。
2、累积频率或累积百分比
累积频率就是将各类别或组的频率逐级累加起来,这样可以很清楚的看出某一类别或组以上或以下的频率之和。二、累积频数和累积频率
(一)相关概念二、累积频数和累积频率
(二)累积方法
1、向上累积从开始一方向最后一方逐级累加,从最小值开始向最大值方向逐级累加
2、累积频率或累积百分比从最后一方向开始一方逐级累加,从最大值开始向最小值方向逐级累加二、累积频数和累积频率
(二)累积方法小大举例说明
小大举例说明
三、利用SPSS制作频数分布表
具体步骤:Analyze→DescriptiveStatistics→Frequencies→Frequencytables就可输出频数分布表。三、利用SPSS制作频数分布表
具体步骤电大社会统计学第三章数据的组织与展示电大社会统计学第三章数据的组织与展示电大社会统计学第三章数据的组织与展示电大社会统计学第三章数据的组织与展示电大社会统计学第三章数据的组织与展示第三节统计图
一、条形图(barchart)用宽度相同的条形的高度或者长度来表示数据多少的图形。适合定类数据、定序数据或者数值型数据ouke第三节统计图
一、条形图(barchart第三节统计图
二、饼图(piechart)用圆形以及圆内扇形的角度来表示数值大小。主要反映总体的构成问题第三节统计图
二、饼图(piechart)第三节统计图
三、环形图(annualchart)空心圆它用环上的一段来表示总体或者样本中的各部分数据第三节统计图
三、环形图(annualch饼图与环形图的区别1、饼图是实心圆,是用圆内扇形的角度来表示总体或者样本中的某一部分。环形图中间有一个洞,是空心圆,是用环形上的一段来表示总体或者样本中的某一部分。2、饼图每次只能显示一个总体或者样本中各部分所占的比例。环形图则可以同时显示多个总体或样本中各部分的比例,更有利于进行比较研究。3、饼图和环形图更适用于结构分析,环形图更适用于多个总体或样本数据的展示。饼图与环形图的区别1、饼图是实心圆,是用圆内扇形的角度来表示第三节统计图
四、直方图(histogram)用矩形的宽度和高度来表示频数分布。即用矩形的面积表示频数的分布。第三节统计图
四、直方图(histogram直方图与条形图的区别直方图与条形图的区别第三节统计图
五、折线图(frequencypolygon)以直方图为基础,把直方图顶部的中点用直线依次连接起来,然后把原来的直方图抹掉后得到的图形。第三节统计图
五、折线图(frequency第三节统计图
六、线图(lineplot)在平面直角坐标系中用折线表示数量随着时间而变化的趋势和特征的图形。适用于时间序列数据,即数据是在不同时点上取得的。第三节统计图
六、线图(lineplot)
具体步骤:Analyze→DescriptiveStatistics→Frequencies→五、利用SPSS作图具体步骤:Analyze→Descriptive本章小结
1、数据整理:审核、筛选和排序。2、组距分组
(1)对数据进行排序(2)确定分组数。K=1+lgn/lg2(其中n为数据总个数)(3)确定组距=(最大值-最小值)/组数3、应用SPSS对数据进行排序、筛选、分组、制作频数分布表4、条形图、饼图、环形图、直方图、折线图、线图本章小结
1、数据整理:审核、筛选和排序。谢谢观看!谢谢观看!社会统计学任课教师:徐依婷578012689@教材:中央广播电视大学出版社,陈卫社会统计学任课教师:徐依婷578012689@qq
第三章数据的组织与展示第三章数据的组织与展示学习目标:
1、了解数据的筛选与排序,掌握使用SPSS进行数据的筛选与排序
2、了解常用统计图和统计表,明确不同统计图和统计表适用的数据类型。
3、能使用SPSS绘制统计图表。
学习目标:
1、了解数据的筛选与排序,掌握使用SPSS进行统计数据的整理:
是对统计数据的加工处理过程,以使统计数据系统化、条理化、符合统计分析的需要,它是收集数据与数据分析之间的必要环节。收集数据数据分析↑数据整理统计数据的整理:
是对统计数据的加工处理过程,以使统计数据第一节数据的整理
一、数据整理
数据整理是使用数据之前对数据进行必要的处理,包括数据的审核、筛选和排序等。这样可以保证数据的质量,并且选择符合研究要求的数据,为数据的使用与分析打下坚实的基础。(一)数据审核
数据审核是指从数据的完整性、准确性、适用性及时效性等方面对数据进行检查,保障数据质量,为之后进一步的分析打下基础。数据审核数据筛选
数据排序123第一节数据的整理
一、数据整理(一)数数据审核:完整、准确、适用、时效完整性:数据是否完整、调查单位是否全面覆盖、调查项目问题是否全部回答。总体不漏人,个体不漏项准确性:数据是否真实、准确,数据是否真实反映实际情况,数据是否有误。适用性:审核数据的来源、口径、背景等是否符合研究需要,若不符合研究需要则不应该生搬硬套。时效性:审核数据是否滞后、是否具有研究意义。数据审核:完整、准确、适用、时效完整性:数据是否完整、调查单对于原始数据,只需要从完整性和准确性两方面进行审核。对于二手数据,不仅需要。。。还需要进行适用性和时效性审核。
(二)数据筛选
数据筛选是指将不符合要求的数据或者有明显错误的数据剔除掉,或者将某些不符合研究需要的数据剔除掉,只留下符合需要的数据。数据经过筛选后使其结果符合研究需要,为以后研究打下良好基础。
对于原始数据,只需要从完整性和准确性两方面进行审核。对于二手(三)数据排序
数据排序是指按照一定顺序对数据进行排列,为数据分组、分析数据提供方便。
不同数据的排序标准不同。对于分类数据,排序方式多种多样,可以按照字母顺序进行排序,如按姓氏首字母对姓名进行排序,也可以按照姓氏笔画进行排序;而对于数值型数据,则只有递增和递减两种排序方式,如按照收入从高到低对某类人进行排序,也可以从低到高排序。(三)数据排序
数据排序是指按照一定顺序对数据进行二、数据分组
针对数值型数据
数据分组就是根据研究需要,按照某种标准将原始数据分为不同的组,分组后的数据叫做分组数据。包括单变量分组和组距分组,其中组距分组又包括等距分组和不等距分组两类。
(一)单变量分组
在分组时将每一个变量作为一组。
只适合离散变量。例如,将妇女生育数0,1,2,3,4,5,6,7,8...分别分组。二、数据分组
针对数值型数据
数据分组就是根据(二)组距分组(重点)
组距分组是指将全部变量值按照次序划分为多个区间,每一区间里的值作为一组。
组距分组适合连续变量且数据较多的情况。
上限值:每一组最大的值
下限值:每一组最小的值
组距:上限值-下限值
操作步骤:1、对数据进行排序
2、确定分组数。K=1+lgn/lg2(其中n为数据总个数)
3、确定组距。组距=(最大值-最小值)/组数(二)组距分组(重点)
组距分组是指将全部变量值按照次序划分(二)组距分组原则
不重不漏:一个数据必须属于且仅属于一组,不能重复出现,也不能遗漏。
上限值不在组内:当相邻两组的上限值与下限值重叠时,恰好等于某一组上限值的变量值不放在该组内,而放在下一组。
当存在极端值,使得最大值和最小值相差悬殊时,我们可以将第一组改为“XX以下”,或将最后一组改为“XX以上”,避免遗漏。(二)组距分组原则
不重不漏:一个数据必须属于且仅属于一(三)等距分组和不等距分组
在分组时,如果各组组距相等,则称为等距分组;
如果各组组距不相等,则称为不等距分组。
不等距分组eg:婴幼儿组(0~6岁)
少年儿童组(7~17岁)
中青年组(18~59岁)
老年人组(60岁及以上)(三)等距分组和不等距分组
在分组时,如果各组组距相等,三、应用SPSS对数据进行整理与分组
1、排序
点击Date→SortCases
指定需要进行排序的变量到Sortby框中,同时在SortOrder中选择是升序排列还是降序排列。
升序:Ascending
降序:Descending
三、应用SPSS对数据进行整理与分组
1、排序
点击Da电大社会统计学第三章数据的组织与展示三、应用SPSS对数据进行整理与分组
2、筛选
点击Date→SelectCases然后选择何种方式筛选个案。
ifconditionissatisfied是根据某特定条件选择个案randomsampleofcase是随机选取个案
然后指定未选中个案的处理方式。
filteroutunselectedcases表示在那些未选中的个案号码上做一个/标记;deleteunselectedcases表示删除未选中的个案;copyselectedtoanewdetaset表示将选中的个案复制为一个新文件。三、应用SPSS对数据进行整理与分组
2、筛选
点击Da电大社会统计学第三章数据的组织与展示三、应用SPSS对数据进行整理与分组
3、分组
相当于变量的重新编码。首先选中要赋值的变量,点击箭头进入它右边的空白框中。在OutputVariable下面的NameandLabel框中填写要新生成的变量的名称和标签,点击change按钮,则对中间的新旧变量名配对,然后点击OldandNewValue进行变量的重新赋值,赋值完毕之后点击OK即可。操作示范三、应用SPSS对数据进行整理与分组
3、分组
相当于变第二节频数分布表
(一)相关概念
1、频数频数就是某个类别或某个小组中的数据个数,也称次数。例如根据测试成绩,将学生分为优、良、及格、不及格四个组,如果18个同学为优,那么这组的频数就是18。
2、频率或比例频率就是一个总体(或者样本中),某一类别或某一小组中数据个数(即频数)占总数据个数的比重,也称为比例。例如根据测试成绩,将100个学生分为优、良、及格、不及格四个组,如果四个组人数分别为18、52、21、9,那么四个组的频率分别为0.18、0.52、0.21、0.09。比例通常用于反应总体的构成情况,一个数据中各部分比例之和为1。第二节频数分布表
(一)相关概念第二节频数分布表
(一)相关概念
3、百分比
百分比就是一个总体中某一类别或某一小组中数据个数(频数)占总体数据的比重乘以100,各个小组百分比之和为100,即频率乘以100。它是将对比的基数抽象为100而计算出来的,用%号表示,数值表示每100个分母中包含多少个分子。上面例子中,优、良、及格、不及格四个组的百分比分别为18%、52%、21%、9%。
4、比率
比率就是各个不同类别或小组的数值之间的比值。例如,上面例子中,优与良的比率为18/52≈0.35。
第二节频数分布表
(一)相关概念频数分布表频数分布表是各类别及其对应的频数形成的分布。表某专业一年级学生平均上网时间的频数分布频数分布表频数分布表是各类别及其对应的频数形成的分布。二、累积频数和累积频率
(一)相关概念
1、累积频数
累积频数就是将各类别或组的频数逐级累加起来,这样可以很清楚的看出某一类别或组以上或以下的频数之和。
2、累积频率或累积百分比
累积频率就是将各类别或组的频率逐级累加起来,这样可以很清楚的看出某一类别或组以上或以下的频率之和。二、累积频数和累积频率
(一)相关概念二、累积频数和累积频率
(二)累积方法
1、向上累积从开始一方向最后一方逐级累加,从最小值开始向最大值方向逐级累加
2、累积频率或累积百分比从最后一方向开始一方逐级累加,从最大值开始向最小值方向逐级累加二、累积频数和累积频率
(二)累积方法小大举例说明
小大举例说明
三、利用SPSS制作频数分布表
具体步骤:Analyze→DescriptiveStatistics→Frequencies→Frequencytables就可输出频数分布表。三、利用SPSS制作频数分布表
具体步骤电大社会统计学第三章数据的组织与展示电大社会统计学第三章数据的组织与展示电大社会统计学第三章数据的组织与展示电大社会统计学第三章数据的组织与展示电大社会统计学第三章数据的组织与展示第三节统计图
一、条形图(barchart)用宽度相同的条形的高度或者长度来表示数据多少的图形。适合定类数据、定序数据或者数值型数据ouke第三节统计图
一、条形图(barchart第三节统计图
二、饼图(piech
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 课题申报书:反常亚扩散在保险与金融中的应用
- 课题申报书:俄苏中亚历史地理学史研究
- 13《湖中心亭看雪》公开课一等奖创新教学设计
- 上海闵行职业技术学院《基础教育改革研究》2023-2024学年第一学期期末试卷
- 上海旅游高等专科学校《现代通信系统》2023-2024学年第一学期期末试卷
- 上海立信会计金融学院《康复护理学》2023-2024学年第一学期期末试卷
- 上海科学技术职业学院《高分子材料助剂与配方设计》2023-2024学年第一学期期末试卷
- 4.1+光的直线+教学课件+2024-2025学年人教版物理八年级上册+
- 上海交通大学《环境仪器分析》2023-2024学年第一学期期末试卷
- 历史与社会:人教版九年级第五单元第一课第三框《西欧的复兴与联合》教学实录
- GB/T 14124-1993机械振动与冲击对建筑物振动影响的测量和评价基本方法及使用导则
- GB/T 10325-2001定形耐火制品抽样验收规则
- GB/T 10069.3-2008旋转电机噪声测定方法及限值第3部分:噪声限值
- FZ/T 90097-2017染整机械轧车线压力
- 《汤姆·索亚历险记》汤姆·索亚刷墙的精彩片段市赛获奖
- 武汉大学2023年824法学基础B考研真题(回忆版)
- 新概念英语第二册单词表(打印版)
- 学生篮球考核标准
- 未来社区综合解决方案:打造社区全生活链服务构建未来社区全业态
- 账号租赁合同
- 抗震支架施工方法
评论
0/150
提交评论