版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于描述性统计分析第1页,共59页,2022年,5月20日,23点4分,星期四本章学习目标:掌握数据分析项目的整个过程;掌握数据的分类方法;掌握对数据进行描述的图形化方法和数值方法;学习分析数据分布的方法;掌握应用SPSS进行描述性数据分析的方法;掌握常用统计图形的绘制方法和解释技巧
第2页,共59页,2022年,5月20日,23点4分,星期四前言:描述性统计和推断性统计统计学分为描述性统计分析和推断性统计分析描述性统计应用分类、制表、图形以及概括性数据指标来概括数据分布特征的方法。结论不能推及总体。
推断性统计推断性统计分析得到的结论适用于总体。第3页,共59页,2022年,5月20日,23点4分,星期四统计量统计分析往往是从了解数据的基本特征开始的。统计上,需要把样本数据所含信息进行概括、融合和抽象,从而得到反映样本数据的综合指标,这些指标称为统计量。第4页,共59页,2022年,5月20日,23点4分,星期四描述性统计分析指标统计量可分为两类一类表示数据的中心位置,例如均值、中位数、众数等一类表示数据的离散程度,例如方差、标准差、极差等用来衡量个体偏离中心的程度。
第5页,共59页,2022年,5月20日,23点4分,星期四3.1频率分析功能:频率分析主要通过频率分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征第6页,共59页,2022年,5月20日,23点4分,星期四频率分析意义意义:SPSS的频数分析过程(Frequencies)是描述性分析中最基本也是最常用的方法之一。通过频数分析,我们可以得到详细的频数表以及平均值、最大值、最小值、方差、标准差、极差、平均数标准误、偏度系数和峰度系数等重要的描述统计量,还可以通过分析得到合适的统计图。所以进行频数分析不仅可以方便地对数据按组进行归类整理,还可以对数据的分布特征形成初步的认识。第7页,共59页,2022年,5月20日,23点4分,星期四频率分析术语频率
对于定性观测值时,把它们按照某种原则分成一些组,每个观测值必须落入一个类并且只能够落入一个类中。对于给定的类,落入这个类的个案数称为频率
落入该类中的个案数和个案总数的比例称为相对频率第8页,共59页,2022年,5月20日,23点4分,星期四案例数据文件EmployData.sav记录了某公司职工的基本信息,例如性别、民族、出生日期、教育水平、工资水平、工作年限等。教育水平为分类变量,它有11个类别。
第9页,共59页,2022年,5月20日,23点4分,星期四SPSS频率分析选择【分析】→【描述统计】→【频率】
第10页,共59页,2022年,5月20日,23点4分,星期四频率分析选项-统计量第11页,共59页,2022年,5月20日,23点4分,星期四频率分析选项-图表第12页,共59页,2022年,5月20日,23点4分,星期四频率分析的结果解释频率表格条形图、直方图第13页,共59页,2022年,5月20日,23点4分,星期四当堂练习-频率分析实例案例3.1身高数据给出了河南省某学校50名高二学生的身高。试分析该50名学生的身高分布特征,计算平均值、最大值、最小值、标准差等统计量,并绘制频数表、直方图。第14页,共59页,2022年,5月20日,23点4分,星期四3.2中心趋势的描述均值(尺度数据和定序数据)中位数(尺度数据和定序数据)众数(定性数据和尺度数据)5%截尾均值(尺度数据和定序数据)
第15页,共59页,2022年,5月20日,23点4分,星期四均值均值即数据的算术平均数,是数据中心趋势的主要度量指标,设变量有n个测量值,则算术均值为:第16页,共59页,2022年,5月20日,23点4分,星期四均值的特点最常用的中心位置度量受极端值影响例:1,3,5,7,9和
1,3,5,7,14第17页,共59页,2022年,5月20日,23点4分,星期四中位数重要的中心位置度量在递增排序后的数据列中若数据个数为奇数,中位数是正中央的数若数据个数是偶数,中位数是正中央的两数的平均值.不受极端值的影,例如:1,5,7,3,9第18页,共59页,2022年,5月20日,23点4分,星期四众数发生频数最高的数据值不受极端值的影响众数可能不存在可能有多个众数(单峰,双峰,多峰)可用于定量或定性数据第19页,共59页,2022年,5月20日,23点4分,星期四5%截尾均值避免了极端值的影响
第20页,共59页,2022年,5月20日,23点4分,星期四3.3离散趋势的描述仅仅根据数据的中心趋势指标进行决策是不够的。例如,如果一个国家的不同家庭收入差距很少;而另一个国家的家庭收入差距很大,既存在大量的贫困家庭,也存在许多十分富有的家庭,那么即使这两个国家的中等收入家庭的收入完全一样,其家庭收入情况仍然完全不同。第21页,共59页,2022年,5月20日,23点4分,星期四例子假设我们有以下的三组观测值:观测A:11,12,13,16,16,17,18,21观测B:14,15,15,15,16,16,16,17观测C:11,11,11,12,19,20,20,20这三组观测值的均值都是15.5,那么这三组数据是否相似呢?第22页,共59页,2022年,5月20日,23点4分,星期四离散趋势第23页,共59页,2022年,5月20日,23点4分,星期四离散趋势的描述极差(range)方差(Variance)标准差(S.d.)分位数(Percentage)变异指标第24页,共59页,2022年,5月20日,23点4分,星期四极差极差=最大值-最小值受极端值影响较大第25页,共59页,2022年,5月20日,23点4分,星期四方差和标准差方差标准差第26页,共59页,2022年,5月20日,23点4分,星期四变异系数在比较两组数据离散程度大小时,如果数据的测量尺度相差太大,直接比较二者的标准差并不合适。需要首先消除测量尺度和量纲的影响。变异系数可以剔除这些影响,其计算公式为:第27页,共59页,2022年,5月20日,23点4分,星期四分位数第p百分位数使得至少有p%的数据小于或等于这个值,且使得至少有(100-p)%的数据大于或等于这个值如何计算?将原数据从小到大排列计算i=(p/100)n若i是整数,则第p百分位数为第i与第i+1项的平均若i不是整数,则向上取整。第28页,共59页,2022年,5月20日,23点4分,星期四总结五数最小值、第一个四分位数、中位数、第三个四分位数、最大值从这五个值可以大致看出数据分布的中心和离散程度。而箱图则是这五个数的图形表现
第29页,共59页,2022年,5月20日,23点4分,星期四3.4分布的形状偏度当偏度系数大于0时,分布为正偏或右偏,布图形在右边拖尾,分布图有很长的右尾,尖峰偏左当偏度系数小于0,分布为负偏或左偏,即分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右当偏度系数为0,分布对称第30页,共59页,2022年,5月20日,23点4分,星期四峰度峰度
>3,分布为高峰度,即比正态分布的峰要陡峭;<3,分布为低峰度,即比正态分布的峰要平坦些;=0,分布为正态峰。第31页,共59页,2022年,5月20日,23点4分,星期四3.5SPSS描述性统计许多菜单均可进行描述性分析,提供描述性统计指标的输出。例如T检验、方差分析、因子分析等SPSS自定义表模块也可以产生大部分的描述性统计指标第32页,共59页,2022年,5月20日,23点4分,星期四SPSS中的菜单专门的描述性统计菜单:频率(F):该过程将产生频数表,输出频数分布的条形图、饼图或者直方图;描述(D):该过程则进行一般性的统计描述;探索(E):该过程用于对数据概况不清时的探索性分析;交叉表(C):该过程完成分类数据的统计描述和一般的统计检验,我们常用的检验也包含在该对话框中。第33页,共59页,2022年,5月20日,23点4分,星期四频率:实例【分析】→【描述】→【频率】
第34页,共59页,2022年,5月20日,23点4分,星期四频率:统计量的选择第35页,共59页,2022年,5月20日,23点4分,星期四频率:结果的解释第36页,共59页,2022年,5月20日,23点4分,星期四描述性子菜单第37页,共59页,2022年,5月20日,23点4分,星期四当堂练习-描述性分析实例案例3.2体重数据给出了河南省某高校50名大一入学新生的体重。试对该50名学生的体重进行描述性分析,从而了解这50名学生体重的基本特征。第38页,共59页,2022年,5月20日,23点4分,星期四探索子菜单【分析】→【描述统计】→【探索】该菜单可以对不同的组分别给出描述性统计量第39页,共59页,2022年,5月20日,23点4分,星期四探索:选择统计量第40页,共59页,2022年,5月20日,23点4分,星期四探索:图第41页,共59页,2022年,5月20日,23点4分,星期四探索:结果解释(1)第42页,共59页,2022年,5月20日,23点4分,星期四探索:结果解释(2)第43页,共59页,2022年,5月20日,23点4分,星期四当堂练习-探索分析实例实例3.3气温数据给出了郑州、泰安两城市2012年各月份的平均气温。试据此对两城市平均气温进行探索性统计分析,研究其基本特征。第44页,共59页,2022年,5月20日,23点4分,星期四设定表格第45页,共59页,2022年,5月20日,23点4分,星期四表格:摘要统计量设置第46页,共59页,2022年,5月20日,23点4分,星期四当堂练习-列联表分析实例数据文件EmployeeData给出了某公司职工的基本信息,据此对职工的教育水平进行列联表分析,研究不同性别的职工教育水平之间有无明显的差别。第47页,共59页,2022年,5月20日,23点4分,星期四3.6统计图进行描述性统计分析定性数据条形图饼图帕累托图定量数据直方图茎叶图箱图第48页,共59页,2022年,5月20日,23点4分,星期四频率描述-频率->图表条形图饼图直方图示例:数据文件DisasterReason.sav条形图饼图直方图帕累托图第49页,共59页,2022年,5月20日,23点4分,星期四条形图第50页,共59页,2022年,5月20日,23点4分,星期四饼图第51页,共59页,2022年,5月20日,23点4分,星期四帕累托图第52页,共59页,2022年,5月20日,23点4分,星期四直方图-茎叶图-箱图描述性->探索直方图茎叶图箱图示例:数据EmployeeData.sav直方图茎叶图箱图第53页,共59页,2022年,5月20日,23点4分,星期四直方图和茎叶图第54页,共59页,2022年,5月20日,23点4分,星期四箱图第55页,共59页,2022年,5月20日,23点4分,星期四从旧对话框作图重
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 癫痫病人的急救护理
- 浅谈制作课件教学课件
- 测量运动课件教学课件
- 部编版八年级地理上册第四章第二节《农业》课件
- 河南省2024九年级语文上册第一单元3我爱这土地课件新人教版
- 2.3.1共价键的极性 课件 高二上学期化学人教版(2019)选择性必修2
- 特殊药品管理应急演练
- 董氏奇穴治疗颈椎病
- 初中语文教案教学反思
- 护理专业说课稿
- 2024年中考语文复习分类必刷:非连续性文本阅读(含答案解析)
- 项目经理或管理招聘面试题与参考回答(某大型国企)
- 2024年国际贸易实务试题及答案
- 冀少版(2024)七年级上册生物单元+期中+期末共6套学情评估测试卷汇编(含答案)
- 2024年四川宜宾江安县考调事业单位工作人员7人历年(高频重点复习提升训练)共500题附带答案详解
- 2025高考数学一轮复习-4.1-任意角和弧度制及三角函数的概念【课件】
- 智能安防监控设备采购合同
- 工程进度款申请表
- 当代社会政策分析 课件 第八章 儿童社会政策
- 2023年徽商银行市区支行招聘综合柜员信息笔试上岸历年典型考题与考点剖析附带答案详解
- 2024年湖南化工职业技术学院单招职业技能测试题库带答案解析
评论
0/150
提交评论