![第四章01_连续变量的描述统计_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/f4653cd7-4bf4-4421-8a34-1e7836d13337/f4653cd7-4bf4-4421-8a34-1e7836d133371.gif)
![第四章01_连续变量的描述统计_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/f4653cd7-4bf4-4421-8a34-1e7836d13337/f4653cd7-4bf4-4421-8a34-1e7836d133372.gif)
![第四章01_连续变量的描述统计_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/f4653cd7-4bf4-4421-8a34-1e7836d13337/f4653cd7-4bf4-4421-8a34-1e7836d133373.gif)
![第四章01_连续变量的描述统计_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/f4653cd7-4bf4-4421-8a34-1e7836d13337/f4653cd7-4bf4-4421-8a34-1e7836d133374.gif)
![第四章01_连续变量的描述统计_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/f4653cd7-4bf4-4421-8a34-1e7836d13337/f4653cd7-4bf4-4421-8a34-1e7836d133375.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 SPSS统计分析方法统计分析方法 1.连续变量的统计描述概述连续变量的统计描述概述2. 集中趋势的描述指标集中趋势的描述指标3.离散趋势的描述指标离散趋势的描述指标4.实例操作实例操作Part 2:第四章:第四章01 连续变量的描述统计连续变量的描述统计学习要求学习要求掌握SPSS软件中用于连续变量统计描述的Explore、Frequencies、Descriptive过程学习要求学习要求理解连续变量的均值、方差等统计描述指标4.1 4.1 连续变量的统计描述概述连续变量的统计描述概述统计描述的工具统计描述的工具统计图统计图 统计表统计表统计描述指标统计描述指标 数据分布的特征数据分布的特征
2、集中趋势集中趋势 ( (位置位置) )离中趋势离中趋势 ( (分散程度分散程度) )偏态和峰度偏态和峰度(形状)(形状)连续变量统计描述的连续变量统计描述的常用常用指标指标均值均值众数众数中位数中位数极差极差四分位差四分位差方差方差统计描述指标统计描述指标集中趋势集中趋势离散趋势离散趋势4.2 4.2 集中趋势的描述指标集中趋势的描述指标 一组数据向其中心值靠拢的倾向和程度;一组数据向其中心值靠拢的倾向和程度; 测度集中趋势就是寻找数据一般水平的代表值或中心值;测度集中趋势就是寻找数据一般水平的代表值或中心值;集中趋势测度均值集中趋势测度均值 集中趋势的测度值之一;集中趋势的测度值之一; 最最
3、常用常用的测度值;的测度值; 一组数据的均衡点所在;一组数据的均衡点所在; 设一组数据为:设一组数据为:x1 ,x2 , ,xn ,简单算术平均数的计算公式为:,简单算术平均数的计算公式为:nxnxxxxniin121集中趋势测度中位数集中趋势测度中位数集中趋势的测度值之一;集中趋势的测度值之一;排序后处于中间位置上的值:排序后处于中间位置上的值:Me50%50%集中趋势测度众数集中趋势测度众数 集中趋势的测度值之一;集中趋势的测度值之一; 出现次数最多的变量值;出现次数最多的变量值;数据类型与集中趋势测度值数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度
4、值数据类型分类数据 顺序数据数值数据(定距数据)数值数据(定比数据)适用的测度值众数中位数均值均值四分位数众数调和平均数众数中位数几何平均数四分位数 中位数四分位数众数4.3 4.3 离中趋势的描述指标离中趋势的描述指标 数据分布的另一个重要特征;数据分布的另一个重要特征; 离中趋势的各测度值是对数据离中趋势的各测度值是对数据离散程度离散程度所作的描述;所作的描述; 反映各变量值远离其中心值的程度从另一个侧面,从令一侧面说反映各变量值远离其中心值的程度从另一个侧面,从令一侧面说明了集中趋势测度值的代表程度;明了集中趋势测度值的代表程度;离中趋势测度极差离中趋势测度极差离散程度的测度值之一;离散
5、程度的测度值之一;一组数据的最大值与最小值之差,计算公式为:一组数据的最大值与最小值之差,计算公式为: R = max(xi) - min(xi)离中趋势测度方差离中趋势测度方差离散程度最常用的测度值;离散程度最常用的测度值;反映了各变量值与均值的平均差异;反映了各变量值与均值的平均差异;计算公式:计算公式:nxxnii122)(离中趋势测度四分位差离中趋势测度四分位差离中趋势的测度值之一;离中趋势的测度值之一;排序后处于排序后处于75%和和25%位置上的值的差位置上的值的差 :数据类型与离中趋势测度值数据类型与离中趋势测度值数据类型和所适用的离散程度测度值数据类型和所适用的离散程度测度值数据
6、类型数据类型分类数据分类数据 顺序数据顺序数据数值数据数值数据适适用用的的测测度度值值四分位差四分位差 方差或标准差方差或标准差 离散系数(比较时用)离散系数(比较时用) 平均差平均差 极差极差 四分位差四分位差4.4 4.4 数据分布的形状测度数据分布的形状测度扁平分布尖峰分布峰度峰度左偏分布右偏分布与标准正态与标准正态分布比较!分布比较!偏态偏态数据分布的形状测度偏态数据分布的形状测度偏态数据分布偏斜程度的测度;数据分布偏斜程度的测度;计算公式:计算公式:偏态系数偏态系数=0为对称分布;为对称分布; 偏态系数偏态系数0为右偏分布;为右偏分布; 偏态系数偏态系数0为左偏分布。为左偏分布。31
7、13niiniiiffxx算例算例【例】已知2007年我国农村居民家庭按纯收入分组的有关数据如下表。试计算偏态系数。2007年年农村居民家庭纯收入数据农村居民家庭纯收入数据按纯收入分组(元)户数比重(%)500以下500100010001500150020002000250025003000300035003500400040004500450050005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94计算过程计算过程农村居民家庭纯收入数据偏态及峰度计算表农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值xi户数比重(%
8、)fi(xi- x ) fi3(xi- x ) fi45以下5101015152020252530303535404045455050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计1
9、001689.2572521.25计算结果计算结果根据上表数据计算得:将计算结果代入公式得:结论结论:偏态系数为正值,说明农村居民家庭纯收入的分布为右偏分布。956. 07339.176625.1689089.12429.21311133113iiiniiniiifxffxx429.21.11niiiniiffxx089.12.11niiiniiffx农村居民家庭纯收入数据的直方图农村居民家庭纯收入数据的直方图结论结论说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数。按纯收入分组按纯收入分组(元元)10户户数数比比重重(% %)数据分布的形状测度峰度数
10、据分布的形状测度峰度数据分布扁平程度的测度;数据分布扁平程度的测度;计算公式:计算公式:峰度系数峰度系数=3扁平程度适中;扁平程度适中; 峰度系数峰度系数3为尖峰分布。为尖峰分布。4114niiniiiffxx4.5 4.5 连续变量的统计描述实例操作连续变量的统计描述实例操作【例例】:某班:某班3030名学生名学生统计学统计学期末考试成绩如下,试对该考试进行统期末考试成绩如下,试对该考试进行统计描述分析。计描述分析。 117 122 124 129 107 117 130 122 110 118 123 126 127 123 118 112 100 125 117 122 126 122
11、118 108 112 127 123 119 113 120描述统计过程描述统计过程SPSSSPSS软件中用于连续变量统计描述的工具主要有软件中用于连续变量统计描述的工具主要有频率频率分析、描述分析分析、描述分析 、 探索分析探索分析三大过程。三大过程。频率分析频率分析过程过程 频数分布表是描述性统计中最常用的方法之一,频数分布表是描述性统计中最常用的方法之一,频率分析频率分析过程就是专门为产生频数表而设计的。过程就是专门为产生频数表而设计的。 频率分析频率分析过程不仅可以产生详细的频数表,还可过程不仅可以产生详细的频数表,还可以按要求给出百分位点的数值,以及常用的条图、以按要求给出百分位点
12、的数值,以及常用的条图、圆图等统计图。圆图等统计图。 频率分析频率分析过程还提供了多变量的比较过程还提供了多变量的比较统计学统计学成绩成绩【例】:某班30名学生统计学期末考试成绩如下,试对该考试进行分析。117117117117123123112112126126127127122122130130126126100100122122123123124124122122127127125125118118119119129129110110123123117117108108113113107107118118118118122122112112120120主对话框主对话框候选变量候选变量待分
13、析变量待分析变量统计量统计量子对话框子对话框Std.deviation 标准差标准差Variance 方差方差Range 极差(全距)极差(全距)S.E.mean均值的标准误均值的标准误Median 中位数中位数Mode 众数众数Skewness 偏度偏度Kurtosis 峰度峰度结果输出表格结果输出表格频数分析频数分析过程的表格输出不仅主要有均值、中位数、众数、标准差等等常过程的表格输出不仅主要有均值、中位数、众数、标准差等等常用的描述统计指标。用的描述统计指标。图表图表子对话框子对话框图表图表子对话框子对话框主要是定义输出的图形类型:条图、饼图、直方图。主要是定义输出的图形类型:条图、饼图
14、、直方图。结果输出直方图结果输出直方图格式格式子对话框子对话框限制分组数限制分组数选择两个以上变量选择两个以上变量作频数表,并对统计量进行对比作频数表,并对统计量进行对比定义频数表定义频数表排列顺序排列顺序格式格式 子对话框子对话框主要是定义输出频数表的格式。主要是定义输出频数表的格式。请完成对奥运会射击比赛请完成对奥运会射击比赛8名选手决赛成绩分布名选手决赛成绩分布特征以及离散趋势和集中趋势的对比分析。特征以及离散趋势和集中趋势的对比分析。描述分析描述分析过程过程 它可对变量进行描述性统计分析,计算并列出一它可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,这和其他过程相比并无不系
15、列相应的统计指标,这和其他过程相比并无不同。同。 该过程可将原始数据转换成标准正态分值,并以该过程可将原始数据转换成标准正态分值,并以变量的形式存入数据库供以后分析,特别是离群变量的形式存入数据库供以后分析,特别是离群点的分析。点的分析。复习:标准分数复习:标准分数(standard score)1. 也称标准化值也称标准化值2. 对某一个值在一组数据中相对位置的度量对某一个值在一组数据中相对位置的度量3. 可用于判断一组数据是否有离群点可用于判断一组数据是否有离群点(outlier)4. 用于对变量的标准化处理用于对变量的标准化处理5. 计算公式为计算公式为iixxzs标准分数标准分数(性质
16、性质)z分数只是将原始数据进行了线性变换,它并没有改变分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是使该组数据均值为的形状,而只是使该组数据均值为0,标准差为,标准差为1 标准分数标准分数 (例题分析例题分析)9个家庭人均月收入标准化值计算表 家庭编号人均月收入(元) 标准化值 z 1234567891500 750 7801080 850 960200012501630 0.695-1.042-0.973-0.278-0.811-0.556 1.853 0.116 0.996作用:经
17、验法则作用:经验法则经验法则表明:当一组数据对称分布时经验法则表明:当一组数据对称分布时约有约有68%的数据在平均数加减的数据在平均数加减1个标准差的范个标准差的范围之内围之内约有约有95%的数据在平均数加减的数据在平均数加减2个标准差的范个标准差的范围之内围之内约有约有99%的数据在平均数加减的数据在平均数加减3个标准差的范个标准差的范围之内围之内 作用:切比雪夫不等式作用:切比雪夫不等式(Chebyshevs inequality )如果一组数据不是对称分布,经验法则就不再适用如果一组数据不是对称分布,经验法则就不再适用,这时可使用切比雪夫不等式,它对任何分布形状,这时可使用切比雪夫不等式
18、,它对任何分布形状的数据都适用的数据都适用切比雪夫不等式提供的是切比雪夫不等式提供的是“下界下界”,也就是,也就是“所占比例所占比例至少是多少至少是多少”对于任意分布形态的数据,根据切比雪夫不等式,对于任意分布形态的数据,根据切比雪夫不等式,至少有至少有1-1/k2的数据落在平均数加减的数据落在平均数加减k个标准差之个标准差之内。其中内。其中k是大于是大于1的任意值,但不一定是整数的任意值,但不一定是整数切比雪夫不等式切比雪夫不等式(Chebyshevs inequality )对于对于k=2,3,4,该不等式的含义是,该不等式的含义是至少有至少有75%的数据落在平均数加减的数据落在平均数加减
19、2个标准差个标准差的范围之内的范围之内至少有至少有89%的数据落在平均数加减的数据落在平均数加减3个标准差个标准差的范围之内的范围之内至少有至少有94%的数据落在平均数加减的数据落在平均数加减4个标准差个标准差的范围之内的范围之内主对话框主对话框候选变量候选变量计算标准分值存储在新的变量计算标准分值存储在新的变量待分析变量待分析变量选项选项子对话框子对话框选项选项子对话框子对话框主要是选择需要输出的描述统计指标:均值、中位数、众主要是选择需要输出的描述统计指标:均值、中位数、众数、标准差等等。数、标准差等等。结果输出表格结果输出表格请完成对奥运会射击比赛请完成对奥运会射击比赛8名选手决赛成绩的
20、离名选手决赛成绩的离群点分析。群点分析。Z庞伟Z荣国Z金荣洙Z贾森.特纳Z布赖恩.比曼Z列昂尼德.叶基莫夫Z瓦尔特.拉佩尔Z乍吉.巴尼巴滴功-1.81359-1.81359-1.23499-1.32288-1.5732-.25538.59781-.43806.17678.15770-.33682.56695.71510.51075.76861.70471-.35355.551961.234991.133891.00114.51075-1.96423-1.96423-1.0094-1.06066.15770.56136.00000.28604-.25538-.085401.46656.00000
21、.35483-1.45954.75593.85812.76613.93941-1.0094-.17678.15770.33682-.75593-.57208-2.5537-2.5537-.59781.70471.88388.94622.11227.56695-.28604-.25538-1.11021-.628521.06066.354831.68408-1.88982-1.889821.28717.00000.25620-1.3903-1.23744.94622-.33682.75593-1.4301.766131.28102.895171.767771.76777-1.81359-1.81
22、359-.56136.18898-.28604.76613-.08540.70471-1.06066探索分析探索分析过程过程 可对变量进行更深入详尽的描述性统计分析,主可对变量进行更深入详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清楚时。要用于对资料的性质、分布特点等完全不清楚时。 在常用的描述性统计指标的基础上,它增加了有在常用的描述性统计指标的基础上,它增加了有关数据详细分布特征的文字与图形描述,如茎叶关数据详细分布特征的文字与图形描述,如茎叶图、箱式图等。图、箱式图等。主对话框主对话框选入所需分析变量选入所需分析变量选定分组变量选定分组变量选定标签变量选定标签变量选定结果
23、中包括的内容选定结果中包括的内容候选变量候选变量统计量统计量子对话框子对话框所有以上两个过所有以上两个过程有的指标程有的指标总体均值总体均值的估计值的估计值输出输出5个个最大与最大与最小值最小值百分位数百分位数绘制绘制子对话框子对话框箱式图的绘制方箱式图的绘制方式式茎叶图和直方图茎叶图和直方图正态图和正正态图和正态检验态检验判断离散程度是否相同(比较合适的判断离散程度是否相同(比较合适的变量变换方法)变量变换方法)结果输出表格结果输出表格结果输出表格结果输出表格结果输出结果输出- -茎叶图茎叶图结果输出箱图结果输出箱图离群点离群点最小值最小值最大值最大值中位数中位数上四分位数上四分位数下四分位数下四分位数请完成对奥运会射击比赛请完成对奥运会射击比赛8名选手决赛成绩的探名选手决赛成绩的探索性分析。索性分析。小小 结结 本章主要阐述本章主要阐述SPSS软件中用于连续变量统计描软件中用于连续变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年路面清洁装备合作协议书
- 如何制定品牌宣传计划
- 2025年优良动植物新品种项目合作计划书
- 班主任与学科教师协作计划
- 2025年钴粉系列合作协议书
- 2025年中国页岩气行业市场现状及投资态势分析报告(智研咨询)
- 2025年气体掺混设备合作协议书
- 2025年动叶可调轴流电站用风机项目发展计划
- 2025年基础软件设计服务项目建议书
- 新产品发布指南与市场推广策略
- 辅导员素质能力大赛基础知识试题题库
- 铁路专用线设计规范(试行)(TB 10638-2019)
- 潍坊环境工程职业学院单招职业技能测试参考试题库(含答案)
- 《初三毕业班开学第一课:收心及中考冲刺》班会课件
- 2024年山东司法警官职业学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 新生儿转运护理安全管理课件
- 华为公司煤矿智能化远景培训课件2024
- 物业客服课件培训模板
- 人教版PEP四年级英语下册全册教学设计表格教案
- 制造业面临的挑战与发展对策
- 医院智慧病房信息化建设
评论
0/150
提交评论