




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS数据分析-第8章-SPSS的相关分析和线性回归分析,SPSS统计分析方法及应用,1,学习交流PPT,什么是相关分析,相关分析是分析客观事物之间相关性的数量分析方法。许多事物或现象之间总是相互联系的,并且可以通过一定的数量关系反映出来。 函数关系:两事物之间一对一的关系。 统计关系:两事物之间的多对一和一对多。,2,学习交流PPT,线性相关和非线性相关,统计关系还可以分为: (1)线性相关:当一个变量的值发生变化时,另外的一个变量也发生大致相同的变化。在直角坐标系中,如现象观察值的分布大致在一条直线上,则现象之间的相关关系为线性相关或直线相关(Linear correlation)。 (
2、2)非线性相关:如果一个变量发生变动,另外的变量也随之变动,但是,其观察值分布近似的在一条曲线上,则变量之间的相关关系为非线性相关或曲线相关(Curvilinear correlation),3,学习交流PPT,相关关系的种类,相关关系的种类:是否线性 线性相关 正相关 负相关 曲线相关 相关关系的种类:据变量的度量类型 定类变量和定类变量之间的相关 定序变量和定序变量之间的相关 定距变量和定距变量之间的相关,4,学习交流PPT,相关关系的种类,相关关系的种类:是否线性 线性相关 正相关 负相关 曲线相关 相关关系的种类:据变量的度量类型 定类变量和定类变量之间的相关 定序变量和定序变量之间的
3、相关 定距变量和定距变量之间的相关,5,学习交流PPT,定类变量 定序变量 定距变量,定类变量变量的一种,根据定性的原则区分总体各个案类别的变量。定类变量的值只能把研究对象分类,也即只能决定研究对象是同类抑或不同类,具有与的数学性质。例如性别区分为男性和女性两类 定序变量变量的一种,区别同一类别个案中等级次序的变量。定序变量能决定次序,也即变量的值能把研究对象排列高低或大小,具有与的数学特质。它是比定类变量层次更高的变量,因此也具有定类变量的特质,即区分类别(,)。例如文化程度可以分为大学、高中、初中、小学、文盲。 定距变量 也是变量的一种,区别同一类别个案中等级次序及其距离的变量。它除了包括
4、定序变量的特性外,还能确切测量同一类别各个案高低、大小次序之间的距离,因而具有加与减的数学特质。但是,定距变量没有一个真正的零点。,6,学习交流PPT,相关分析的作用,判断变量之间有无联系 确定相关关系的表现形式及相关分析方法 把握相关关系的方向与密切程度 为进一步采取其他统计方法进行分析提供依据 用来进行预测,7,学习交流PPT,相关分析和回归分析区别,相关分析:如果仅仅研究变量之间的相互关系的密切程度和变化趋势,并用适当的统计指标描述。 回归分析:如果要把变量间相互关系用函数表达出来,用一个或多个变量的取值来估计另一个变量的取值。,8,学习交流PPT,散点图,通过观察散点图能够直观的发现变
5、量之间的统计关系 以及它们的强弱程度和数据对的可能走向。散点图以横轴表示两个变量中的一个变量,以纵轴表示另一个变量,将两个变量之间相对应的变量值以坐标点的形式逐一标在直角坐标系中,通过点的分布形状、分布模式和疏密程度来形象描述两个变量之间的相关关系。,9,学习交流PPT,矩阵散点图:以矩阵的形式在多个坐标轴上分别显示多对变量间的统计关系。变量在那一行,那一行横坐标就是它。,10,学习交流PPT,线性相关的度量尺度数据间的相关性的度量,Pearson相关系数 相关系数的数值范围是介于1与 +1之间: 如果|r| 0,表明两个变量没有线性相关关系。 如果|r| 1 ,则表示两个变量完全直线相关。线
6、性相关的方向通过相关系数的符号来表示,“+”号表示正相关,“”表示负相关。,11,学习交流PPT,相关系数为0或接近于0不能说明两个变量之间没有相关性,它只说明没有线性相关性。不能排除具有其它非线性关系。 Pearson 相关系数是一种线性关联度量。如果两个变量关系密切,但其关系不是线性的,则 Pearson 相关系数就不是适合度量其相关性的统计量。,12,学习交流PPT,等级相关分析,等级相关分析 等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。,13,学习交流PPT,Spearman等级相关系数定序变量之间的相关性的度量
7、,斯皮尔曼等级相关系数: 两个变量为定序变量。 一个变量为定序变量,另一个变量为尺度数据,且两总体不是正态分布,样本容量n不一定大于30。 数据的秩:秩rank,是一种数据排序的方式,可以知道某变量值在该列所有值中的名次。秩是对应数值由大到小的,例如有100个数据都不一样的话,最大的数值对应的秩就是100,最小的就是1。有重复数据时候,会按同名称排列。,14,学习交流PPT,设D是两个变量每对数据的等级差,n是样本量。 则Spearman相关系数为:,15,学习交流PPT,Kendall的tau-b(K),Kendall的 系数是另一种计算定序变量之间或者定序和尺度变量之间相关系数的方法。Sp
8、earman的等级相关系数可以方便检验两个定序变量是否相关,但是很难具体解释两个变量如何相关及相关程度。Kendall的等级相关系数可以同时反映两个变量的相关程度。,16,学习交流PPT,设样本量为n,考察两个变量X和Y之间的相关关系,X和Y的取值记为xi,yi。所有像(xi,yi)对的个数为n(n-1)/2(也就是 )。和分别表示和的秩次,如果对于任意k,有我们称(xk,yk)为同序对;否则,称为逆序对。 总的同序对的个数记为U,逆序对的个数记为V,则Kendall的Tau系数的定义为:,17,学习交流PPT,偏相关分析,概念:当有多个变量存在时,为了研究任何两个变量之间的关系,而使与这两个
9、变量有联系的其它变量都保持不变。即控制了其它一个或多个变量的影响下,计算两个变量的相关性。 偏相关系数:偏相关系数是用来衡量任何两个变量之间的关系的大小。 自由度:在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。,18,学习交流PPT,回归分析,一元线性回归模型: 其中x为自变量;y为因变量; 为截距,即常量; 为回归系数,表明自变量对因变量的影响程度。,19,学习交流PPT,用最小二乘法求解方程中的两个参数,得到,20,学习交流PPT,回归方程统计检验,回归方程的拟
10、合优度:回归直线与各观测点的接近程度称为回归方程的拟合优度,也就是样本观测值聚集在回归线周围的紧密程度 。 当自变量是分类变量时,需要将原变量转换成虚拟变量,所有虚拟变量都是 “1”和“0”取值的二分变量。(例如性别变量),21,学习交流PPT,回归方程的统计检验,即:总离差平方和(SST)=剩余离差平方和(SST) +回归离差平方和(SSR)其中;SSR是由x和y的直线回归关系引起的,可以由回归直线做出解释;SSE是除了x对y的线性影响之外的随机因素所引起的Y的变动,是回归直线所不能解释的。,22,学习交流PPT,残差分析,残差是指由回归方程计算得到的预测值与实际样本值之间的差距,定义为: 对于线性回归分析来讲,如果方程能够较好的反映被解释变量的特征和规律性,那么残差序列中应不包含明显的规律性。残差分析包括以下内容:残差服从正态分布,其平均值等于0;残差取值与X的取值无关;残差不存在自相关;残差方差相等。,23,学习交流PPT,对于残差均值和方差齐性检验可以利用残差图进行分析。如果残差均值为零,残差图的点应该在纵坐标为0的中心的带状区域中随机散落。如果残差的方差随着解释变量值(或被解释变量值)的增加呈有规律的变化趋势,则出现了异方差现象。 DW检验: DW检验用来检验残差的自相关。检验统计量为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 动画制作合同范本
- 2025年03月国家农业农村部成都沼气科学研究所第一次公开招聘14人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 高级系统规划与管理师-《系统规划与管理师》上午押题密卷2
- 混凝土添加剂项目安全风险评价报告
- 新疆北京师范大学克拉玛依附属学校2025届高三下第一次月考综合试题含解析
- 政治选择性必修一知识点
- 2025年度销售合同模板
- 2025合同租赁纠纷
- 2025年技术咨询服务合同范本
- 财经社团模拟投资比赛计划
- 2024年四川省眉山市中考地理+生物试卷(含答案)
- 当代世界经济与政治 李景治 第八版 课件 第1、2章 当代世界政治、当代世界经济
- 篮球智慧树知到期末考试答案章节答案2024年浙江大学
- 《归去来兮辞(并序)》课件
- 临床生物化学检验练习题库(含答案)
- X射线衍射仪(XRD)行业市场现状供需分析及市场深度研究发展前景及规划投资研究报告
- 2024年强基计划解读 课件-2024届高三下学期主题班会
- DB21-T 3413-2021地下工程自防护混凝土结构耐久性技术规程
- 学校食品安全管理
- 团队沟通与协作培训
- 美的社会责任报告2023
评论
0/150
提交评论