双变量相关与回归分析_第1页
双变量相关与回归分析_第2页
双变量相关与回归分析_第3页
双变量相关与回归分析_第4页
双变量相关与回归分析_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

双变量相关与回归分析第一页,共四十九页,编辑于2023年,星期五例如:为了研究微量元素锰在胆固醇合成中的作用,探讨大鼠肝脏中胆固醇含量和锰含量之间是否存在直线关系?这种关系为随着锰含量的增加,胆固醇的含量是增加还是减少呢?——直线相关问题第二页,共四十九页,编辑于2023年,星期五第一节直线相关直线相关:又称简单相关,是研究两个变量间线性关系的一种常用统计方法。直线相关分析的是两变量之间是否存在直线相关关系,以及相关的方向和程度。直线相关系数又称Pearson相关系数,使描述两变量线性相关关系程度和方向的统计量。作直线相关分析要求资料服从双变量正态分布。对于不符合双变量正态分布的资料,不能直接计算Pearson相关系数,可用非参数统计方法,即计算Kendall相关系数或Spearman相关系数。第三页,共四十九页,编辑于2023年,星期五正相关负相关完全正相关完全负相关零相关第四页,共四十九页,编辑于2023年,星期五相关系数的意义与计算相关系数:以符号r表示样本相关系数,符号ρ表示其总体相关系数。样本相关系数的计算公式为相关系数没有单位,其值为-1≤r≤1。r

值为正表示正相关,r

值为负表示负相关,r

的绝对值等于1为完全相关,r

=0为零相关。第五页,共四十九页,编辑于2023年,星期五SPSS中的相关分析“Analyze”菜单的“Correlate”子菜单中,该菜单包括三个部分。①bivariate模块:主要用于两个或多个变量间的相关分析。如果是多个变量,则给出两两变量间相关分析的结果。该模块是进行相关分析的最常用的模块。②partial模块:是专门用于偏相关分析,即控制了混杂因素或影响因素后得到的两个变量间相关关系的结果。③distance模块:一般不单独使用,当数据复杂时,可以用此模块进行数据的初步处理,应用少。第六页,共四十九页,编辑于2023年,星期五第七页,共四十九页,编辑于2023年,星期五1、建立数据文件SPSS操作分析步骤如下建立两个变量:X变量:年龄,数值型Y变量:尿肌酸含量,数值型第八页,共四十九页,编辑于2023年,星期五2、统计分析(1)散点图的制作

graphscattersimple第九页,共四十九页,编辑于2023年,星期五通过散点图可看出两个变量间有直线趋势,可作两因素线关分析。第十页,共四十九页,编辑于2023年,星期五(2)相关分析操作

analyzecorrelatebivariate①菜单选择Bivariatecorrelations主对话框第十一页,共四十九页,编辑于2023年,星期五第十二页,共四十九页,编辑于2023年,星期五第十三页,共四十九页,编辑于2023年,星期五SPSS程序③主要输出结果及解释第十四页,共四十九页,编辑于2023年,星期五相关系数的统计推断相关系数的假设检验常用统计量t值,计算公式为:第十五页,共四十九页,编辑于2023年,星期五练习题第十六页,共四十九页,编辑于2023年,星期五第二节直线回归第十七页,共四十九页,编辑于2023年,星期五第十八页,共四十九页,编辑于2023年,星期五第十九页,共四十九页,编辑于2023年,星期五第二十页,共四十九页,编辑于2023年,星期五一、直线回归方程的求法从散点图中看,求解a、b实际上就是怎样“合理地”找到一条能最好地代表数据点分布趋势的直线。通常取各点残差平方和最小的直线为所求直线——”最小二乘法”原则。方程中常数项和回归系数的求法:第二十一页,共四十九页,编辑于2023年,星期五二、直线回归中的统计推断回归方程的假设检验:有方差分析和t检验方法。总体回归系数β的可信区间利用回归方程进行估计和预测第二十二页,共四十九页,编辑于2023年,星期五例题第二十三页,共四十九页,编辑于2023年,星期五1、建立数据文件SPSS操作分析步骤如下建立两个变量:X变量:年龄,数值型Y变量:尿肌酸含量,数值型第二十四页,共四十九页,编辑于2023年,星期五2、统计分析(1)散点图的制作

graphscattersimple第二十五页,共四十九页,编辑于2023年,星期五通过散点图可看出两个变量间有直线趋势,可作两因素线关分析。第二十六页,共四十九页,编辑于2023年,星期五(2)直线回归分析操作

analyzeregressionLinearregression主对话框①菜单选择第二十七页,共四十九页,编辑于2023年,星期五第二十八页,共四十九页,编辑于2023年,星期五第二十九页,共四十九页,编辑于2023年,星期五第三十页,共四十九页,编辑于2023年,星期五第三十一页,共四十九页,编辑于2023年,星期五第三十二页,共四十九页,编辑于2023年,星期五SPSS程序③主要输出结果及解释第三十三页,共四十九页,编辑于2023年,星期五第三十四页,共四十九页,编辑于2023年,星期五决定系数(R2)在直线回归与相关中一个重要的统计量,是指回归平方和与总平方和之比,用R2表示其计算公式为:R2取值在0和1之间且无单位,其数值大小反映了回归贡献的相对程度,也就是在Y的总变异中回归关系所能解释的百分比。如本例R2=0.7775,表示年龄可解释尿肌酐含量变异性的77.75%,另外约22%的变异不能用年龄来解释。第三十五页,共四十九页,编辑于2023年,星期五第三十六页,共四十九页,编辑于2023年,星期五练习题第三十七页,共四十九页,编辑于2023年,星期五第三节曲线拟合适用于两变量间关系为非直线形式,可以通过曲线拟合方法来刻画两变量间数量上的依存关系。毒理学动物试验中动物死亡率与给药剂量的关系、细菌繁殖与培养时间的关系等情况。第三十八页,共四十九页,编辑于2023年,星期五例题第三十九页,共四十九页,编辑于2023年,星期五1、建立数据文件SPSS操作分析步骤如下建立两个变量:X变量:住院天数,数值型Y变量:预后指数,数值型第四十页,共四十九页,编辑于2023年,星期五2、统计分析(1)散点图的制作

graphscattersimple第四十一页,共四十九页,编辑于2023年,星期五通过散点图可看出两个变量间不具有直线趋势而是有曲线趋势,可通过曲线拟合方法来刻画两变量间数量上的依存关系。第四十二页,共四十九页,编辑于2023年,星期五(2)曲线拟合的菜单操作

analyzeregressionCurveestimation主对话框第四十三页,共四十九页,编辑于2023年,星期五第四十四页,共四十九页,编辑于2023年,星期五(3)SPSS程序

第四十五页,共四十九页,编辑于20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论