




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章相关与回归分析
(CorrelationandRegression)060120180施氮量(kgN/ha)2468植物的生长量学习目的1.相关与回归的概念;2.直线相关与直线回归分析;3.多重线性回归分析。学习内容1.直线相关2.秩相关3.直线回归4.曲线回归5.多重线性回归第一节直线相关一、相关关系的概念相关关系变量之间的依存关系确定性、严格的依存关系
函数关系不确定、不规则
的依存关系,宏观关系相关关系的特点:(1)现象之间确实存在数量上的依存关系。(2)现象之间数量上的依存关系不是确定的。
联系(1)本来具有函数关系的变量,当在观测误差时,其函数关系往往以相关的形式表现出来。(2)如果我们对所研究对象有更深入的认识,便可以将影响因素全部纳入方程,使之成为函数关系。相关关系与函数关系存在区别,但在一定的条件下是可以相互转换的。区别:(1)两变量之间的关系是否确定(2)是否可用数学公式表式直线相关又称简单线性相关,是描述两变量间是否有线性关系以及线性关系的方向和密切程度的统计分析方法。直线相关用于双变量正态分布资料,两变量之间的直线相关关系用相关系数来描述。样本相关系数用r表示,总体相关系数用ρ表示。(一)相关关系的种类按相关的程度,可分为完全相关不完全相关不相关正相关负相关线性相关非线性相关单相关复相关按涉及变量的多少,可分为按相关的形式,可分为按相关的方向,可分为按相关的程度按相关程度划分完全相关:当一种现象的数量变化完全由另一个现象的数量变化所确定时,这两种现象间的关系为完全相关。即函数关系。不完全相关:两个现象之间的关系介于完全相关和不相关之间,称为不完全相关。不相关:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。如:股票价格的高低与气温的高低是不相关的。直线相关按相关方向划分正相关:当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为正相关。如工人的工资随劳动生产率的提高而增加。
负相关:当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为负相关。如商品流转的规模越大,流通费用水平则越低。按相关形式划分线性相关:当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关。如人均消费水平与人均收入水平通常呈线性关系。非线性相关:如果两种相关现象之间,并不表现为直线的关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关。如产品的平均成本与产品总产量之间的相关关系就是一种非线性关系。按变量多少划分单相关:一个变量对另一个变量的相关关系,称为单相关。
复相关:当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。如某种商品的需求与其价格水平及人们收入水平之间的相关关系就是一种复相关。
散点图直观的说明直线相关的性质(二)相关系数
定量描述两变量间直线相关方向和密切程度的统计指标。以两变量与各自平均值的离均差为基础。积差相关系数(Product-momentcorrelationcoefficient)Pearson相关系数,相关系数。参数统计。-1≤r≤1符号→相关方向绝对值→密切程度r>0:正相关。r<0:负相关。r=0:零相关。非线性相关or无相关。不服从双变量正态分布→变量变换→正态化→Pearson积差相关系数。二、相关系数的假设检验r估计总体相关系数ρ,当r≠0时,因为存在抽样误差,不能认为ρ≠0,需要检验样本相关关系是否来自ρ=0的总体。相关系数采用t检验方法,df=n-2
三、直线相关分析步骤1.双变量正态性检验:x、y是否满足正态性2.散点图:直线趋势→直线回归、曲线趋势→曲线方程。3.计算r:4.r的假设检验:四、注意事项1.选择合适的回归模型:在计算相关系数之前先用散点图观察两变量之间是否有线性联系,曲线联系时不能用直线相关分析。2.X,Y中任意一个变量的数值是认为选定时不应作直线相关分析。3.做相关分析时,要剔除异常点(离群值)4.专业上要有意义:两变量相关并不代表两变量之间一定存在内在联系,如儿童身高与小树树高计算得的相关系数。5.分层资料不要盲目合并作直线相关分析:如不同年龄人群体重与年龄的关系,以自变量的观测范围为限,随意外延。表9-1某地10名三岁儿童的体重与体表面积数据P111【SPSS操作】以“(胰岛素)”、“(血糖)”为变量名,建立2列20行数据集li0601.sav。
(1)正态性检验:Analyze
→
DescriptiveStatistics→explore
→胰岛素、血糖入Dependentvariable→plots→Nomalityplotswithtests
→OK(2)作散点图:Graphs(绘图)→LegacyDialogs→Scatter/Dot(散点图)→SimpleScatter→Define,“血糖”→YAxis(轴)框,“胰岛素”→XAxis(轴)框,→OK。(3)线性相关
Analyze→Correlate→Bivariate,血糖”与“胰岛素”→Variables→Pearson→Two-tailed→OK。第二节
等级相关(秩相关)
等级相关是一种非参数统计的方法。条件:①双变量中的一个或两个不服从正态分布;②总体分布类型不知;③用等级或相对数表示的资料;④数据一端或两端有不确定值。方法:Kendall法:等级相关系数rkSpearman法:等级相关系数rsrk和rs的取值范围和意义同r,都需进行检验。取值范围都在-1到1之间。需要做总体相关系数等于0的假设检验。等级相关系数的假设检验用z检验。P112【SPSS操作】以“血小板数”和“出血症状”为变量名,建立2列12行数据集li0602.sav。
Analyze→Correlate→Bivariate,“血小板数”、“出血症状”→Variables框,在CorrelationCoefficients选项下选择复选框Spearman,在TestofSignificance下选中Two-tailed→OK。
第三节直线回归
对具有高度相关关系的现象,根据其相关的形态,建立一个适宜的数学模型(回归方程),来近似地反映变量之间的一般变化关系,利用所建立的数学模型进行估计和预测,这个数学模型就是回归方程。自变量与因变量在回归分析中,需要搞清是哪一个变量的变动影响另一个变量的变动,即分清自变量和因变量。起影响作用的变量叫自变量,用X表示;由于自变量的变动而发生对应变化的变量叫因变量,用Y表示。研究一个自变量与一个因变量,且这两个变量之间呈直线关系的回归分析成为直线回归分析。研究多个自变量与一个因变量,且这些变量之间呈直线关系的回归分析成为多重线性回归分析。相关分析与回归分析相关分析就是用一个指标来表明现象间相互依存关系的密切程度。回归分析就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。
区别
①相关分析所研究的变量是对等关系;回归分析所研究的两个变量不是对等关系。②对两个变量来说,相关分析只能计算出一个相关系数,而回归分析,可分别建立两个不同的回归方程。③相关分析要求两个变量都必须是随机的,而回归分析的要求,自变量是给定的,因变量是随机的。一、直线回归的模型
一元线性回归模型是最简单的回归模型,又称为简单线性回归或简单回归:只有一个自变量的直线回归。在一元线性回归模型中,X为可以精确测定和控制的变量,且当X取得某确定值时,对应的Y值相互独立,服从正态分布。图6-8简单线性回归统计学模型μy=α+βx总体回归方程样本直线回归方程
a:截距(intercept)。b:斜率(slope),回归系数
x每改变1个单位时y平均改变b个单位。b>0表示自变量↑应变量↑,直线上升。│b│↑→越陡→y随x变化率大。b=0,表示回归直线与X轴平行,即X与Y无直线关系。二、直线回归分析的应用条件:1、XY具有线性相关关系2、对于每一个确定的X,相应的Y值间独立3、Y值具有正态性。4、对于任意一组自变量值,因变量Y具有相同的方差三、直线回归方程的建立、检验与应用
1.建立:最小二乘法原则,使各个实测点到回归直线纵向距离的平方和最小。a,b的计算公式由此推导出来。
2.应用:在样本数据范围内。3.检验:用样本数据建立的直线回归方程是样本方程,样本方程是否能在总体上反
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2 落花生 教学设计-2024-2025学年统编版语文五年级上册
- 5小小的船 教学设计-2024-2025学年语文一年级上册统编版
- 8 匆匆 教学设计-2023-2024学年语文六年级下册统编版
- 演出策划服务合同合同范本
- 工程伤亡合同范本
- 4 田家四季歌(教学设计)2024-2025学年统编版语文二年级上册
- 酒店出租专车合同范本
- Module 5 Museums Unit 3 教学设计 2024-2025学年外研版九年级英语上册
- 5《应对自然灾害》(教学设计)2023-2024学年统编版道德与法治六年级下册
- 2 空气能占据空间吗 教学设计-2024-2025学年科学三年级上册教科版
- 苏科版六年级下册《劳动》全一册全部公开课PPT课件(共9课)
- 小学英语外研版(三起点)四年级下册全册课文翻译(1-10模块)
- WS 400-2023 血液运输标准
- 银行业金融机构监管数据标准化规范(2021版)数据结构一览表
- 电子商务基础与实务(第四版)高职PPT完整全套教学课件
- 信息论与编码(第4版)完整全套课件
- 施工吊篮工程监理实施细则
- 自动扶梯与自动人行道调试作业指导书(通用版)
- 2023年全国卷英语甲卷讲评课件-2024届高考英语复习
- 《战胜抑郁 走出抑郁症的30天自我康复训练》读书笔记思维导图
- 幼儿园课件:时钟国王
评论
0/150
提交评论