第九讲 相关分析与回归分析_第1页
第九讲 相关分析与回归分析_第2页
第九讲 相关分析与回归分析_第3页
第九讲 相关分析与回归分析_第4页
第九讲 相关分析与回归分析_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章回归和回归分析

6.1相关分析概述

6.2相关分析

6.3多元线性回归

6.4

曲线回归

6.5逐步回归1.散点图

散点图是描述变量之间关系的一种直观方法。我们用坐标的横轴代表自变量X,纵轴代表因变量Y,每组数据(xi,yi)在坐标系中用一个点表示,由这些点形成的散点图描述了两个变量之间的大致关系,从中可以直观地看出变量之间的关系形态及关系强度。

6.1相关分析概述

图6-1不同形态的散点图

(a)(b)(c)(d)

就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图6-1(a)和(b);如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关;如图6-1(c);如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图6-l(d)。

2.相关系数相关系数是对变量之间关系密切程度的度量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;总体相关系数的计算公式为:其中COV(X,Y)为变量X和Y的协方差,D(X)和D(Y)分别为X和Y的方差。

若相关系数是根据样本数据计算的,则称为样本相关系数(简称为相关系数),记为r。样本相关系数的计算公式为:

一般情况下,总体相关系数ρ是未知的,我们通常是将样本相关系数r作为ρ的近似估计值。相关系数r有如下性质:

1)相关系数的取值范围:–1≤r≤1,若0<r≤1,表明X与Y之间存在正线性相关关系,若–1≤r<0,表明X与Y之间存在负线性相关关系。2)若r=1,表明X与Y之间为完全正线性相关关系;若

r=–1,表明X与Y之间为完全负线性相关关系;若r=0,说明二者之间不存在线性相关关系。

3)当–1<r<1时,为说明两个变量之间的线性关系的密切程度,通常将相关程度分为以下几种情况:当|r|≥0.8时,可视为高度相关;0.5≤|r|<0.8时,可视为中度相关;0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,说明两个变量之间的相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数进行显著性检验的基础之上。3.相关系数的显著性检验相关系数的显著性检验也就是检验总体相关系数是否显著为0,通常采用费歇尔(Fisher)提出的t分布检验,该检验可以用于小样本,也可以用于大样本。检验的具体步骤如下:1)提出假设:假设样本是从一个不相关的总体中随机抽取的,即H0:ρ=0;H1:ρ≠0

2)由样本观测值计算检验统计量:的观测值t0和衡量观测结果极端性的p值:p=P{|t|≥|t0|}=2P{t≥|t0|}3)进行决策:比较p和检验水平

作判断:p<

,拒绝原假设H0;p

,不能拒绝原假设H0。相关分析的实质:反映各变量之间相关密切程度。简单相关:研究两变量直线相关的密切程度和性质,也称直线相关。偏相关:排除其余的影响因子,求出x与y的纯相关,这种相关称偏相关。复相关:研究一个变量与一组变量之间的相关性关系。典型相关:研究两组变量间的相关关系。1简单相关2偏相关3复相关6.2相关分析(AnalysisofCorrelation)1简单相关简单相关:

是对有联系的两类事物(x与y)表面关系密切程度的衡量。(SimpleCorrelation)一、简单相关系数相关系数r(无单位)的取值:即:二、简单相关系数r的显著性测验由d.f=n-2查出相关系数的临界值r0.05、r0.01(degreeoffreedom)SAS直接输出prob>|r|概率值,记为α.统计假设H0:总体相关系数ρ=0若α>0.05,接受H0,相关不显著,即总体x与y间不存在相关关系。若0.01<α<0.05,拒绝H0,相关显著,即总体x与y间存在相关关系。若α<0.01,拒绝H0,相关极显著,即总体x与y间存在相关关系。datali6_1;inputxy@@;cards;778.8647.9…733.5;例6-1橡胶树幼苗期刺检干胶产量(x,毫克)与正式割胶量(y,克)如下表,试求x与y的相关系数并画出y关于x的散点图。xy7764627271837994104966190811228.87.98.97.78.68.19.15.68.57.64.98.112.015.7xy111160188819280631058973130656.515.317.75.910.68.36.08.510.13.511.111.9三、简单相关实例proccorr;varxy;/*求r*/run;procgplot;ploty*x;/*散点图*/run;

PLOT的用法

PLOT<纵轴变量>*<横轴变量>[=<变量>][/<选项>];

表PLOT语句的选项选项意义说明FRAM|NOFRAM在图形四周加入或不加入边框缺省为加入CFRAM=颜色边框内的颜色缺省为白色AUTOHREF(AUTOVEREF)在水平(垂直)轴的每个主刻度处加入水平(垂直)参考线NOAXIS取消坐标轴及相关的图形元素CAXIS=颜色设定轴的颜色CTEXT=颜色设定与轴相关字符的颜色PLOT语句的注意事项PLOT语句用以对两个变量绘制散点图,表达式中位置在前(在乘号“*”之前)的变量作为散点图的y轴,位置在后的变量作为散点图的x轴。

CorrelationAnalysis2'VAR'Variables:XYSimpleStatisticsVariableNMeanStdDevSumX2692.038530.44272393.0000Y269.11153.3269236.9000VariableMinimumMaximumX61.0000188.0000

y3.500017.7000SAS输出结果:

PearsonCorrelationCoefficients/Prob>|R|underHo:Rho=0/N=26

XYX1.000000.710190.00.0001Y0.710191.00000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论