版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1第六章相关与回归分析2一、确定现象之间有无关系存在,以及相关关系的表现形式二、确定相关关系的密切程度三、确定相关关系的数学表达式四、测定因变量估计值与实际值之间的误差程度3第一节相关分析一、确定现象之间有无关系存在(一)现象之间关系的分类4
1、函数关系客观现象之间确实存在的、而且数量表现上是严格的确定性的依存关系。在这种关系中,某一变量的的每一个数值,都有另一个变量的确定值与之对应,并且这种关系可以用一个数学表达式反映出来。
5
xy是一一对应的确定关系设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,
y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量各观测点落在一条线上6圆的面积(S)与半径之间的函数关系
S=
R2
里程(D)与速度(V)、时间(t)之间的关系
D=Vt企业的原材料消耗额(y)与产量(x1)
、单位产量消耗(x2)
、原材料价格(x3)之间的关系
y=x1x2x3
72、相关关系客观现象之间确实存在的、但在数量表现上不严格对应的依存关系。两个要点:
(1)确实存在——定性分析(2)数量表现上不严格——围绕它们的平均数并通过一定的规律变动
8变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个值时,变量y的取值可能有几个各观测点分布在直线周围
xy9单位成本(y)与产量(x)的关系……父亲身高(y)与子女身高(x)之间的关系社会商品零售额(y)与居民会支配收入(x)之间的关系收入(y)与文化程度(x)之间的关系商品销售量(y)与广告费支出(x1)、价格(x2)之间的关系103、相关关系与函数关系的联系和区别
主要区别:随着某一变量变化的另一变量,其数值是否确定,如果确定,则是函数关系,如果不确定,则是相关关系。主要联系:函数关系往往通过相关关系表现出来,相关关系常常要用函数关系来研究。11假相关没有本质联系,只是表面数字的偶然的巧合;如上证股票价格综合指数与气温的关系。因果关系原因与结果之间、影响因素与被影响因素之间的关系。相关关系比因果关系包括的范围更广泛。即,因果关系属于相关关系,但相关关系不一定是因果关系。统计只能说明现象间有无数量上的关系,不能说明谁因谁果(其它有关概念)12(二)相关关系的种类13二、相关关系的测定进行相关分析的一般程序:相关表和相关图定性分析定量分析计算相关系数和判定系数相关分析的主要内容:测定相关关系的种类和关系的密切程度14(一)相关表和相关图能源消耗量与工业总产值相关表:15能源消耗量与工业总产值相关图16线性正相关
完全线性负相关
完全线性正相关线性负相关
曲线相关
不相关(零相关)17(二)直线相关的测定
相关系数——反映具有直线相关关系的两个变量之间关系密切程度的指标。
判定系数——相关系数的平方相关系数与判定系数1819对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数若相关系数是根据总体全部数据计算的,称为总体相关系数,记为
若是根据样本数据计算的,则称为样本相关系数,记为r1、相关系数
(correlationcoefficient)202122…………(1)
…………….…..(2)
…….…(3)
235幢房屋的使用时间长短与月租金的资料2425直线相关的特点
①两个变量是对等的;②只能计算出一个相关系数;
低度线性相关
显著线性相关
高度线性相关③相关系数可以为正数,也可以为负数,表示正相关或负相关;④计算相关系数要求两个变量必须是随机的。262、判定系数
相关系数的平方计算判定系数,用R表示。在经济计量学中又称可决系数273、计算t值并查表确定临界值,比较并作结论1、提出零假设与备择假设2、确定检验所需的统计量
(三)相关系数的显著性检验
——t检验28
拒绝原假设,说明房屋使用年限与租金之间有显著的线性关系29第二节一元线性回归分析一、回归分析
1、概念
借助数学方程,揭示具有相关关系的变量之间数量变化规律的方法,称为回归分析法;回归分析中的数学方程称为回归方程。
数量变化规律指,当自变量发生变化时,平均说来因变量会发生多大的变化。2、回归分析与相关分析的关系(1)共同点:都是分析相关关系;相关系数与回归系数符号相同。
30(2)区别
回归分析相关分析3、揭示自变量的变化将引起因变量多大的平均变化量,并据此对因变量进行预测和估计
1、不必区分自变量和因变量;1、必须区分自变量和因变量,原因是自变量(解释变量),结果是因变量(被解释变量);2、两个变量是对等的,都是随机变量;2、自变量是可控、给定的一般变量;3、测定相关的种类和关系密切程31(三)回归的种类32二、一元线性回归方程的确定(一)
步骤关系密切程度分析;定性分析——确定现象之间是否有相关关系;确定自变量和因变量;确定回归方程;分析解释结果。33(二)一元线性回归方程的确定1、总体回归方程(PRF)
假设两个具有线性相关关系的现象X和Y,X表示自变量(解释变量)、Y表示因变量(被解释变量),则Y与X的关系可用下面模型表达:
34其中
部分表示X与Y的线性关系,是X对Y所作出的解释;
是随机变量,表示其他因素(包括随机因素、偶然因素)对Y的变化所作出的解释。
35理论假定:
满足零均值齐方差条件,即
36误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的x值,y的期望值为E(y)=+
x对于所有的x值,ε的方差σ2
都相同误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N(0,σ2)独立性意味着对于一个特定的x值,它所对应的ε与其他x值所对应的ε不相关对于一个特定的x值,它所对应的y值与其他x所对应的y值也不相关一元线性回归模型
(基本假定)3738总体线性回归方程(PRF)
39描述y的平均值或期望值如何依赖于x的方程称为回归方程一元线性回归方程的形式如下
方程的图示是一条直线,也称为直线回归方程
是回归直线在y轴上的截距,是当x=0时y的期望值
是直线的斜率,称为回归系数,表示当x每变动一个单位时,y的平均变动值402、样本回归直线方程
①
对于线性相关关系的两个现象一般情况下我们得不到
和
,也就得不到上述总体回归方程,我们只能利用一段时间的样本数据来估计
和
,相应的得到样本回归方程(SRF)。41
——因变量的估计值(回归理论值)a——截距,表示除x外其它因素对因变量y的平均影响b——回归系数(斜率),表示自变量x每变动一个单位时,因变量y平均变动b个单位42②样本回归方程参数ab的确定最小二乘法(OLS)
43x
(xi,yi)
y观察点与样本回归线(图示)44估计参数的最小二乘法
(LeastSquareMethod)最小平方法——也称为最小二乘法使因变量的观察值与估计值之间的离差平方和达到最小来求得a和b的方法,即满足下列条件:即:45a
和b
的计算公式根据最小平方法的原则,利用微分求解极值(最优值)的原理,可得求解a
和b
的标准方程组如下:X的总和?464748房屋租金的线性回归方程为:回归方程中参数估计值的含义:
回归系数
b=-2.4658,表示房屋的使用年数每增加1单位(年),房屋的租金平均减少2.4658单位(元);
回归系数与相关系数同号
截距a=58.2743,表示新房屋时,租金平均为58.2743(元)。49几点说明:
1样本回归直线必然通过数据散点中心
2回归系数与相关系数的符号取决于的xy的协方差
3回归系数与相关系数的关系
50三、回归估计标准差——回归估计精度的测定指标(一)回归估计标准差的概念
在大样本条件下
51
该指标的作用:回归估计标准差反映的是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值的代表性的强弱,其值越小,估计值(或回归方程)的代表性越强,用回归方程估计或预测的结果越准确。52
(小样本)(大样本)
53(二)回归估计标准差与相关系数的关系
54
总离差平方和SST回归平方和SSR剩余平方和SSE+=55离差平方和的分解
(三个平方和的意义)总平方和(SST)反映因变量的n个观察值与其均值的总离差回归平方和(SSR)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和残差平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和56判定系数:57判定系数是相关系数的平方5859回归估计标准差与相关系数的关系60
直接说明关系密切程度
直接说明回归估计的精确程度间接说明回归估计的精确程度
间接说明关系密切程度61第三节线性相关关系的显著性检验及回归预测一、根据样本相关系数进行检验——t检验二、根据回归分析的结果进行检验
——F检验——t检验62一、根据样本相关系数进行检验—t检验H0:
ρ=0;H1:ρ≠0根据样本相关系数r的抽样分布构建的检验统计量(在H0成立的前提下服从自由度为(n-2)的t分布)为:若或P值≤α,应否定H0
,表明两个变量间存在显著的线性相关性。631.回归系数的显著性检验—t检验H0:bi
=0(x与y之间没有线性关系)H1:bi
0(x与y之间存在线性关系)采用t检验法(检验统计量在H0成立的前提下服从自由度为(n-2)的t分布)。二、根据回归分析的结果进行检验64回归系数的显著性检验
(Excel输出的结果)回归方程参数估计值回归系数的t检验统计值回归系数检验的P值
Coefficients标准误差tStatP-valueIntercept58.27435.334710.92360.001642X-2.46580.7590-3.24870.0475465H0:b=0(x与y之间没有线性关系)H1:b
0(x与y之间存在线性关系)检验统计量F2.回归方程的显著性检验—F检验确定显著性水平
,找出临界值F
(1,n-2);计算统计量的样本观察值或P值;作出决策:若F
F
或P值<,拒绝H066回归方程的检验
(Excel输出的结果)67F检验与t检验的一致性在一元线性回归中,回归方程显著,就等于回归系数显著:F=t2对回归系数的
t检验:H0:
=0(X与Y的线性关系不显著);H1
:
0(X
与Y的线性关系显著)对回归方程的F
检验:H0:
=0(X
与Y的线性关系不显著);H1
:
0(X与Y的线性关系显著)68F检验与t检验的不一致性在多元回归中,回归方程显著,不等于每个回归系数都显著.对回归系数的
t检验:H0:
i=0(Xi与Y的线性关系不显著);H1
:
i0(Xi与Y的线性关系显著)对回归方程的F
检验:H0:
1=
2=…=
K=0(所有Xi与Y的线性关系都不显著);H1
:
i
不全为0(至少有一个X与Y的线性关系显著)69三、回归预测回归预测是根据自变量x
的取值来估计或预测因变量y的取值;估计或预测的类型点估计,给定x=xo,因变量y对应的点估计为:区间估计:70区间预测对于自变量x的一定值x0
,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北省武汉市(2024年-2025年小学五年级语文)统编版小升初真题(下学期)试卷及答案
- 高中化学 第四章 非金属及其化合物教案及练习 新人教版必修
- 购买课件分享教学课件
- 高二物理全套教案(上学期)人教大纲版,从第16单元到第31单元成套
- DB11T 1080-2014 硬泡聚氨酯复合板现抹轻质砂浆外墙外保温工程施工技术规程
- 河南省驻马店市上蔡县2023-2024学年五年级上学期期中英语试卷
- 山西省吕梁市交城县2024-2025学年七年级上学期期中考试生物学试题(含答案)
- 便鞋市场发展预测和趋势分析
- 婴儿服装市场需求与消费特点分析
- 护肤药剂产业规划专项研究报告
- 数学文化 课件 2-中国古代数学与九章算术
- W -S-T 442-2024 临床实验室生物安全指南(正式版)
- 第七章课程概述
- 培育发展新质生产力宣讲稿
- 宪法学 形考作业2答卷
- 2024《公共基础知识必刷300题》题库带答案(轻巧夺冠)
- 创新设计前沿-知到答案、智慧树答案
- 防止传销进校园主题班会省公开课一等奖全国示范课微课金奖课件
- 人力资源外包投标方案
- MOOC 模拟电子电路-杭州电子科技大学 中国大学慕课答案
- 基于人工智能的文化遗产保护与传承策略
评论
0/150
提交评论