版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于相关和回归分析第1页,共67页,2022年,5月20日,13点31分,星期五2022/11/82
相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。第2页,共67页,2022年,5月20日,13点31分,星期五2022/11/83本章学习目的1.理解相关的意义、主要形式、以及相关分析的基本内容。2.掌握相关系数的设计原理,以及相关关系显著性检验。3.回归和相关的区别和联系4.普通最小二乘法的原理以及回归参数的意义。5.估计标准误差的分析等。第3页,共67页,2022年,5月20日,13点31分,星期五2022/11/84
第一节相关的意义和种类一、问题的提出二、相关关系的概念三、相关关系的种类四、相关关系的主要内容第4页,共67页,2022年,5月20日,13点31分,星期五2022/11/85一、问题的提出相关第5页,共67页,2022年,5月20日,13点31分,星期五2022/11/86蝴蝶翅膀振动候鸟迁徙海啸死亡人数correlation?第6页,共67页,2022年,5月20日,13点31分,星期五2022/11/87一、相关关系的概念
客观现象之间的数量联系存在着两种不同的类型:
函数关系和相关关系函数关系:即当一个(或一组)变量每取一个值时,相应的另一个变量必然有一个确定值与之对应。
第7页,共67页,2022年,5月20日,13点31分,星期五2022/11/88(函数关系)(1)是一一对应的确定关系(2)设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x
,当变量x取某个数值时,
y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量(3)各观测点落在一条线上
xy第8页,共67页,2022年,5月20日,13点31分,星期五2022/11/89自变量与因变量如果变量之间有因果关系,那么原因变量就叫作自变量,而受自变量影响的变量就称因变量。自变量通常发生在因变量之前。(不是所有先发生的变量都是自变量)一般自变量记为X,因变量记为Y。第9页,共67页,2022年,5月20日,13点31分,星期五2022/11/810【例】(1)某种商品的销售额(y)与销售量(x)之间的关系可表示为y=px(p为单价)(2)圆的面积(S)与半径之间的关系可表示为
S=R2(3)企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1x2x3
第10页,共67页,2022年,5月20日,13点31分,星期五2022/11/811相关关系(correlationanalysis):相关关系:变量之间存在有依存关系,但这种关系是不完全确定的随机关系,即当一个(或一组)变量每取一个值时,相应的另一个变量可能有多个不同值与之对应。第11页,共67页,2022年,5月20日,13点31分,星期五2022/11/812第12页,共67页,2022年,5月20日,13点31分,星期五2022/11/813
因果关系相关关系互为因果关系共变关系随机性依存关系确定性依存关系函数关系变量之间关系第13页,共67页,2022年,5月20日,13点31分,星期五2022/11/814
相关关系(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量x取某个值时,变量y的取值可能有几个;(4)各观测点分布在直线周围。xy第14页,共67页,2022年,5月20日,13点31分,星期五2022/11/815【例】商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父母亲身高(y)与子女身高(x)之间的关系身高与体重的关系第15页,共67页,2022年,5月20日,13点31分,星期五2022/11/816相关关系与函数关系的关系:在一定的条件下互相转化.
具有函数关系的变量,当存在观测误差和随机因素影响时,其函数关系往往以相关的形式表现出来.
而具有相关关系的变量之间的联系,如果我们对它们有了深刻的规律性认识,并且能够把影响因变量变动的因素全部纳入方程,这时相关关系也可转化为函数关系.另外,相关关系也具有某种变动规律,所以,相关关系也经常可以用一定的函数形式去近似地描述.第16页,共67页,2022年,5月20日,13点31分,星期五2022/11/817二、相关关系的种类1.按相关的程度分:完全相关不完全相关
不相关(或零相关)例:完全相关:在价格P不变的情况下,销售收入Y与销售量X
的关系;
不相关:股票价格的高低与气温的高低是不相关的;第17页,共67页,2022年,5月20日,13点31分,星期五2022/11/8182.按相关的方向分:正相关负相关正相关:两个变量之间的变化方向一致,都是增长趋势或下降趋势。
例:收入与消费的关系;
工人的工资随劳动生产率的提高而提高。负相关:两个变量变化趋势相反,一个下降而另一个上升,或一个上升而另一个下降。
例:物价与消费的关系;
商品流转的规模愈大,流通费用水平则越低。第18页,共67页,2022年,5月20日,13点31分,星期五2022/11/8193.按相关的形式分:线性相关非线性相关
线性相关(直线相关):当一个变量每变动一个单位时,另一个变量按一个大致固定的增(减)量变动。例:人均消费水平与人均收入水平非线性相关(曲线相关):当一个变量变动时,另一个变量也相应发生变动,但这种变动是不均等的。例:产品的平均成本与总产量;
农产量与施肥量.第19页,共67页,2022年,5月20日,13点31分,星期五2022/11/8204.按相关的影响因素多少分:单相关复相关偏相关单相关(一元相关):只有一个自变量。复相关(多元相关):有两个及两个以上的自变量。如:居民的收入与储蓄额;成本与产量如:某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。第20页,共67页,2022年,5月20日,13点31分,星期五2022/11/821
偏相关:
在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为偏相关。
如:
在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。第21页,共67页,2022年,5月20日,13点31分,星期五2022/11/822不相关负线性相关正线性相关非线性相关完全负线性相关完全正线性相关
图示第22页,共67页,2022年,5月20日,13点31分,星期五2022/11/823第二节相关图表和相关系数一、相关表和相关图二、简单相关系数第23页,共67页,2022年,5月20日,13点31分,星期五2022/11/824
相关分析:就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。第24页,共67页,2022年,5月20日,13点31分,星期五2022/11/825定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。相关关系的判断第25页,共67页,2022年,5月20日,13点31分,星期五2022/11/826一、相关表和相关图
相关表和相关图是研究相关关系的直观工具,在进行详细的定量分析之前,可以先利用它们对现象之间存在的相关关系的方向、形式、和密切程度作大致的判断。第26页,共67页,2022年,5月20日,13点31分,星期五简单相关表:将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。消费支出y15203040425360657870可支配收入x18254560627588929899居民消费和收入的相关表单位:百元第27页,共67页,2022年,5月20日,13点31分,星期五2022/11/828
相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。例:第28页,共67页,2022年,5月20日,13点31分,星期五2022/11/829二、简单相关系数(一)简单相关系数的概念是度量两个变量之间线性相关密切程度和相关方向的统计指标。包括简单相关系数、复相关系数、偏相关系数、曲线相关系数(相关指数).简单相关系数又称皮尔逊(1890年,英国)相关系数,或积矩相关系数或动差相关系数。若相关系数是根据总体全部数据计算的,称为总体
相关系数,记为.若是根据样本数据计算的,则称为样本相关系数,记为r.样本相关系数是总体相关系数的一致估计量.
第29页,共67页,2022年,5月20日,13点31分,星期五2022/11/830
样本简单相关系数的计算公式(积差法)(二)简单相关系数的计算公式式中:(1)1.用计算器计算协方差Sxy第30页,共67页,2022年,5月20日,13点31分,星期五2022/11/831(1)式可化简为如下公式:或:第31页,共67页,2022年,5月20日,13点31分,星期五2022/11/832㈡用计算机计算⒈选取“工具”-“数据分析”⒉选“相关系数”⒊选“确定”⒋输入“输入区域”⒌输入“输出区域”⒍在“分组方式”中选“逐列”⒎选“标志位于第一行”⒏确定出现结果如下:第32页,共67页,2022年,5月20日,13点31分,星期五2022/11/8331.r
的取值范围是[-1,1]|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负相关
2.r=0,不存在线性相关关系
3.-1r<0,为负相关
4.0<r1,为正相关
5.|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切相关系数取值及其意义第33页,共67页,2022年,5月20日,13点31分,星期五2022/11/834r的范围在0.1-0.3是微弱相关r的范围在0.3-0.5是低度相关;r的范围在0.5-0.8是显著相关;r的范围在0.8以上是高度相关.第34页,共67页,2022年,5月20日,13点31分,星期五2022/11/835-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加第35页,共67页,2022年,5月20日,13点31分,星期五2022/11/836【例1】在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们收集到1995~2007年的样本数据(xi
,yi),i=1,2,…,13,数据见表1,计算相关系数。
表1我国人均国民收入与人均消费金额数据单位:元年份人均国民收入人均消费金额年份人均国民收入人均消费金额1999200020012002200320042005393.8419.14460.86544.11668.29737.73859.972492672893294064515132006200720082009201020111068.81169.21250.71429.51725.92099.56436907138039471148第36页,共67页,2022年,5月20日,13点31分,星期五2022/11/837
解:根据样本相关系数的计算公式有人均国民收入与人均消费金额之间的相关系数为0.9987第37页,共67页,2022年,5月20日,13点31分,星期五2022/11/838【例2】计算人均可支配收入和消费支出之间的简单相关系数。第38页,共67页,2022年,5月20日,13点31分,星期五解:由表中数据得:∑y=473,∑x=662,∑y2
=26507,∑x2
=51656,∑xy=36933,n=10计算得人均可支配收入和消费支出间的简单相关系数为:第39页,共67页,2022年,5月20日,13点31分,星期五2022/11/840
第三节一元线性回归分析一、回归分析概念二、回归分析的种类三、一元线性回归分析第40页,共67页,2022年,5月20日,13点31分,星期五2022/11/841回归方程一词是怎么来的第41页,共67页,2022年,5月20日,13点31分,星期五2022/11/842一、回归分析的概念
是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。第42页,共67页,2022年,5月20日,13点31分,星期五2022/11/843二、回归分析的内容从一组样本数据出发,确定变量之间的数学关系式。对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。第43页,共67页,2022年,5月20日,13点31分,星期五2022/11/844回归分析和相关分析的区别:相关分析中,变量x
变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化.相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x则作为研究时给定的非随机变量。相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制第44页,共67页,2022年,5月20日,13点31分,星期五2022/11/845相关分析与回归分析的联系相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。简单说:1、相关分析是回归分析的基础和前提;
2、回归分析是相关分析的深入和继续。第45页,共67页,2022年,5月20日,13点31分,星期五2022/11/846三、回归分析的种类1.按自变量的个数分:一元回归多元回归2.按回归方程的形式分:线性回归非线性回归本章主要介绍一元线性回归。第46页,共67页,2022年,5月20日,13点31分,星期五2022/11/847四、一元线性回归分析(一)一元线性回归方程当只涉及一个自变量时称为一元回归,若因变量y与自变量x之间为线性关系时称为一元线性回归。2、对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系。3、描述因变量y如何依赖于自变量x和误差项
的方程称为回归模型。第47页,共67页,2022年,5月20日,13点31分,星期五2022/11/848注意:⑴在两个变量之间,必须确定哪个是自变量,哪个是因变量⑵回归方程的主要作用是用自变量来推算因变量。第48页,共67页,2022年,5月20日,13点31分,星期五2022/11/849
回归模型的表达式如下:Y=a
+
X+e1、模型中,y是x的线性函数(部分)加上随机误差项2、线性部分反映了由于x的变化而引起的y的变化,是Y的数学期望,即对应于X某一取值时Y的平均值:第49页,共67页,2022年,5月20日,13点31分,星期五2022/11/8503、随机误差项(随机干扰项)是随机变量A、反映了除x和y之间的线性关系之外的随机因素对y的影响B、是不能由x和y之间的线性关系所解释的变异性随机误差项是Y与E(Y)的离差:4、和称为模型的参数第50页,共67页,2022年,5月20日,13点31分,星期五2022/11/851总体回归线与随机误差项
XYiY
。。。。。第51页,共67页,2022年,5月20日,13点31分,星期五2022/11/852(二)回归参数的普通最小二乘估计(OLS)
基本原理:
1、使因变量的观察值Y与估计值之间的离差平方和达到最小来求得。即用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。第52页,共67页,2022年,5月20日,13点31分,星期五2022/11/853回归参数推导过程:为使Q达到极小值,则须有:整理得如下标准方程组:第53页,共67页,2022年,5月20日,13点31分,星期五2022/11/854解上述方程组得:其中可变形为:第54页,共67页,2022年,5月20日,13点31分,星期五【例】根据例2(幻灯片38)中数据,拟合人均消费支出对人均可支配收入的回归方程,并指出回归系数的含义。解:∑y=473,∑x=662,∑y2
=26507,∑x2
=51656,∑xy=36933,n=10由表中数据得:所以:所建立的回归方程为:回归系数的含义是:人均可支配收入每增加1元,人均消费支出平均增加0.72元。第55页,共67页,2022年,5月20日,13点31分,星期五2022/11/856根据例1(幻灯片36)中的数据,配合人均消费金额对人均国民收入的回归方程
人均消费金额对人均国民收入的回归方程为:y=54.22286+0.52638x第56页,共67页,2022年,5月20日,13点31分,星期五2022/11/857第57页,共67页,2022年,5月20日,13点31分,星期五2022/11/858相关系数与回归系数的关系第58页,共67页,2022年,5月20日,13点31分,星期五2022/11/859估计标准误差Syx(可说明回归方程的代表程度)实际观察值与回归估计值离差平方和的均方根。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年中国抗皱晚霜行业投资前景及策略咨询研究报告
- 名著导读《海底两万里》课件
- 2024至2030年手机袋项目投资价值分析报告
- 2024至2030年国际象棋盒项目投资价值分析报告
- 初中化学化学式和化合价课件
- 勾股定理的应用课件
- 2024年防水无石棉硅酸镁管壳项目可行性研究报告
- 2024年铂铑合金制品项目可行性研究报告
- 2024年超细球状银粉项目可行性研究报告
- 2024年中国螺旋缝高频焊钢管市场调查研究报告
- 水库清淤施工设计方案
- 麦当劳英文介绍-课件(PPT-精)
- 关于开发建设项目水土保持咨询服务费用计列的指导意见(保监[2005]22号)
- 简易呼吸气囊的使用
- SMT控制计划(中英文)
- 监控系统维保方案
- 《道路勘测设计》试卷及答案Word版
- GB_T 40851-2021 食用调和油(高清-现行)
- 光伏并网调试方案
- XYQ12A中文说明书
- 授权委托书电子版
评论
0/150
提交评论