版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章第七章 相关与回归分析相关与回归分析 5/10/2022尚辅网2例子例子:我们身边有趣的经济现象我们身边有趣的经济现象n人们每时每刻都在关心事物之间的关系,人们每时每刻都在关心事物之间的关系,n比如,比如,n几个亲生兄弟间的智商与出生顺序有关系几个亲生兄弟间的智商与出生顺序有关系n受教育程度与性别有关系受教育程度与性别有关系n出生率出生率X和文盲率和文盲率Y之间的关系之间的关系5/10/2022尚辅网3n在这一章,我们将学习:在这一章,我们将学习:n什么是相关分析?什么是相关分析?n什么是回归分析?什么是回归分析?5/10/2022尚辅网4第一节第一节 相关分析概述相关分析概述n一、函数
2、关系与相关关系一、函数关系与相关关系(一)函数关系(一)函数关系n严格的依存关系,即具有确定性的对应关系,严格的依存关系,即具有确定性的对应关系,可用一个数学表达式反映出来。可用一个数学表达式反映出来。n如:如:s s与与r rn销售额与销售量的关系销售额与销售量的关系5/10/2022尚辅网5函数关系函数关系作为影响因素的变量称自变量,用作为影响因素的变量称自变量,用x x表示;表示;发生对应变化的变量称因变量,用发生对应变化的变量称因变量,用y y表示。表示。5/10/2022尚辅网6(二二) 相关关系相关关系n不严格的依存关系不严格的依存关系n不具有确定性的对应关系不具有确定性的对应关系
3、n不能用不能用函数关系精确的表达函数关系精确的表达5/10/2022尚辅网7相关关系相关关系5/10/2022尚辅网8判断函数关系判断函数关系or相关关系相关关系n商品销售额商品销售额(y)(y)与广告费支出与广告费支出(x)(x)之间的关系之间的关系 收入水平收入水平(y)(y)与受教育程度与受教育程度(x)(x)之间的关系之间的关系 商品销售额商品销售额(y)(y)与产量与产量(x)(x)的关系的关系 身高身高(y)(y)与体重与体重(x)(x)5/10/2022尚辅网9二、相关关系的种类二、相关关系的种类n(一)(一)按相关程度分:按相关程度分:1 1、完全相关、完全相关2 2、不相关、
4、不相关3 3、不完全相关、不完全相关不相关不相关不完全相关不完全相关完全相关完全相关5/10/2022尚辅网10(二)按相关的方向分:相关的方向分:n1、正相关:、正相关:x增加,增加,y增加增加 x减少,减少,y减少减少n2、负相关:、负相关:x增加,增加,y减少减少 x减少,减少,y增加增加负相关负相关正相关正相关5/10/2022尚辅网11(三)按相关的形式分n1、线性相关:、线性相关:x,y大致呈直线关系大致呈直线关系n2、非线性相关:、非线性相关:x,y大致呈曲线关系大致呈曲线关系线性相关线性相关非线性相关非线性相关5/10/2022尚辅网12(四)按所研究的变量多少分:n1、单相关
5、:、单相关:x与与y的相关关系的相关关系n2、复相关:、复相关:x,y与与z的相关关系的相关关系5/10/2022尚辅网13第二节第二节 相关关系的判断和测度相关关系的判断和测度n一、定性分析一、定性分析5/10/2022尚辅网141、相关表、相关表判断广告费与年销售收入是否具有相关关系?判断广告费与年销售收入是否具有相关关系?随着广告费的增加,年销售收入基本上也随着广告费的增加,年销售收入基本上也是增加的,所以两者之间存在一的正相关是增加的,所以两者之间存在一的正相关关系。关系。5/10/2022尚辅网152、相关图(散点图)、相关图(散点图)5/10/2022尚辅网16n简单相关系数:简单
6、相关系数:在直线相关条件下,表在直线相关条件下,表明两个现象之间相关关系的方向和密切明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号程度的综合性指标。一般用符号r表示。表示。5/10/2022尚辅网17yxxyr21、相关系数计算、相关系数计算的协方差的协方差与与是变量是变量式中:式中:yxnyiyxixxy,)(2的标准差的标准差是是(xnxixx,)2的标准差的标准差是是ynyiyy,)(222)()(yiyxixyiyxix(5/10/2022尚辅网18化简得:化简得: 2222() )() )nxyxyrnxxnyy 5/10/2022尚辅网195165696045625
7、980184647744384420253600324625y2合计合计10987654321序号序号265076084280949004225360017649001600225400 x266298759992886245601825可支配收入可支配收入y764478528060598065693070397553369334732604421350302400402701550020 xy消费支出消费支出xP190,P190,表表6-16-1,计算消费支出与可支配收入的相关系数,计算消费支出与可支配收入的相关系数5/10/2022尚辅网20解:计算相关系数需算解:计算相关系数需算5个数个
8、数99. 0)6625165610)(4732650710(662473369331022473x662y516562y36933yx265072x说明说明x x与与y y高度线性相关高度线性相关)()()(2222 yynxxnyxxynR5/10/2022尚辅网212 2、相关系数的取值及意义、相关系数的取值及意义正相关正相关yxr,0) 3(完全相关完全相关yxr,1)2(负相关负相关yxr,0 不相关不相关yxr,0 相关程度越高相关程度越高,说明,说明越接近于越接近于yxr,1)4(相关程度越低相关程度越低,说明,说明越接近于越接近于yxr,0 1 , 1) 1 (的取值范围的取值范
9、围r5/10/2022尚辅网222 2、相关系数的取值及意义、相关系数的取值及意义(5)n |0.3称为微弱相关称为微弱相关n0.3 |0.5称为低度相关称为低度相关n0. |0.8称为显著相关称为显著相关n0.8 |1称为高度相关或强相关称为高度相关或强相关5/10/2022尚辅网23判断:判断:n若若r=1,说明什么?,说明什么?n若若r=0.3,说明什么?说明什么?n若若r=-0.9,说明什么?说明什么?nR=0.6与与r=-0.8哪个相关程度更大?哪个相关程度更大?5/10/2022尚辅网24课堂练习课堂练习n计算公司每年的投资和利润的简单相关系数。计算公司每年的投资和利润的简单相关系
10、数。年度年度投资(万元)投资(万元)利润(万元)利润(万元)1382453674720合计合计20405/10/2022尚辅网25Regress“往回走往回走”n高尔顿爵士高尔顿爵士(1822-1911)被誉为现代回归)被誉为现代回归和相关技术的创始人。和相关技术的创始人。n他在研究父母的身高对儿女身高的影响时发他在研究父母的身高对儿女身高的影响时发现,如果父母的身高超出人群身高的平均值,现,如果父母的身高超出人群身高的平均值,儿女的身高通常也会超出人群平均身高,但儿女的身高通常也会超出人群平均身高,但不像父母超出的那么多。高尔顿把这种现象不像父母超出的那么多。高尔顿把这种现象称为称为“向人群
11、平均身高的回归向人群平均身高的回归”。n于是这种说法就被用在这种统计方法上了。于是这种说法就被用在这种统计方法上了。第二节第二节 回归分析回归分析5/10/2022尚辅网26第二节第二节 回归分析回归分析一、回归分析的定义一、回归分析的定义n回归分析中,用来表达回归分析中,用来表达的的数学形式数学形式就叫就叫“模型模型”,也叫,也叫“回归方回归方程程”。如:。如:Y=3+2Xn“回归回归”是一种用模型来是一种用模型来估计或预测估计或预测因变因变量的方法。量的方法。5/10/2022尚辅网27相关与回归分析的区别相关与回归分析的区别1n相关分析相关分析:x与与y之间依存关系的密切程之间依存关系的
12、密切程度,但不能指出度,但不能指出x与与y相互关系的具体形相互关系的具体形式,也无法用式,也无法用x去预测去预测yn回归分析回归分析:通过数学方程来描述:通过数学方程来描述x与与y的的关系,并能写出关系,并能写出x与与y的具体形式,也可的具体形式,也可以用以用x去预测去预测y5/10/2022尚辅网28区别区别2n相关分析中,相关分析中,x与与y都是随机变量,两都是随机变量,两者对等;者对等;n回归分析中,回归分析中, x是确定性变量,是确定性变量,y是随是随机变量或叫因变量,机变量或叫因变量,y处于被解释的地处于被解释的地位。位。5/10/2022尚辅网29两者的联系两者的联系n1 1、相关
13、分析是回归分析的基础和前提、相关分析是回归分析的基础和前提n2 2、回归分析是相关分析的深入和继续、回归分析是相关分析的深入和继续5/10/2022尚辅网30二、回归模型的类型二、回归模型的类型回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性回线性回归归非线性非线性回归回归第三节 一元线性回归分析 一、模型的建立一、模型的建立 1、总体回归模型、总体回归模型 iiiyx 为常数项或截距项,为常数项或截距项, 为斜率系数为斜率系数 , 是随机误差是随机误差项项,又称随机干扰项又称随机干扰项 。模型假设条件模型假设条件:假定假定1:随机误差项的观测值互不相关
14、:随机误差项的观测值互不相关假定假定2:随机误差项的均值为零:随机误差项的均值为零方差为一个不变的常数(等方差假定)方差为一个不变的常数(等方差假定)假定假定3:随机误差项服从正态分布:随机误差项服从正态分布5/10/2022尚辅网32 因变量的估计值;因变量的估计值; x x 自变量;自变量; a a 回归直线在回归直线在y y轴上的截距;轴上的截距; b b 回归直线的斜率,称回归系数回归直线的斜率,称回归系数, , 表明表明x x每增加一个单位,因变量每增加一个单位,因变量y y的的 平均平均变化值变化值 b0b0,x x与与y y为正相关为正相关 b0b0,x x与与y y为负相关为负
15、相关2、样本回归模型、样本回归模型iiyabxy 5/10/2022尚辅网33例如例如:n研究收入(研究收入(x x)对消费()对消费(y y)的)的影响,获得如下的回归模型:影响,获得如下的回归模型:xy75. 04505/10/2022尚辅网34n(1)截矩项,表示当)截矩项,表示当x=0时,时,y的期望值。在的期望值。在这里,它表示平均每人固定的最低消费水平。这里,它表示平均每人固定的最低消费水平。n(2)斜率为)斜率为0.75,表示收入每增加一元,人们,表示收入每增加一元,人们会将其中的会将其中的75%花在消费上。花在消费上。n(3)当月收入为)当月收入为5000元时,消费水平的期望元
16、时,消费水平的期望值为值为4200。但是,实际观察时,对于月收入为。但是,实际观察时,对于月收入为5000元的人群而言,其消费可能为元的人群而言,其消费可能为3200元,元,4200元,元,4600,所以,所以 是估计值或预测值。是估计值或预测值。xy75. 0450y 5/10/2022尚辅网352、模型中参数的确定、模型中参数的确定最小二乘法最小二乘法(ordinary least square)OLS22(y-y)e =miny y/y-y/实实际际值值预预测测值值 估估计计值值 回回归归值值()残残差差 估估计计误误差差5/10/2022尚辅网36bxayx收入收入y消费消费min2y
17、y5/10/2022尚辅网37求偏导数方法,得到以下联立方程组:求偏导数方法,得到以下联立方程组:iixbnay2iiiixbxayx xbyaxxnyxyxnbiiiiii22)(解得5/10/2022尚辅网38建立一元线性回归模型的步骤:建立一元线性回归模型的步骤: 确确定自变量定自变量x x和因变量和因变量y y; 计计算算 代代入公式,先求入公式,先求b b,再求再求a a。iiiiiyxxyx,25/10/2022尚辅网395165696045625980184647744384420253600324625x2合计合计10987654321序号序号66298759992886245
18、601825可支配收入可支配收入764478528060598065693070397553369334732604421350302400402701550020 xy消费支出消费支出P190,P190,表表6-16-1,建立消费支出与可支配收入的回归模型,建立消费支出与可支配收入的回归模型yx5/10/2022尚辅网40 xbay ,建建立立回回归归模模型型消消费费支支出出为为解解:设设可可支支配配收收入入为为yx473,662iiyx36933iiyx516562ix364. 02 .6672. 03 .47xbyaxy72. 0364. 0回归模型为:回归模型为:72. 0662516
19、56104736623693310)(222 iiiiiixxnyxyxnb5/10/2022尚辅网41分析:分析:(25,20)xy72. 0364. 05/10/2022尚辅网42课堂练习:某公司每年的投资和利课堂练习:某公司每年的投资和利润如下润如下计算:建立投资与利润的回归模型计算:建立投资与利润的回归模型 预测当投资为预测当投资为10万元时,利润是多少?万元时,利润是多少?年度年度投资(万元)投资(万元)利润(万元)利润(万元)1382453674720合计合计20405/10/2022尚辅网433、拟合优度检验、拟合优度检验 iiiiyyyyyy222)()()(iiiyyyyyy
20、n(1)判定系数)判定系数5/10/2022尚辅网44第八章第八章 相关与回归分析相关与回归分析yy yy yyyy2()y y2()y y2 ()y y总剩余偏差总剩余偏差总回归偏总回归偏差差总偏差总偏差5/10/2022尚辅网45判定系数测度了回归直线对观测数据的拟合程度判定系数测度了回归直线对观测数据的拟合程度,记为记为22222()()1()()yyyyryyyy 回回归归偏偏差差总总偏偏差差2r 相相关关系系数数r r的的平平方方5/10/2022尚辅网465165696045625980184647744384420253600324625y2合计合计10987654321序号序号
21、265076084280949004225360017649001600225400 x266298759992886245601825可支配收入可支配收入y764478528060598065693070397553369334732604421350302400402701550020 xy消费支出消费支出x表表6-16-1,计算消费支出与可支配收入的相关系数,计算消费支出与可支配收入的相关系数5/10/2022尚辅网47解:计算相关系数解:计算相关系数r99. 0)6625165610)(4732650710(662473369331022说明回归直线的拟合优度很好。说明回归直线的拟合优度很好。2222() )() )nxyxyrnxxnyy 220.990.9801r 5/10/2022尚辅网48(2)估计标准误)估计标准误22()22xyyyyay bxySnn5/10/2022尚辅网49合合计计10109 98 87 76 65 54 43 32 21
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 11017.2-2024额定电压66 kV(Um=72.5 kV)和110 kV(Um=126 kV)交联聚乙烯绝缘电力电缆及其附件第2部分:电缆
- 2024年度云南省高校教师资格证之高等教育法规通关提分题库及完整答案
- 2024年度云南省高校教师资格证之高等教育学全真模拟考试试卷A卷含答案
- 低空经济产业园技术支持体系分析
- 生 物2024-2025学年人教版生物七年级上册期中模拟生物试卷
- 2024年涂镀产品:镀铝锌项目资金需求报告代可行性研究报告
- 2023年复印和胶版印制设备投资申请报告
- 阜阳师范大学《音乐论文写作》2022-2023学年第一学期期末试卷
- 阜阳师范大学《数字信号处理》2021-2022学年第一学期期末试卷
- 大象版小学科学六年级上册全册教案
- 大学动植物检疫考试(习题卷7)
- 译林版九年级上下册英语单词表(含音标)
- 粗粒土大三轴试验记录
- 医疗技术临床应用动态评估制度
- 人教版四年级数学上册练习八课件(含答案)
- 上海市大学生安全教育(2022级)学习通课后章节答案期末考试题库2023年
- 初中数学-相似三角形的性质教学设计学情分析教材分析课后反思
- 部编版语文五年级上册《白鹭》教学设计
- 绘本:让谁先吃好呢
- AUTOCAD完整考试题库388题(含答案)
- 河南省中小学高级教师任职资格评审讲课答辩题目及答案
评论
0/150
提交评论