




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章相关分析与回归分析§6.1相关分析与回归分析概述§6.2线性回归分析一、变量间的相互关系二、相关关系的种类三、相关表和相关图四、相关系数五、相关分析与回归分析§6.1相关分析与回归分析概述返回一、变量间的相互关系(一)函数关系(二)相关关系(三)相关关系与函数关系的关系返回函数关系指变量之间具有的严格的确定性的依存关系。函数关系可以用一个数学表达式来表示。相关关系指客观现象间确实存在,但数量上不是严格对应的依存关系。如:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。相关关系与函数关系的关系区别(1)函数关系——完全确定的关系;相关关系——不完全确定的关系。(2)函数关系——可以用数学公式准确表达;相关关系——不能用一定的方程准确表达。联系(1)有函数关系的变量间,由于有测量误差及各种随机因素的干扰,可表现为相关关系;(2)对具有相关关系的变量有深刻了解之后,相关关系有可能转化为或借助函数关系来描述。二、相关关系的种类(一)按相关的程度不同,分为完全相关、不相关和不完全相关
(二)按相关的形式不同,分为线性相关与非线性相关(三)按相关的性质不同,分为正相关和负相关(四)按相关关系所涉及因素的多少,分为单相关、复相关和偏相关返回完全相关
一个变量的变量值完全由另一个或另一组变量值所决定。
不相关
两个变量的变量值互不影响,其数量变化各自独立。
不完全相关
两个现象之间的关系介于完全相关和不相关之间。线性相关
当一个变量变动时,另一个变量也相应发生大致均等的变动。非线性相关
当一个变量变动时,另一个变量也相应发生变动,但这种变动是不均等的。正相关两个变量之间的变化方向一致。
负相关两个变量变化趋势相反。单相关两个变量之间的相关关系。复相关三个或三个以上变量之间的相关关系。偏相关在某一变量与多个变量相关时,当假定其他变量不变,其中两个变量之间的相关关系。三、相关表和相关图将某一变量x按其数值大小顺序排列,然后再将与其相关的另一个变量y对应值平行排列,观察x由小到大变化时,y的变化情况。相关表企业编号月产量(千吨)X生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用正相关负相关曲线相关不相关xyxyxyxy又称散点图,用直角坐标系的横轴代表变量x,纵轴代表变量y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。相关图返回测定两个变量之间线性相关的密切程度和相关方向的统计指标,用r表示。简单相关系数四、相关系数以两个变量与各自均值的离差为基础,通过两个离差相乘来反映变量之间相关程度。
(一)积差法基本公式其中,为x和y的协方差;为x的标准差;为y的标准差;1、协方差的意义
协方差反映了两个变量x和y的共变性。说明x和y的变动方向相同;说明x和y的变动方向相反;说明x和y的共变性平均来说是均衡的。xy0ⅠⅡⅢⅣ+++++---+---则r>0,说明x和y之间为正线性相关;则r<0,说明x和y之间为负线性相关;则r=0,说明x和y之间不存在线性相关。⑴实现指标的无量纲化。⑵将相关系数的取值范围控制在-1与+1之间。2、标准差和的作用
(二)简便计算公式-1≤r≤1r>0为正相关,r<0为负相关;|r|=0表示不存在线性关系;|r|=1表示完全线性相关;|r|→1,说明x与y线性相关度越高;|r|→0,说明x与y线性相关度越低。(三)相关系数相关程度0<|r|<1表示存在不同程度线性相关:|r|
<
0.3微弱线性相关;0.3≤|r|<0.5低度线性相关;0.5≤|r|<0.8显著线性相关;0.8≤|r|<1.0高度线性相关。例:江苏省历年GDP与海洋产业总产值资料如下:试计算简单相关系数,并说明两变量相关的密切程度。
年份江苏省GDP(亿元)X江苏省海洋产业总产值(亿元)Y19987199.95171.2419997697.82142.4620008582.73146.0420019514.60171.98200210631.75211.54200312460.83453.61200415403.17565.22200518305.66739.58200621645.081287.0200725741.151873.5解:说明江苏省海洋产业总产值和江苏省地区经济之间存在正的高度线性相关关系。
返回五、相关分析与回归分析
用相关图表和相关系数研究两个或两个以上变量之间相关程度的方法。
相关分析回归分析对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。
回归分析与相关分析理论和方法具有一致性;无相关就无回归,相关程度越高,回归越好;
相关系数和回归系数方向一致,可以互相推算。联系:相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;相关分析中x、y均为随机变量,回归分析中只有y为随机变量;相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。回归分析与相关分析区别:返回一、简单线性回归方程的建立二、估计标准误三、简单线性回归模型预测四、二元线性回归方程§6.2线性回归分析返回回归分析的种类一元回归(简单回归)多元回归(复回归)线性回归非线性回归一元线性回归SimpleLinearregression按自变量的个数分⒈按回归曲线的形态分⒉一、简单线性回归方程的建立对于经判断具有线性关系的两个变量y与x,在它们的相关图的散点中引出一条模拟的回归直线,以表明两变量的关系,我们称它为估计回归线。配合回归线相应方程式称为回归方程,即:简单线性回归方程的几何意义截距斜率一元线性回归方程的可能形态b为正b为负b为0简单线性回归方程建立的步骤2、确定简单线性回归方程:截距a表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b表明自变量x每变动一个单位,因变量y平均变动b个单位。1、确定自变量、因变量;在两个变量之间,必须确定哪个是自变量,哪个是因变量。式中:是y的估计值,a为直线在y轴上的截距,b为斜率,又称为回归系数。
随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。残差(Residual):e3、确定待定参数a、b普通最小二乘法(OLS)基本数学要求:整理得到由两个关于a、b的二元一次方程组成的方程组:进一步整理,有:【例】某企业上半年产品产量与单位成本资料如下:月份产量(千件)单位成本(元)123456234345737271736968要求:⑴计算相关系数,说明两个变量相关的密切程度。⑵配合回归方程,指出产量每增加1000件时,单位成本平均变动多少?⑶假定产量为6000件时,单位成本为多少元?
解:⑴计算相关系数
说明产量和单位成本之间存在高度线性负相关关系。
即线性回归方程为:回归系数b的经济意义:它表示当x每变动一个单位时,y平均来说变动多少。即:产量x每增加1000件,单位成本平均下降1.82元。
(2)设回归方程为:
⑶当产量为6000件时,即x=6,代入回归方程:
y=77.37-1.82×6=66.45(元)
返回二、估计标准误估计标准误是衡量因变量的估计值与观测值之间离差的平均水平指标。
概念它可以说明回归方程的代表性。
计算公式其中::估计标准误;:估计值;:实际值;n-2:回归估计自由度。
【例A】根据某部门8个企业产品销售额x(十万元)和销售利润y(万元)的资料得出以下计算结果:
要求:(1)计算产品销售额与利润额的相关关系;(2)建立以利润额为因变量的直线回归方程并说明回归系数的经济意义;(3)计算估计标准误。
返回三、简单线性回归模型预测点估计对于给定的
X
值,求出Y预测值。区间估计对于给定的X值,求出Y
的置信区间。区间估计步骤(1)计算点预测值;(2)计算估计标准误;(3)给定显著性水平,查标准正态分布表,得临界值;(4)下限=;上限=【例B】接例A,当产品销售额x为7000万元时,试以95.45%的概率保证程度估计销售利润y的置信区间。返回四、二元线性回归方程,称为偏回归系数。:当取固定值时,每变动一个单位所引起y的平均变动量。:当取固定值时,每变动一个单位所引起y的平均变动量。
基本模型:返回设销售收入X为自变量,销售成本Y为因变量。现已根据某百货公司12个月的有关资料计算出以下数据:(单位:万元)练习要求:1)计算销售收入与销售成本之间的相关系数?2)试拟合简单线性回归方程。3)方程中回归系数具有什么经济意义?4)假设明年1月份销售收入为800万元,则其销售成本95%置信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025内蒙古电力集团招聘笔试考试笔试历年参考题库附带答案详解
- 2025-2030中国口腔清洁用品行业发展前景及发展策略与投资风险研究报告
- 2025-2030中国印楝素市场运行状况与发展的战略建议报告
- 2025-2030中国冷库门市场投融资规模与应用领域研究报告
- 2025-2030中国儿童双语教育市场发展风险与前景经营趋势建议报告版
- 2025-2030中国亚克力粉市场消费前景及销售渠道战略规划报告
- 企业公文写作课件教学
- 通信工程考试试题及答案
- 素质教育考试试题及答案
- 直埋式保温管行业深度研究分析报告(2024-2030版)
- 2023年下半年浙江温州苍南县事业单位选调工作人员笔试参考题库(共500题)答案详解版
- (2023版)小学语文一年级上册电子课本
- 新华镇生活污水处理管网与新华农场管网并网项目环境影响报告表
- 互联网导论智慧树知到课后章节答案2023年下上海第二工业大学
- 《旅游学概论》第七章
- 工程物探-第五章电法勘探课件
- KSS编码说明电厂KKS编号
- 台区线损综合分析台区线损分类及计算方法
- 人民医院普外科临床技术操作规范2023版
- 【酒店管理系统的设计与开发(论文)】
- 举一反三- 三年级奥数 - 第37讲 面积计算
评论
0/150
提交评论