版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河南科技大学经济与管理学院第一节相关关系的概念和种类第二节相关关系的判断第三节一元回归分析第四节多元线性回归分析第九章相关与回归第一节相关关系的概念和种类一、函数关系与相关关系1.函数关系当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。(函数关系)(1)是一一对应的确定关系(2)设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x
,当变量x取某个数值时,
y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量(3)各观测点落在一条线上
xy变量间的关系
(函数关系)
函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为y=p
x(p为单价)圆的面积(S)与半径之间的关系可表示为S=r2
企业的原材料消耗额(y)与产量(x1)
、单位产量消耗(x2)
、原材料价格(x3)之间的关系可表示为y=x1x2x3
当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。
概念:指现象之间客观存在的不严格、不确定的数量上的相互依存关系。2.相关关系变量间的关系
(相关关系)(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量x取某个值时,变量y的取值可能有几个;(4)各观测点分布在直线周围。
xy(相关关系)
相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品的消费量(y)与物价(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系二、相关关系的种类1.按相关形式划分可以分为线性相关和非线性相关。线性相关:当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关。
非线性相关:如果两种相关现象之间,并不表现为直线的关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关。2.按相关程度划分完全相关:当一种现象的数量变化完全由另一个现象的数量变化所确定时,这两种现象间的关系为完全相关。即函数关系。
不完全相关:两个现象之间的关系介于完全相关和不相关之间,称为不完全相关。
不相关:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。如:股票价格的高低与气温的高低是不相关的。(1)正相关:两个相关现象间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。例如收入与消费的关系。(2)负相关:当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)趋势变化,即反方向变化。例如物价与消费的关系。3.按相关的方向划分可分为正相关和负相关4.按相关关系涉及的变量多少划分分为单相关、复相关和偏相关。两个变量之间的相关,称为单相关。当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。例如,某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为偏相关。例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。三、相关分析的内容
(一)确定现象之间有无关系(二)确定相关关系的表现形式(三)确定相关关系的密切程度和方向第二节相关关系的判断定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。一、相关关系的判断
二、相关表:将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。
例:为了研究分析某种劳务产品完成量与其单位产品成本之间的关系,调查30个同类服务公司得到的原始数据如表。 整理后有三、相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。
正相关
强正相关弱正相关负相关
强负相关弱负相关不相关四、相关系数(一)相关系数的定义
1.简单相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标,简称相关系数。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为
若是根据样本数据计算的,则称为样本相关系数,记为
r样本相关系数的定义公式计算相关系数的“积差法”相关系数的计算公式计算公式还可以有:相关系数的性质1、两变量是对等关系不分自变量和因变量2、取值范围:
r<0负相关r=0不相关r>0正相关完全线性相关r=1完全正相关r=-1完全负相关相关方向和相关程度不相关低度相关显著相关高度相关四个等级:注意事项r是对变量之间线性相关关系的度量。
r=0只是表明两个变量之间不存在线性关系,它并不意味着X与Y之间不存在其他类型的关系。相关关系的测度
(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加例:下表是有关15个地区某种商品需求量和地区人口增加量的资料。第三节一元回归分析一、相关分析与回归分析(一)概念:1.相关分析是用来研究变量之间相关密切程度与相关方向的一种统计分析方法。2.回归分析是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。(二)相关分析与回归分析的区别
1.在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。2.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。3.相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。(三)相关分析与回归分析的联系
相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。总结:1、相关分析是回归分析的基础和前提;2、回归分析是相关分析的深入和继续。
(内容)从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度二、回归分析回归模型回答“变量之间是什么样的关系?”方程中运用1个数字的因变量被预测的变量1个或多个数字的或分类的自变量(解释变量)用于预测的变量3. 主要用于预测和估计回归模型的类型一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归二、一元线性回归模型当两个变量互为因果关系时,可以配合两条回归直线方程,一条是。在两个变量只有单一的因果关系时,只能建立一个回归方程,一般为
(一)配合最佳的回归直线的条件1、要有一定数量的自变量与因变量的对应资料2、现象之间确实存在显著性的相关关系;3、其相关关系是直线相关关系;4、应根据最小平方法原理配合一元线性回归模型(二)根据未分组资料配合回归直线模型
a为当x=0等于时,y的估计值;b为自变量每变动一个单位时,因变量的平均变动值,也叫回归系数。(三)根据分组资料配合回归直线模型根据分组资料配合回归直线模型,其方法与未分组的基本相同,区别仅在于求解a和b时要注意加权。年份货币收入
x购买商品支出y20003630.01296108020013731.01369114720023832.01444121620034033.21600132820044234.817641461.620054436.51936160620064739.02209183320075041.625002080合计334278.11411811751.6=8×11751.6-334×278.18×14118-(334)2=0.8122=278.1/8-0.8122×334/8=0.8532=0.8532+0.8122x运用模型预测=0.8532+0.8122x
假定2008年该地区居民货币收入为58亿元,预测2008年该地区居民购买商品支出额。亿元
(四)估计标准误差估计标准误差:用来说明回归方程代表性大小的统计分析指标若估计标准误差小,表明回归方程准确性高,代表性大;反之,若估计标准误差大,表明回归方程准确性低,代表性小计算方法:1)定义公式法(因变量实际值与理论值离差的平均数)2)简捷公式年份货币收入
x购买商品支出y20003630.01296900108020013731.01369961114720023832.014441024121620034033.216001102.24132820044234.817641211.041461.620054436.519361332.25160620064739.022091521183320075041.625001730.562080合计334278.1141189782.0911751.6=0.144相关系数和估计标准误差的关系
估计标准误差小,相关系数的绝对值就越大,表明现象之间相关关系越密切,如果估计标准误差的值等于0,相关系数的绝对值等于1,表明完全相关。这两个指标在数量上有如下的关系:应用直线相关与回归的注意事项
1.实际意义
进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。例如,有人说,孩子长,公园里的小树也在长。求孩子和小树之间的相关关系就毫无意义,用孩子的身高推测小树的高度则更加慌谬。
2.相关关系
相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系,例如,有人发现,对于在校儿童,鞋的大小与阅读技能有很强的相关关系。然而,学会新词并不能使脚变大,而是涉及到第三个因素‑‑年龄。当儿童长大一些,他们的阅读能力会提高而且由于长大也穿不下原来的鞋。
3.利用散点图对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关回归分析。4.变量范围相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系。第四节多元线性回归分析一、非线性回归模型当自变量与因变量存在某种曲线相关关系时,可拟合曲线回归模型。例如:双曲线:a>0b>0a>0b<0xxyy指数曲线:y=aebxb>0
b<0xxyy幂函数曲线:y=axba>0b>0xyb<1b=1b>1曲线模型的判别方法:理论和经验判断;观察散点图
曲线模型的确定方法:
通常用变量代换法将曲线转换为直线。按线性模型求解参数,而后再变换为曲线模型。例如:双曲线模型指数曲线模型非线性回归模型的估计
几种线性变换方法实际应用时要注意:
第一、比较复杂的非线性函数,需综合利用上述的几种方法。第二、变换得到的方程式中的变量不允许包含未知的参数。第三、当变换后的新模型中包含的误差项能够满足标准假定时,新模型中回归系数最小二乘估计量的理想性质才能成立。
第四、严格地说,线性变换方法只是适用于变量为非线性的函数。第五、并不是所有的非线性函数都可以通过变换得到与原方程完全等价的线性方程。二、多元线性回归
一个因变量与两个及两个以上自变量之间的回归如二元线性回归方程,称为偏回归系数表示假定其他变量不变,当
每变动一个单位时,y的平均平均变动值求解参数时,一般采用最小平方法。销售额、人口数和年人均收入数据地区编号销售额(万元)y人口数(万人)x1年人均收入(元)x21234567891033.335.527.630.431.953.135.629.035.134.532.429.126.331.229.240.729.823.028.226.91250165014501310131015801490152016201570【例】一家百货公司在10个地区设有经销分公司。公司认为商品销售额与该地区的人口数和年人均收入有关,并希望建立它们之间的数量关系式,以预测销售额。有关数据如下表。试确定销售额对人口数和年人均收入的线性回归方程销售额与人口数和年人均收入的二元回归方程为复相关系数(只取正值)1、定义复相关系数是反映一个变量Y与其它K个变量χ2、χ3……χK间线性相关程度的指标。样本复相关系数的定义式:
2、特点(1)复相关系数介于0和1之间,即0≤R≤1。(2)如果R=1表明Y与χ2、χ3……χK之间存在严密的线性关系;如果R=0时,表明Y与χ2χ3……χK之间不存在任何线性相关关系。(3)一般0<R<1,表明变量之间存在一定程度的线性相关关系。三、注意事项1.在定性分析基础上进行定量分析,是保证分析合理的必要条件。2.尽量使用大样本。3.进行回归预测时尽量注意条件的变化。4.一般不要用回归方程预测自变量5.回归系数不直接反映相关变量的关系的密切程度。回归系数只是表示自变量和因变量之间的数量对应关系。练习题单项选择题1、进行相关分析,要求相关的两个变量()A都是随机的B一个是随机的,一个不是随机的C都不是随机的D随机或不随机都可以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度物业公司保安员夜间值班与休息合同
- 二零二五年度电梯井施工与电梯设备保养合同
- 2025年度幼儿园招生加盟与品牌转让合作协议
- 二零二五年度情感关系建立合同
- 二零二五年度2025年门面房租赁与社区配套服务合同
- 二零二五年度精装修公寓房购买与户外休闲设施使用合同3篇
- 二零二五版奶粉生产废弃物资源化利用服务合同范本页22篇
- 2025年度影视基地场地租赁合同及影视制作服务协议3篇
- 二零二五版电子商务SET协议安全风险评估与风险控制合同3篇
- 二零二五版淋浴房市场推广与广告投放合同3篇
- 2024山西广播电视台招聘专业技术岗位编制人员20人历年高频500题难、易错点模拟试题附带答案详解
- 新材料行业系列深度报告一:新材料行业研究框架
- 人教版小学英语各册单词表(带英标)
- 广东省潮州市潮安区2023-2024学年六年级上学期期末考试数学试题
- 乡村治理中正式制度与非正式制度的关系解析
- 智能护理:人工智能助力的医疗创新
- 国家中小学智慧教育平台培训专题讲座
- 5G+教育5G技术在智慧校园教育专网系统的应用
- VI设计辅助图形设计
- 浅谈小学劳动教育的开展与探究 论文
- 2023年全国4月高等教育自学考试管理学原理00054试题及答案新编
评论
0/150
提交评论