版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学第一章总论第二章统计调查与统计整理第三章综合指标第四章参数估计第五章假设检验第六章方差分析第七章相关与回归第八章时间序列第九章指数统计分析第七章相关与回归分析
【主要内容】一、相关和回归分析的基本概念二、一元线性回归分析三、多元线性回归分析四、非线性回归分析1、什么是相关?
2、什么是相关分析?
3、相关分析主要解决什么问题?
第一节相关分析的意义和任务
一、相关关系的概念(注意相关关系与函数关系的区别)
(一)函数关系
它反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来。第一节相关分析的意义和任务
一、相关关系的概念(注意相关关系与函数关系的区别)
例如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。销售额=销售量×价格例:圆的面积与半径的关系;计件工资总额与零件数量;看书时间和学习成绩。出租汽车费用与行驶里程:总费用=行驶里程每公里单价函数关系确定性关系(二)相关关系
它反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:1.现象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;2.现象之间的这种依存关系是不严格的,即无法用数学公式表示。家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。相关关系非确定性关系商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品的销售量也会随之发生变动。
在具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用X表示;发生对应变化的变量称因变量,一般用y表示。例二、相关关系的种类
1.按相关关系涉及的因素多少来分,可分为:
单相关和复相关。
在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关。二因素之间的相关关系称单相关,即只涉及一个自变量和一个因变量。三个或三个以上因素的相关关系称复相关,或多元相关,即涉及二个或二个以上的自变量和因变量。2.按相关关系的性质来分,可分为:
正相关和负相关正相关是指两相关现象变化的方向是一致的。
负相关是指两相关现象变化的方向是相反的。3.按相关关系的形式来分,可分为:
直线相关和曲线相关
直线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。
曲线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。4.
按相关程度分,可分为:
完全相关、不完全相关和不相关
完全相关就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。
不相关是指两现象之间在数量上的变化上各自独立,互不影响。
不完全相关就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关系。三、相关分析的任务和内容
相关分析的主要任务,概括起来是两个方面:一方面,研究现象之间关系的密切程度,即相关分析;另一方面,研究自变量与因变量之间的变动关系,即回归分析。相关分析的主要内容包括以下五个方面:1.判断社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这是相关分析的出发点;2.确定相关关系的密切程度;3.测定两个变量之间的一般关系值;4.测定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;5.相关系数的显著性检验。四、相关分析和回归分析
研究现象之间相关关系的两种基本方法:相关分析,用一个指标来表明现象间相互依存关系的密切程度回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。相关分析和回归分析的区别
1两者在关心变量性质上的不同。在回归分析中,必须将变量分为自变量和因变量,以便建立回归方程;也必须将变量分为确定性变量和随机变量,以便研究随机变量的分布以及对其进行统计推断。区分变量的性质是回归分析的前提条件,是回归分析中首先要解决的一个问题。
相关分析中两变量是对等的,都是随机变量,不区分自变量和因变量.
2两者的任务和目的不同。回归分析是根据现象之间关系的特点,运用一定的办法,建立最适合于变量之间关系的回归方程,而且随着变量的变换,回归方程也会随之改变,回归方程是用来反映变量之间数量的平均变动关系,进而对因变量进行估算或预测。相关分析是通过计算相关指标,用来反映回归方程所表明变量之间依存关系的密切程度,是不能进行估算和预测的。
3两者的使用范围不同。回归分析只限于研究数量标志之间或指标之间的数量关系,对于品质标志之间和等级之间的关系在没有数量化之前是无法研究的。相关分析研究范围比回归分析研究的范围要广泛得多。从研究的范围来看,可以说,凡是能够进行回归分析的,都能够也必须进行相关分析,而能够进行相关分析的,却不一定能够或不都需要进行回归分析,回归分析总需要相关分析的帮助,而相关分析却不一定需要回归分析的帮助,相关分析具有独立性。相关分析和回归分析的联系
相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析是建立在相关分析的基础上,需要依靠相关分析来表明现象数量变化的程度,只有当变量之间存在高度相关时,回归分析才有意义。第二节简单线性相关分析
一、相关表和相关图相关图,也称散布图(或散点图)。相关表的种类定性分析依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形态及密切程度。相关表和相关图的作用:相关关系的测定相关表的编制1、编制相关表前首先要通过实际调查取得一系列成对的标志值资料作为相关分析的原始数据。2、相关表的分类:简单相关表是资料未经分组的相关表,它是把因素标志值按照从小到大的顺序并配合结果标志值一一对应而平行排列起来的统计表。分组相关表是在简单相关表的基础上,将原始数据进行分组而编成的统计表。①、单变量分组相关表自变量分组并计算次数,而对应的因变量不分组,只计算其平均值。单变量分组相关表的特点:使冗长的资料简化,能够更清晰地反映出两变量之间相关关系。②、双变量分组相关表:自变量和因变量都进行分组而制成的相关表,这种表形似棋盘,故又称棋盘式相关表。相关图的编制1、相关图:利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,而将两变量相对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形。2、相关图被形象地称为相关散点图3、因素标志分了组,结果标志表现为组平均数,所绘制的相关图就是一条折线,这种折线又叫相关曲线。正相关负相关曲线相关不相关xyxyxyxy又称散点图,用直角坐标系的x轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。相关图某市1996年—2003年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。序号年份工资性
现金支出(万元)x城镇储蓄存款余额(万元)y119965001202199754014031998620150419997302005200090028062001970350720021050450820031170510例1简单相关表企业按销售额分组(万元)流通费用率(%)4以下9.654~87.688~127.2512~167.0016~206.8620~246.7324~286.6428~326.6032~366.58例2分组相关表二、相关系数
相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号r表示。r的测定方法:仍以上例1资料计算:序号年份x(万元)y(万元)11996500120-310-15596100240254805021997540140-270-13572900182253645031998620150-190-12536100156252375041999730200-80-75640056256000520009002809058100254506200197035016075256005625120007200210504502401755760030625420008200311705103602351296005522584600合计64802200--432400155000253300经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。对r的解释如下:(即r的特点)(1)r取正值或负值决定于分子协方差;(2)r的绝对值,在0与1之间;(3)r的绝对值大小,可说明现象之间相关关系的紧密程度。积差法公式进一步化简如下:2.简捷法
资料计算如下:序号年份x(万元)y(万元)x2y2xy119965001202500001440060000219975401402916001960075000319986201503844002250093000419997302005329004000014600052000900280810000784002520006200197035094090012250033950072002105045011025002025004725008200311705101368900260100596700合计64802200568120076000020353003.从单变量分组表计算相关系数
三、简单线性相关分析的特点
通过对r的计算方法的讨论,可看出二个明显特点:2.相关关系中只能计算出一个相关系数r。1.相关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量;3、相关系数与判定系数在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,用r表示相关系数
r2
越接近于1,表明x与y之间的相关性越强;r2
越接近于0,表明两个变量之间几乎没有直线相关关系.相关系数与判定系数是相关系数的平方,用r2表示;用来衡量回归方程对y的解释程度。判定系数取值范围:判定系数第三节回归分析
一、回归分析的概念和种类二、一元线性回归分析三、多元线性回归分析四、非线性回归分析一、回归分析的概念和种类什么是回归?什么是回归分析?回归分析的种类
1、回归分析按变量的多少可分为:简单回归复回归2、回归分析按回归的形式可分为:线性回归:一元线性回归多元线性回归非线性回归
(一)标准的一元线性回归模型(二)一元线性回归模型的估计(三)一元线性回归模型的拟合优度(四)一元线性回归模型的检验(五)一元线性回归模型预测二、一元线性回归分析
(一)标准的一元线性回归模型1、回归函数总体回归函数
Yt=β0+β1Xt+ut
ut是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对Y的影响。样本回归函数:
t=1,2,...n
et称为残差,在概念上,et与总体误差项ut相互对应;n是样本的容量。E(Yt)=β0+β1XtXYtY。。。。。ut
样本回归函数与总体回归函数区别总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。总体回归函数中的β1和β2是未知的参数,表现为常数。而样本回归函数中的是随机变量,其具体数值随所抽取的样本观测值不同而变动。总体回归函数中的ut是Yt与未知的总体回归线之间的纵向距离,它是不可直接观测的。而样本回归函数中的et是Yt与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出et的具体数值。误差项的标准假定假定1:误差项的期望值为零:E(ut)=0。假定2:误差项的方差为常数:Var(ut)=。假定3:误差项之间不存在序列相关,协方差为零:
Cov(utus)=0(t≠s)。假定4:自变量是给定变量,与误差项线性无关。假定5:随机误差项服从正态分布。满足以上标准假定的一元线性回归模型,称为标准的一元线性回归模型。(二)一元线性回归模型的估计一元线性回归方程的几何意义截距斜率一元线性回归方程的可能形态
1为正
1为负
1为0总体一元线性回归方程:以样本统计量估计总体参数斜率(回归系数)截距截距表示在没有自变量x的影响时,其它各种因素对因变量y的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 房地产公司团购协议书模板
- 《养老机构服务合同》山东省
- 法院退赔申请书格式怎样写
- 2024年标准化辣椒买卖合同模板版B版
- 2025年广东货车从业资格证答题软件
- 2025年济宁货车从业资格证考试试题
- 太古金融行业报告
- 软件测试金融项目课程
- 2024年招标代理服务个性化解决方案3篇
- 二零二四年技术研发与委托合同
- 《玉米合理密植技术》课件
- 《不稳定型心绞痛》课件
- 智能化改造的力量
- 2024年世界职业院校技能大赛高职组“新型电力系统技术与应用组”参考试题库(含答案)
- 生物-安徽省2025届高三第一次五校(颍上一中、蒙城一中、淮南一中、怀远一中、涡阳一中)联考试题和答案
- 安全生产责任制度考题
- 走进民航智慧树知到期末考试答案章节答案2024年中国民航大学
- MSA-GRR数据自动生成工具(已经解密)
- 半自理全护理老人护理管理服务投标方案
- 英文收据模板
- “很多”、“大量”的英语表达法
评论
0/150
提交评论