统计学相关分析与回归分析_第1页
统计学相关分析与回归分析_第2页
统计学相关分析与回归分析_第3页
统计学相关分析与回归分析_第4页
统计学相关分析与回归分析_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学相关分析与回归分析第第9 9 章章 相关分析与回归分析相关分析与回归分析相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是构造各具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、种经济模型、进行结构分析、政策评价、预测和控制的重要工具。预测和控制的重要工具。统计学相关分析与回归分析通过本章的学习要求理解相关分析通过本章的学习要求理解相关分析和回归分析的有关概念,掌握计算相和回归分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能关系数和配

2、合回归方程的方法,并能结合实际资料对变量进行相关和回归结合实际资料对变量进行相关和回归分析。分析。统计学相关分析与回归分析 出租汽车费用与行驶里程:出租汽车费用与行驶里程: 总费用总费用=行驶里程行驶里程 每公里单价每公里单价PKG 家庭收入与恩格尔系数:家庭收入与恩格尔系数: 家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。相关关系相关关系统计学相关分析与回归分析 在自然界和社会现象中,客观现象之间的数量关系通在自然界和社会现象中,客观现象之间的数量关系通常有两种类型,即:常有两种类型,即:函数关系函数关系2rs 相关关系相关关系 客观存在、确定性、客观存在、确定性、严格的数量对应关

3、系严格的数量对应关系(相关分析的对象)(相关分析的对象)现象(变量)之间客观存在的、现象(变量)之间客观存在的、非确定性的数量对应关系。非确定性的数量对应关系。例如:消费支出与收入的关系;例如:消费支出与收入的关系; 学习成绩与学习时间的关系等。学习成绩与学习时间的关系等。统计学相关分析与回归分析相关关系的种类(四种)相关关系的种类(四种)单相关单相关复相关复相关线性相关(直线相关)线性相关(直线相关)非线性相关(曲线相关)非线性相关(曲线相关)正相关正相关负相关负相关完全相关(函数关系)完全相关(函数关系)不完全相关不完全相关不相关不相关按涉及变量多少按涉及变量多少按相关的按相关的表现形式表

4、现形式按相关的方向(直线相关)按相关的方向(直线相关)按按相关的程度相关的程度定性分析定性分析是依据研究者的理论知识和实践经是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关验,对客观现象之间是否存在相关关系,以及何种关系作出判断关系,以及何种关系作出判断定量分析定量分析在定性分析的基础上,通过编制在定性分析的基础上,通过编制相相关表关表、绘制、绘制相关图相关图、计算、计算相关系数相关系数与与判定系数判定系数等方法,来判断现象之等方法,来判断现象之间相关的方向、形态及密切程度间相关的方向、形态及密切程度对相关关系的分析是统计学的重要研究内容。对相关关系的分析是统计学的重要研究内容。主

5、要研究方法:相关分析和与回归分析。主要研究方法:相关分析和与回归分析。统计学相关分析与回归分析相关分析与回归分析相关分析与回归分析 相关分析(相关分析(Correlation AnalysisCorrelation Analysis)研究变量之间相关的方向)研究变量之间相关的方向和相关的程度,但无法给出变量间相互关系的具体形式,和相关的程度,但无法给出变量间相互关系的具体形式,因而无法从一个变量推测另一个变量。因而无法从一个变量推测另一个变量。 回归分析(回归分析(Regression) Regression) 可以确定变量之间相互关系的具体可以确定变量之间相互关系的具体形式(回归方程),确定

6、一个变量对另一个变量的影响程形式(回归方程),确定一个变量对另一个变量的影响程度,并根据回归方程进行预测。度,并根据回归方程进行预测。统计学相关分析与回归分析自变量和因变量自变量和因变量 如果两个变量中一个变量是另一个变量变化的结如果两个变量中一个变量是另一个变量变化的结果,那么果,那么代表原因的变量称为自变量代表原因的变量称为自变量 Independent Independent (Explanatory) Variable(Explanatory) Variable,代表结果的变量称为因变量代表结果的变量称为因变量 Dependent Dependent (Response) Variab

7、le (Response) Variable 。在散点图中习惯上把因变量绘制在纵轴上。正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy用直角坐标系的用直角坐标系的x轴代表自变量,轴代表自变量,y轴代表因轴代表因变量,将两个变量间相对应的变量值用坐标变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状点的形式描绘出来,用以表明相关点分布状况的图形。况的图形。用散点图观察变量之间的相关关系用散点图观察变量之间的相关关系在在的条件下,用以反映的条件下,用以反映两变量两变量间间密切程度的统计指标,用密切程度的统计指标,用r表示表示2222222)

8、( yynxxnyxxynnyynxxnyyxxryxxy统计学相关分析与回归分析1 1 r r 1 1r 1 1, r 0 0,r 0 01 1,两个变量完全相关两个变量完全相关两个变量不存在线性相关关系两个变量不存在线性相关关系两个变量存在一定程度线性相关关系两个变量存在一定程度线性相关关系rr0 0,0 0,两个变量正相关两个变量正相关两个变量负相关两个变量负相关 |r| 0.30.30.30.30.50.50.50.50.80.80.80.81 1弱相关弱相关低度相关低度相关显著相关显著相关高度相关高度相关统计学相关分析与回归分析 调查调查5050个房地产公司,房屋销售面积与广告费用个

9、房地产公司,房屋销售面积与广告费用之间的相关系数为之间的相关系数为0.760.76,这说明(,这说明( ) A.A.二者之间有较强的正相关关系二者之间有较强的正相关关系 B.B.平均看来,销售面积的平均看来,销售面积的7676归因于其广告费用归因于其广告费用 C.C.如要多销售如要多销售1 1万平方米的房屋,则要增加广告费用万平方米的房屋,则要增加广告费用76007600元元 D.D.如果广告费用增加如果广告费用增加1 1万元,可以多销售万元,可以多销售76007600平方米的房平方米的房屋屋统计学相关分析与回归分析样本能代表总体吗?样本能代表总体吗? 如果红色的点碰巧为你的样本,则样本相关如

10、果红色的点碰巧为你的样本,则样本相关系数为系数为0.9070.907,总体相关系数为,总体相关系数为0.000050.00005统计学相关分析与回归分析相关系数的显著性检验相关系数的显著性检验1 1、提出假设:、提出假设:H H0 0: ;H H1 1: 0 0)2(122ntrnrt2、 计算检验的统计量:计算检验的统计量:3、 确定显著性水平确定显著性水平 ,并作出决策,并作出决策 若若 t t,拒绝,拒绝H0 或者:若或者:若p值值 ,拒绝,拒绝H0检验的步骤是:统计学相关分析与回归分析 计算结果: t检验值为临界值临界值t t(2121)2.082.08,故拒绝,故拒绝H H0 0,认

11、为相关系,认为相关系数显著。数显著。消费支出和可支配收入的相关系数23个家庭调查消费支出消费支出可支配收入可支配收入消费支出消费支出1 1可支配收入可支配收入0.99680.99681 12220.9968 2157.1981110.9968r ntr统计学相关分析与回归分析注意:相关关系注意:相关关系因果关系!因果关系! 典型的错误推断:典型的错误推断:统计分析表明,庆祝生日次数越统计分析表明,庆祝生日次数越多的人越长寿。因此,庆祝生日有利于健康。多的人越长寿。因此,庆祝生日有利于健康。调查表明,世界各国人均电视机拥有量与预期调查表明,世界各国人均电视机拥有量与预期寿命存在很强的正相关性。因

12、此,电视机拥有寿命存在很强的正相关性。因此,电视机拥有量越高,预期寿命越长。量越高,预期寿命越长。对小学各年级学生的抽样调查表明,学生的识对小学各年级学生的抽样调查表明,学生的识字水平与他们鞋子的尺寸高度正相关。因此,字水平与他们鞋子的尺寸高度正相关。因此,学生穿的鞋越大,他的识字水平就越高。学生穿的鞋越大,他的识字水平就越高。统计学相关分析与回归分析92 一元线性回归分析 总体回归函数总体回归函数 、样本回归函数、样本回归函数 一元线性回归模型的估计一元线性回归模型的估计 一元线性回归模型的检验一元线性回归模型的检验 统计学相关分析与回归分析趋向中间高度的回归趋向中间高度的回归 回归这个术语

13、是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。 Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。统计学相关分析与回归分析Regression 的原始释义q理论和方法具有一致性;理论和方法具有一致性;q无相关就无回归,相关程度越高,回无相关就无回归,相关程度越高,回归越好;归越好;q 相关系数和回归系

14、数方向一致,可以相关系数和回归系数方向一致,可以互相推算。互相推算。q相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要要确定自变量和因变量;确定自变量和因变量;q相关分析中相关分析中x、y均为随机变量,回归分析均为随机变量,回归分析中只有中只有y为随机变量;为随机变量;q相关分析测定相关程度和方向,回归分析相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。用回归模型进行预测和控制。注意注意 我们不能把回归分析看作是在变我们不能把回归分析看作是在变量间建立一个因果关系的过程。量间建立一个因果关系的过程。回归分析只能表明,变量是如何回归分析只能表明,变量是如何或者

15、是以怎样的程度彼此联系在或者是以怎样的程度彼此联系在一起的。有关因果关系的任何结一起的。有关因果关系的任何结论,必须建立在理论分析的基础论,必须建立在理论分析的基础之上。之上。一一 元元线线性性回回归归Simple Linear regression对于经判断具有线性关系的两个变量对于经判断具有线性关系的两个变量y y与与x x,构造一元线性回归模型为:,构造一元线性回归模型为:xY10为随机误差项为模型参数,与式中:XYEY10)(YEXXY10截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 1为为正正 1为为负负 1为为0XYEY0 xy10以样本统计量估计总体参数以

16、样本统计量估计总体参数斜率(回归系数斜率(回归系数)截距截距截距截距表示在没有自变量表示在没有自变量x的影响时,其它各的影响时,其它各种因素对因变量种因素对因变量y的平均影响;的平均影响;回归系数回归系数表表明自变量明自变量x每变动一个单位,因变量每变动一个单位,因变量y平均变平均变动多少个单位。动多少个单位。统计学相关分析与回归分析总体回归直线与样本回归直线总体回归直线与样本回归直线YXiexy10 1 0 iXXYE10)|( 统计学相关分析与回归分析 在满足一系列假设条件的情况下,最小二乘在满足一系列假设条件的情况下,最小二乘估计量是方差最小线性无偏估计量。需要的估计量是方差最小线性无偏

17、估计量。需要的基本假设条件包括:基本假设条件包括:1 1、2 2、对于所有的、对于所有的x x, 的方差的方差 相等相等3 3、 与与X X之间不相关之间不相关4 4、 之间不相关之间不相关5 5、 服从正态分布服从正态分布一元线性回归模型的统计假设一元线性回归模型的统计假设i0)(iEiii统计学相关分析与回归分析一元线性回归模型的估计 总体回归直线是未知的,它只有一条;而总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回每抽取一组样本,便可以拟合一条样本回归直线。归直线。 在总体参数未知的情况下,

18、如何保证样本在总体参数未知的情况下,如何保证样本回归系数尽可能接近总体参数的真实值?回归系数尽可能接近总体参数的真实值? 在回归分析中最常用的估计方法是最小二在回归分析中最常用的估计方法是最小二乘法。乘法。统计学相关分析与回归分析 的意义yy 为残差:点到直线的纵向距离。1112131415165.05.56.06.5yy统计学相关分析与回归分析最小二乘估计xy(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)ei = yi-yixy10niiniieyyQ1212) (通过使残差平方和达到最小来求得 01统计学相关分析与回归分析最小二乘估计2102)() (xyyyQ将

19、Q对和求偏导数并令其等于零,可以得到正规方程组(Normal Equations)。0 1 0)(20)(2101100 xyxQxyQ统计学相关分析与回归分析解这个方程组可得:注意的符号与相关系数注意的符号与相关系数r是一致的。是一致的。1 xyxxnyxyxnniniiiniiniiniii1012121111统计学相关分析与回归分析 直线的起点值(不变费用)直线的起点值(不变费用) 当产量每增加当产量每增加10001000件时,单位成本平件时,单位成本平均降低均降低1.821.82元件。元件。xy1 1. .8 82 27 77 7. .3 37 7统计学相关分析与回归分析一元线性回归方程的评价和检验一元线性回归方程的评价和检验 拟合优度 1、决定系数 2、估计标准误差显著性检验 3、t检验 4、F检验统计学相关分析与回归分析决定系数为:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论