社会统计分析方法(第二版) 课件 第二章 多元线性回归_第1页
社会统计分析方法(第二版) 课件 第二章 多元线性回归_第2页
社会统计分析方法(第二版) 课件 第二章 多元线性回归_第3页
社会统计分析方法(第二版) 课件 第二章 多元线性回归_第4页
社会统计分析方法(第二版) 课件 第二章 多元线性回归_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章多元线性回归多元线性回归(multiplelinearregression)是分析一个随机变量与多个变量之间线性关系的最常用的统计方法。实际工作中,常常希望知道所关心的事物受哪些因素的影响,比如销售量与价格和广告费的关系、农业产量与原料和气候的关系、生育水平与教育水平和经济水平的关系、物价与失业率的关系、收入与受教育程度和年龄的关系等等。多元线性回归用观察数据拟合所关注的变量和影响它变化的变量之间的线性关系式,检验影响变量的显著程度和比较它们的作用大小,进而用两个或多个变量的变化解释和预测另一个变量的变化。概括地说,回归分析要解决三个方面的主要任务。第一,依据研究理论和经验建立关于因变量与一个或多个自变量之间关系的回归方程,并且根据数据样本拟合来求解这个回归方程的各项回归系数值。这些回归系数值便反映了各自变量对因变量影响作用的方向和幅度。应用SPSS的回归程序可以非常便利地求解这些回归系数,保证得出一套最佳的回归系数解。第二,评价这一回归方程对实际数据的拟合程度。回归分析保证取得“最佳”系数的意思只是说,这套系数对实际数据的拟合程度肯定比任何其他的解都要相对更好,但是我们还需要进一步了解采用这套系数的回归方程的拟合程度到底有多好。一般用回归方程对因变量变化解释的百分比来描述拟合程度,百分比越高就表示拟合程度越好。第三,在样本回归分析的基础上进行总体推断性统计。前两个任务还是在数据样本之内对回归方程的分析,但是社会科学的统计研究往往是通过样本分析来推断总体。所以,研究者需要对样本回归分析指标进行统计显著性检验,看看这些结果是否能推广到总体的情况。本章后面将大体按照这三方面的顺序来介绍回归分析。一、变量的关系和回归的任务二、简单线性回归模型我们从简单的情况开始,先来看含有一个自变量的线性回归问题。一个自变量的回归称为简单回归或一元回归。统计分析经常是先对总体中随机抽样得到的样本数据进行分析,然后再对总体进行推断。在抽样原理统计教科书中,总体的各种指标称为参数,样本的各种指标称为统计。因此,在后面的统计表述中经常需要分清总体参数和样本统计量。在很多情况下,两者相互对应,所以为了简明,本章采用许多教科书的做法,在一般情况下将总体参数用大写符号标注,将样本统计量用小写符号标注。(一)简单线性回归方程(二)简单回归系数的意义在回归模型式中,犪和犫称为回归直线的系数。犪是直线在狔轴上的截距,代表狔的基础水平;犫是直线的斜率,它表示狓变化一个单位时,狔的平均变化。(三)变量变换当因变量狔与自变量狓是非线性关系时,可以通过变量变换使经过变换的新变量对于参数是线性的。spss回归程序可以检查变量之间是不是有线性关系,如果是非线性关系,还可以应用spss曲线回归来探测具体是哪一种非线性关系。我们将在后面进行介绍。这里,我们仅用一个简单例子介绍如何对自变量进行非线性变换,以使线性回归能更好地拟合数据。(四)最小二乘估计的统计性质最小二乘估计在求解回归方程模型时是最常用的估计方法。通过最小二乘法得到的回归方程估计,有很好的统计性质。(五)模型的假定条件统计理论已经证明,在满足一定的假定先决条件下,样本数据的最小二乘估计是总体参数的最佳线性无偏估计。这是因为在推断总体参数或进行统计检验时,必须考虑总体回归模型中的随机误差项ε的分布特征。因此,对随机误差项ε提出若干基本假定条件。三、多元线性回归模型在本节中,我们要将简单回归推广到多元回归。在具体介绍有关分析之前需要说明,以上讨论的所有简单回归的假定条件都适用于多元线性回归。(一)多元线性回归方程(二)回归平面和回归系数的意义(三)一般回归模型乘法模型指数模型1指数模型2多项式模型(四)多元回归模型估计的统计推断四、方程的拟合程度(一)确定系数R^2(二)调整的确定系数R^2(三)多元相关系数R(四)偏确定系数(五)偏相关系数五、回归方程的统计检验和回归系数的推断统计在一般情况下,我们是通过抽样样本观测数据来推断总体的情况。因此,样本中计算的各统计量都服从一定的抽样误差。检验样本回归方程各统计量,就是为了根据样本统计量来判断总体各参数的情况。(一)整个回归方程的显著性检验对整个回归方程的统计检验也是通过方差分析完成的。将因变量y的总的离差平方和分解为两个部分:一部分是可以由回归方程解释的部分,称之为回归平方和;另一部分则是不能由回归方程解释的部分,称之为残差平方和。然后,用残差平方和代表随机波动,来评价回归方程的解释能力是否具有统计显著性。(二)偏确定系数的统计检验偏确定系数描述的是,在控制前一步回归中其他变量的条件下,新纳入一个或一组自变量的新增解释能力。偏确定系数也是一个百分比,只不过它只涉及前一步回归没能解释的因变量变化。(三)各自变量回归系数的显著性检验当回归方程整体检验具有统计显著性时,一般可以表明回归方程中至少有一个自变量的回归系数是显著的,但并不一定所有自变量的回归系数都是显著的。(四)回归系数的置信区间(五)回归系数不显著的原因(1)样本量太小,或者自变量个数较多(2)x(j)的变化范围太小(3)x(j)与方程中的其他自变量线性相关(4)y与x(j)虽然有关联,但却是非线性关系(5)y与x(j)确实不存在显著的线性关系六、标准化回归系数因为变量的标准化过程中都要除以该变量的标准差,这不仅会改变变量的数值,而且约分掉了原变量的实际测量单位,所以z变量是无量纲变量,即脱离了任何实际测量单位的纯统计量。于是,标准化变量的回归系数β称为标准化回归系数,它表示当其他变量不变时,x变化1个标准差单位,y的标准差的平均变化。七、多元统计控制对回归系数的影响采用多元回归最重要的优越性就是可以将对因变量有重要影响的自变量同时纳入分析,在控制其他模型自变量的条件下一一求解对应自变量的偏回归系数。因此,偏回归系数表达了对应自变量相对“独立”的影响作用,将更为接近真实情况的反应。尽管研究者可能并不清楚还有哪些重要影响变量,但是多元回归在方法论层次更为优越,提供了研究者进行深入探索和检验的工具。八、回归预测的区间估计九、回归诊断前面我们已经讨论过回归模型的正确估计和推断必须依赖于一定的假定条件,如果我们的数据及变量分布不满足这些假定条件,用回归方法获得的结果可能会有误导性。本节将讨论一些回归诊断的方法,以检验我们的数据是否满足线性回归的假定条件。此外,还有一些问题并不直接涉及回归的假定条件,但是对回归结果的影响也很大,因此在进行回归分析时也要多加注意,比如案例的权势影响和自变量之间的共线性问题。在回归分析中对这类问题的检查称为诊断。十、最优回归方程的选择(1)全部纳入法(2)全部删除法(3)向前回归法(4)向后回归法(5)逐步回归法上述五种方式可结合运用。十一、标识变量在回归分析中的应用在社会科学研究中,有许多分类变量,比如地区、时期、公司、民族、性别、婚姻状况、教育程度、职业和居住地等分类。这些分类信息对于研究同样是很重要的。虽然分类变量不能直接用于回归分析,但是通过将分类变量转换为按特定规则赋值的一套编码变量后,便可以将其作为自变量纳入多元线性回归模型,用以解释因变量的变化。并且,这种编码变量可以承载原分类变量的所有信息,将其引入回归方程后,所得到的回归结果也具有明确的意义解释。这类特殊编码变量在统计分析中通常称为标识。(一)虚拟变量的建立与应用分析1.建立虚拟变量的规则2.用单纯虚拟变量的回归模型来分析简单类别差异3.用虚拟变量和间距变量的回归模型分析经统计调整的类别差异4.用虚拟变量、间距变量及其交互变量的回归模型分析类别的水平差异和斜率差异(二)效应变量的建立与应用分析1.建立效应变量的规则2.用单纯效应变量的回归模型来分析简单类别差异3.用效应变量和间距变量的回归模型分析经统计调整的类别差异基本概念基本假定回归方程截距回归系数最小二乘估计确定系数偏确定系数整体检验偏回归系数检验标准化回归系数特定样本性质统计控制回归诊断异常值杠杆值权势影响偏回归散点图残差正态性均方差性多元共线性误差独立性非线性关系虚拟编码参照类效应编码大平均数方差分析协方差分析自变量交互作用本章要点1.多元回归分析的功能是描述和预测多个自变量对一个因变量发生影响作用的数量关系。2.多元回归分析的因变量必须为间距测度等级,其他自变量则必须为间距测度等级或特定的标识编码形式。3.在多元回归中,确定系数表示所有自变量对于因变量的解释能力。在社会科学研究中,多元回归确定系数一般不是很高,因此这一方法多用来进行分析和检验,较少用于预测。4.偏回归系数表示在控制其他自变量的条件下,某一自变量与因变量之间在变量实际测量单位基础上的数量关系,表示自变量每增加1个单位量所造成因变量的变化量。5.标准化偏回归系数为某一自变量对因变量的纯统计联系,不受变量实际测量单位的影响,因此可以用来比较各自变量对因变量相对作用大小。参

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论