版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第9章一元线性回归§9.1变量间关系的度量§9.2一元线性回归§9.3利用回归方程进行估计和预测§9.4残差分析§9.1变量间关系的度量变量间的关系相关关系的描述与测度相关系数的显著性检验变量间关系之函数关系是一一对应的确定关系;设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,
y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量;圆的面积(S)与半径之间的关系可表示为S=r2
商品的销售额(y)与销售量(x)之间的关系可表示为y=px
(p为单价)变量间关系之相关关系
(correlation)变量间关系不能用函数关系精确表达;一个变量的取值不能由另一个变量唯一确定;当变量x取某个值时,变量y的取值可能有几个;父亲身高(y)与子女身高(x)之间的关系收入水平(y)与受教育程度(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系相关关系的描述之散点图
(scatterdiagram)
不相关
负线性相关
正线性相关
非线性相关
完全负线性相关完全正线性相关
用散点图描述变量间的关系
(例题分析)【例9-1】为研究销售收入与广告费用支出之间的关系,某医药管理部门随机抽取20家药品生产企业,得到它们的年销售收入和广告费用支出(万元)的数据如下。绘制散点图描述销售收入与广告费用之间的关系。10/17/2023散点图
(销售收入和广告费用的散点图)10/17/2023相关关系的测度之相关系数
(correlationcoefficient)对变量之间关系密切程度的度量;对两个变量之间线性相关程度的度量称为简单相关系数;若相关系数是根据总体全部数据计算的,称为总体相关系数,记为
;若是根据样本数据计算的,则称为样本相关系数,记为r;相关系数
(计算公式)
样本相关系数的计算公式:或展开为:简写的离差平方和相关系数
(取值及其意义)
r
的取值范围是[-1,1];|r|=1,为完全相关:r=1,为完全正相关r=-1,为完全负正相关
r=0,不存在线性相关关系;
-1
r<0,为负相关;0<r
1,为正相关;
|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切(0.8-0.5-0.3)。相关系数的显著性检验
(检验的步骤)1. 检验两个变量之间是否存在线性相关关系;采用R.A.Fisher提出的t检验;检验的步骤为:提出假设:H0:
;H1:
0
计算检验的统计量:
确定显著性水平,并作出决策;
若P值<
,拒绝H0
若P值>
,不拒绝H0相关系数的显著性检验
(例题分析)【例9-3】检验销售收入与广告费用之间的相关系数是否显著(
0.05)提出假设:H0:
;H1:
0计算检验的统计量:3.用Excel中的【TDIST】函数得双尾P=2.743E-09<
0.05,拒绝H0,销售收入与广告费用之间的相关系数显著。10/17/2023相关系数的显著性检验
(SPSS输出结果)第1步:选择【分析】
【相关–双变量】第2步:将两个变量(本例为销售收入和广告费用)分别选入【变量】框,点击【确定】。10/17/2023§9.2一元线性回归一元线性回归模型参数的最小二乘估计回归直线的拟合优度显著性检验什么是回归分析?
(Regression)是分析变量之间关系的基本方法;就是从一组样本数据出发,确定变量之间的数学关系式;对该关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著;利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。一元线性回归涉及一个自变量的回归;因变量y与自变量x之间为线性关系;被预测或被解释的变量称为因变量(dependentvariable),用y表示;用来预测或用来解释因变量的一个或多个变量称为自变量(independentvariable),用x表示;因变量与自变量之间的关系用一线性方程来表示。一元线性回归模型描述因变量y如何依赖于自变量x和误差项
的方程称为回归模型;一元线性回归模型可表示为:
y=b0+b1x+ey是x的线性函数(部分)加上误差项;线性部分反映了由于x的变化而引起的y的变化;误差项
是随机变量;反映了除x和y之间的线性关系之外的随机因素对y的影响是不能由x和y之间的线性关系所解释的变异性
0和
1称为模型的参数;一元线性回归模型
(基本假定)
因变量y与自变量x之间具有线性关系;在重复抽样中,x的取值是确定的,即假定x是非随机的,而假定y是随机的;误差项
满足:正态性。是一个服从正态分布的随机变量,且期望值为0,即
~N(0,
2)。对于一个给定的x
值,y的期望值为E(y)=
0+
1x;方差齐性。对于所有的x
值,
的方差一个特定的值
2;独立性。独立性意味着对于一个特定的x
值,它所对应的ε与其他x
值所对应的ε不相关;对于一个特定的x
值,它所对应的y值与其他x
所对应的y值也不相关。10/17/2023回归方程
(regressionequation)描述y的平均值或期望值如何依赖于x的方程称为回归方程;一元线性回归方程的形式如下:
E(y)=
0+
1x方程的图示是一条直线,也称为直线回归方程;
0是回归直线在y轴上的截距,是当x=0时y的期望值;
1是直线的斜率,称为回归系数,表示当x每变动一个单位时,y平均值的变动;估计的回归方程
(estimatedregressionequation)一元线性回归中估计的回归方程为:用样本统计量和代替回归方程中的未知参数和,就得到了估计的回归方程;总体回归参数和
是未知的,必需利用样本数据去估计;其中:是估计的回归直线在y
轴上的截距,是直线的斜率,它表示对于一个给定的x
的值,是y
的估计值,也表示x
每变动一个单位时,y的平均变动值。参数的最小二乘估计
(methodofleastsquares)使因变量的观察值与估计值之间的离差平方和达到最小来求得和的方法。即:用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小;最小二乘估计
(图示)xy(xn,yn)(x1,y1)
(x2,y2)(xi,yi)}ei=yi-yi^最小二乘法设点i的观测值为(xi,yi),把xi代入待定的直线有yi到待定直线的距离为:
则n个点的铅直距离平方和为:为使Q最小,通过分别对,求导,建立方程组后求出,的值。最小二乘法
(计算公式)
可得求解和的公式如下:
首先对Q中的和求偏导数,并令其等于0,得到:回归直线的拟合优度之变差因变量y的取值是不同的,y取值的这种波动称为变差。对一个具体的观测值来说,其变差的大小可以通过该实际观测值与其均值之差来表示;对于n次观测的总变差,可以用这些离差的平方和表示;变差来源于两个方面:由于自变量x的取值不同造成的;除x以外的其他因素的影响;xyy{}}
变差的分解
(图示)离差平方和的分解
(三个平方和的关系)SST=SSR+SSE其中:总平方和(SST){回归平方和(SSR){残差平方和(SSE){离差平方和的分解
(三个平方和的意义)总平方和(SST)反映因变量的n个观察值与其均值的总离差;回归平方和(SSR)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和;残差平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和;判定系数
(coefficientofdetermination)回归平方和占总离差平方和的比例:反映回归直线的拟合程度;取值范围在[0,1]之间;
R21,说明回归方程拟合越好;R20,说明回归方程拟合越差;判定系数等于相关系数的平方,即R2=(r)2;估计标准误差
(standarderrorofestimate)实际观测值与回归估计值离差平方和的均方根;反映实际观测值在回归直线周围的分散状况;是对误差项
的标准差
的估计,是在排除了x对y的线性影响后y随机波动大小的一个估计量;反映了用估计的回归方程预测y时预测误差的大小;计算公式为:显著性检验之线性关系检验检验自变量与因变量之间的线性关系是否显著;将回归均方(MSR)同残差均方(MSE)加以比较,运用F检验来分析二者之间的差别是否显著;回归均方:回归平方和SSR除以相应的自由度(自变量的个数k)残差均方:残差平方和SSE除以相应的自由度(n-k-1)线性关系的检验
(F检验)提出假设H0:
1=0线性关系不显著2.计算检验统计量F确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F
作出决策:若F>F
,拒绝H0;若F<F
,不拒绝H0显著性检验之回归系数的检验在一元线性回归中,等价于线性关系的显著性检验;检验x与y之间是否具有线性关系,或者说,检验自变量x对因变量y的影响是否显著;理论基础是回归系数
的抽样分布;回归系数的检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年中国输油泵市场调查研究报告
- 2024年03月福建海峡银行2024年校园招考微贷客户经理专岗人员笔试历年参考题库附带答案详解
- 天津2025年天津体育学院招聘硕士及以上岗位工作人员笔试历年典型考点(频考版试卷)附带答案详解
- 2024年03月徽商银行社会招考笔试历年参考题库附带答案详解
- 2025年度甲级办公场地使用权转让合同3篇
- 2025年人工智能技术研发项目融资合同范本3篇
- 2025年度综合性办公场所租赁及物业管理服务合同3篇
- 2025年度交通枢纽安保劳务派遣服务合同3篇
- 2025年PVC玩具设计与制造合同3篇
- 2024年行政法修订要点丨行政协议签订与管理合同3篇
- 教师职业道德与专业发展智慧树知到期末考试答案2024年
- 农村污水处理设施运维方案特别维护应急处理预案
- 幕墙工程专项施工方案审批流程
- 新视野英语教程(第四版)读写教程1 期末测试卷 测试卷A
- 【施工组织方案】框架结构施工组织设计
- 人工智能背景下高校智慧思政建设
- 高考物理复习讲义第88讲 电磁感应中的双杆模型(解析版)
- 市级课题研究成果案例一等奖《“教研训一体化”混合式培训模式的建构与实践》
- 老年人的心肺复苏课件
- 贵州省毕节市威宁彝族回族苗族自治县2023-2024学年八年级上学期期末数学试题(含答案)
- 智慧树知到《军事理论-军事思想强化版》章节测试答案
评论
0/150
提交评论