版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学
STATISTICS第11章一元线性回归
(第六版)
统计学
作者:中国人民大学统计学院
贾俊平
11-1
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS第11章一元线性回归
(第六版)
11.1变量间关系的度量
11.2一元线性回归
11.3利用回归方程进行估计和预测
11.4残差分析
11-2
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS学习目标
(第六版)
1.相关关系的分析方法
2.一元线性回归的基本原理和参数的最小
二乘估计
3.回归直线的拟合优度
4.回归方程的显著性检验
5.利用回归方程进行估计和预测
6.用Excel进行回归
11-3
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS11.1变量间关系的度量
(第六版)
11.1.1变量间的关系
11.1.2相关关系的描述与测度
11.1.3相关系数的显著性检验
11-4
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
变量间的关系
11-5
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS函数关系
(第六版)
1.是一一是一一对应的确定关系对应的确定关系
2.设设有有两两个个变变量量xx和和yy,,变变量量
y
yy随随变变量量xx一一起起变变化化,,并并完完
全全依依赖赖于于,,当当变变量量取取某某
xxxx
个个数数值值时时,,yy依依确确定定的的关关系系
取取相相应应的的值值,,则则称称yy是是xx的的
函数,记为,其中
函数,记为yy==ff((xx)),其中
xx称称为为自自变变量量,,yy称称为为因因变变
量量x
3.各各观测点落在一条线上观测点落在一条线上
11-6
作者:贾俊平,中国人民大学统计学院
统计学函数关系
STATISTICS
(第六版)(几个例子)
n某种商品的销售额y与销售量x之间的关系可
表示为y=px(p为单价)
n圆的面积S与半径R之间的关系可表示为
S=R2
n企业的原材料消耗额y与产量x1、单位产量
消耗x2、原材料价格x3之间的关系可表示为
y=x1x2x3
11-7
作者:贾俊平,中国人民大学统计学院
统计学相关关系
STATISTICS
(第六版)(correlation)
1.变量间关系不能用函数关
系精确表达y
2.一个变量的取值不能由另
一个变量唯一确定
3.当变量x取某个值时,变
量y的取值可能有几个
4.各观测点分布在直线周围x
11-8
作者:贾俊平,中国人民大学统计学院
统计学相关关系
STATISTICS
(第六版)(几个例子)
n父亲身高y与子女身高x之间的关系
n收入水平y与受教育程度x之间的关系
n粮食单位面积产量y与施肥量x1、降雨量
x2、温度x3之间的关系
n商品的消费量y与居民收入x之间的关系
n商品销售额y与广告费支出x之间的关系
11-9
作者:贾俊平,中国人民大学统计学院
统计学相关关系
STATISTICS
(第六版)(类型)
11-10
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
相关关系的描述与测度
(散点图)
11-11
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS相关分析及其假定
(第六版)
1.相关分析要解决的问题相关分析要解决的问题
n变量之间是否存在关系?
n如果存在关系,它们之间是什么样的关系?
n变量之间的关系强度如何?
n样本所反映的变量之间的关系能否代表总体变量之
间的关系?
2.为为解解决决这这些些问问题题,,在在进进行行相相关关分分析析时时,,对对总总体体有有
以下两个主要假定以下两个主要假定
n两个变量之间是线性关系
n两个变量都是随机变量
11-12
作者:贾俊平,中国人民大学统计学院
统计学散点图
STATISTICS
(第六版)(scatterdiagram)
完全正线性相关完全正线性相关完全负线性相关完全负线性相关非线性相关非线性相关
正线性相关正线性相关负线性相关负线性相关不相关不相关
11-13
作者:贾俊平,中国人民大学统计学院
统计学散点图
STATISTICS
(第六版)(例题分析)
【【例例】】一一家家大大型型商商业业银银行行在在多多个个地地区区设设有有分分行行,,其其
业业务务主主要要是是进进行行基基础础设设施施建建设设、、国国家家重重点点项项目目
建建设设、、固固定定资资产产投投资资等等项项目目的的贷贷款款。。近近年年来来,,
该该银银行行的的贷贷款款额额平平稳稳增增长长,,但但不不良良贷贷款款额额也也有有
较较大大比比例例的的增增长长,,这这给给银银行行业业务务的的发发展展带带来来较较
大大压压力力。。为为弄弄清清楚楚不不良良贷贷款款形形成成的的原原因因,,管管理理
者者希希望望利利用用银银行行业业务务的的有有关关数数据据做做些些定定量量分分析析,,
以以便便找找出出控控制制不不良良贷贷款款的的办办法法。。下下面面是是该该银银行行
所属的所属的2525家分行的有关业务数据家分行的有关业务数据
11-14
作者:贾俊平,中国人民大学统计学院
统计学散点图
STATISTICS
(第六版)(例题分析)
11-15
作者:贾俊平,中国人民大学统计学院
统计学散点图
STATISTICS
(第六版)(不良贷款对其他变量的散点图)
11-16
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
相关关系的描述与测度
(相关系数)
11-17
作者:贾俊平,中国人民大学统计学院
统计学相关系数
STATISTICS
(第六版)(correlationcoefficient)
1.度量变量之间关系强度的一个统计量度量变量之间关系强度的一个统计量
2.对对两两个个变变量量之之间间线线性性相相关关强强度度的的度度量量称称为为简简单单相相
关系数关系数
3.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,,称称为为总总
体相关系数,记为体相关系数,记为
4.若若是是根根据据样样本本数数据据计计算算的的,,则则称称为为样样本本相相关关系系数数,,
简称为相关系数,记为简称为相关系数,记为rr
n也称为线性相关系数(linearcorrelationcoefficient)
n或称为Pearson相关系数(Pearson’scorrelation
coefficient)
11-18
作者:贾俊平,中国人民大学统计学院
统计学相关系数
STATISTICS
(第六版)(计算公式)
样本相关系数的计算公式
或化简为
11-19
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS相关系数的性质
(第六版)
性质1:r的取值范围是[-1,1]
n||rr|=|=11,,为完全相关为完全相关
lrr==11,为,为完全正相关完全正相关
lrr==-1-1,,为完全负正相关为完全负正相关
nrr==00,,不存在不存在线性线性相关相关关系关系
n-1-1rr<<00,,为负相关为负相关
n00<<rr11,,为正相关为正相关
n||rr||越越趋趋于于11表表示示关关系系越越强强;;||rr||越越趋趋于于00表表示示关关
系越弱系越弱
11-20
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS相关系数的性质
(第六版)
性质性质22::rr具有对称性。即具有对称性。即xx与与yy之间的相关系数和之间的相关系数和yy与与xx之间之间
的相关系数相等,即的相关系数相等,即rrxyxy==rryxyx
性质性质33::rr数值大小与数值大小与xx和和yy原点及尺度无关,即改变原点及尺度无关,即改变xx和和yy的的
数据原点及计量尺度,并不改变数据原点及计量尺度,并不改变rr数值大小数值大小
性质性质44::仅仅是仅仅是xx与与yy之间线性关系的一个度量,它不能用之间线性关系的一个度量,它不能用
于描述非线性关系。这意为着,于描述非线性关系。这意为着,rr=0=0只表示两个变只表示两个变
量之间不存在线性相关关系,并不说明变量之间没量之间不存在线性相关关系,并不说明变量之间没
有任何关系有任何关系
性质性质55::rr虽然是两个变量之间线性关系的一个度量,却不虽然是两个变量之间线性关系的一个度量,却不
一定意味着一定意味着xx与与yy一定有因果关系一定有因果关系
11-21
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS相关系数的经验解释
(第六版)
1.|r|0.8时,可视为两个变量之间高度相
关
2.0.5|r|<0.8时,可视为中度相关
3.0.3|r|<0.5时,视为低度相关
4.|r|<0.3时,说明两个变量之间的相关程度
极弱,可视为不相关
5.上述解释必须建立在对相关系数的显著性
进行检验的基础之上
11-22
作者:贾俊平,中国人民大学统计学院
统计学相关系数
STATISTICS
(第六版)(例题分析)
用用ExcelExcel计算相关系数计算相关系数
11-23
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
相关系数的显著性检验
11-24
作者:贾俊平,中国人民大学统计学院
统计学相关系数的显著性检验
STATISTICS
(第六版)(检验的步骤)
1.检验两个变量之间是否存在线性相关关系
2.等价于对回归系数b1的检验
3.采用R.A.Fisher提出的t检验
4.检验的步骤为
n提出假设:提出假设:HH00::;;HH11::00
n计算检验的统计量:
n确定显著性水平,并作出决策
•若t>t,拒绝H0
•若t<t,不拒绝H0
11-25
作者:贾俊平,中国人民大学统计学院
统计学相关系数的显著性检验
STATISTICS
(第六版)(例题分析)
对不良贷款与贷款余额之间的相关系数进行显著性检对不良贷款与贷款余额之间的相关系数进行显著性检
验验((0.050.05))
1.1.提提出假设:出假设:HH00::;;HH11::00
2.2.计算计算检验的统计量检验的统计量
3.3.根据根据显著性水平显著性水平==0.050.05,查,查tt分布表得分布表得tt((nn-2)=2.069-2)=2.069
§§由由于于tt=7.5344>=7.5344>tt(25-2)=2.069(25-2)=2.069,,拒拒绝绝HH00,,不不良良贷贷
款与贷款余额之间存在着显著的正线性相关关系款与贷款余额之间存在着显著的正线性相关关系
11-26
作者:贾俊平,中国人民大学统计学院
统计学相关系数的显著性检验
STATISTICS
(第六版)(例题分析)
各相关系数检验的统计量
11-27
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS11.2一元线性回归
(第六版)
11.2.1一元线性回归模型
11.2.2参数的最小二乘估计
11.2.3回归直线的拟合优度
11.2.4显著性检验
11-28
作者:贾俊平,中国人民大学统计学院
统计学什么是回归分析?
STATISTICS
(第六版)(Regression)
1.从一组样本数据出发,确定变量之间的数学
关系式
2.对这些关系式的可信程度进行各种统计检验,
并从影响某一特定变量的诸多变量中找出哪
些变量的影响显著,哪些不显著
3.利用所求的关系式,根据一个或几个变量的
取值来预测或控制另一个特定变量的取值,
并给出这种预测或控制的精确程度
11-29
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS回归模型的类型
(第六版)
11-30
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
一元线性回归模型
11-31
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS一元线性回归
(第六版)
1.涉及一个自变量的回归
2.因变量y与自变量x之间为线性关系
n被被预预测测或或被被解解释释的的变变量量称称为为因因变变量量
(dependent(dependentvariable)variable),用,用yy表示表示
n用用来来预预测测或或用用来来解解释释因因变变量量的的一一个个或或多多个个变变
量量称称为为自自变变量量(independent(independentvariable)variable),,用用xx
表示表示
3.因变量与自变量之间的关系用一个线性方
程来表示
11-32
作者:贾俊平,中国人民大学统计学院
统计学回归模型
STATISTICS
(第六版)(regressionmodel)
1.回答“变量之间是什么样的关系?”
2.方程中运用
n11个数值型因变量个数值型因变量((响应变量响应变量))
l被预测的变量
n11个或多个数值型或分类型自变量个或多个数值型或分类型自变量((解释变量解释变量
))
l用于预测的变量
3.主要用于预测和估计
11-33
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS一元线性回归模型
(第六版)
1.描描述述因因变变量量yy如如何何依依赖赖于于自自变变量量xx和和误误差差项项的的
方程称为方程称为回归模型回归模型
2.一元线性一元线性回归模型可表示为回归模型可表示为
yy==bb00++bb11xx++ee
ny是x的线性函数(部分)加上误差项
n线性部分反映了由于x的变化而引起的y的变化
n误差项是随机变量
l反映了除x和y之间的线性关系之外的随机因素对y的
影响
l是不能由x和y之间的线性关系所解释的变异性
n0和1称为模型的参数
11-34
作者:贾俊平,中国人民大学统计学院
统计学一元线性回归模型
STATISTICS
(第六版)(基本假定)
1.1.因变量因变量xx与自变量与自变量yy之间具有线性关系之间具有线性关系
2.2.在重复抽样中,自变量在重复抽样中,自变量xx的取值是固定的,即假定的取值是固定的,即假定xx是是
非随机的非随机的
3.3.误差误差项项εε是一个期望值为是一个期望值为00的随机变量,即的随机变量,即EE((εε)=0)=0。。对对
于一个给定的于一个给定的xx值,值,yy的期望值为的期望值为EE((yy))==00++11xx
4.4.对对于所有的于所有的xx值,值,εε的方差的方差σσ22都相同都相同
5.5.误误差差项项εε是是一一个个服服从从正正态态分分布布的的随随机机变变量量,,且且相相互互独独立立。。
即即εε~~NN(0(0,,σσ22))
n独立性意味着对于一个特定的x值,它所对应的ε与其他x
值所对应的ε不相关
n对于一个特定的x值,它所对应的y值与其他x所对应的y
值也不相关
11-35
作者:贾俊平,中国人民大学统计学院
统计学一元线性回归模型
STATISTICS
(第六版)(基本假定)
y
x=x1时y的分布x=x2时y的分布x=x3时y的分布
0
0+1x
x=x1时的E(y)
x=x2时的E(y)
x1
1x=x3时的E(y)
x2
x3
11-36
作者:贾俊平,中国人民大学统计学院x
统计学回归方程
STATISTICS
(第六版)(regressionequation)
1.描述y的平均值或期望值如何依赖于x的方程
称为回归方程
2.一元线性回归方程的形式如下
3.E(y)=0+1x
§方程的图示是一条直线,也称为直线回归方程
§0是回归直线在y轴上的截距,是当x=0时y的期
望值
§1是直线的斜率,称为回归系数,表示当x每变动
一个单位时,y的平均变动值
11-37
作者:贾俊平,中国人民大学统计学院
统计学估计的回归方程
STATISTICS
(第六版)(estimatedregressionequation)
1.总总体体回回归归参参数数和和是是未未知知的的,,必必须须利利用用样样本本数数
据去估计据去估计
2.用用样样本本统统计计量量和和代代替替回回归归方方程程中中的的未未知知参参
数数和和,就得到了,就得到了估计的回归方程估计的回归方程
3.一元线性回归中估计的回归方程为一元线性回归中估计的回归方程为
其中:是估计的回归直线在y轴上的截距,是直线
的斜率,它表示对于一个给定的x的值,是y的估计
值,也表示x每变动一个单位时,y的平均变动值
11-38
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
参数的最小二乘估计
11-39
作者:贾俊平,中国人民大学统计学院
统计学最小二乘估计
STATISTICS
(第六版)(methodofleastsquares)
1.德国科学家KarlGauss(1777—1855)提出用最
小化图中垂直方向的误差平方和来估计参数
2.使因变量的观察值与估计值之间的误差平方和
达到最小来求得和的方法。即
3.用最小二乘法拟合的直线来代表x与y之间的
关系与实际数据的误差比其他任何直线都小
11-40
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICSKarlGauss的最小化图
(第六版)
yy
(xn,yn)
(x,y)
22
eii=yii-^yii
(x,y)
iiii
(x,y)
11-4111
作者:贾俊平,中国人民大学统计学院xx
统计学最小二乘法
STATISTICS
(第六版)(和的计算公式)
根据最小二乘法,可得求解和的公式如下
11-42
作者:贾俊平,中国人民大学统计学院
统计学估计方程的求法
STATISTICS
(第六版)(例题分析)
【例】求不良贷款对贷款余额的回归方程
回归方程为:y^=-0.8295+0.037895x
回回归归系系数数=0.037895=0.037895表表示示,,贷贷款款余余额额每每增增
加加11亿元,不良贷款平均增加亿元,不良贷款平均增加0.0378950.037895亿元亿元
11-43
作者:贾俊平,中国人民大学统计学院
统计学估计方程的求法
STATISTICS
(第六版)(例题分析)
不良贷款对贷款余额回归方程的图示
11-44
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS用Excel进行回归分析
(第六版)
第第11步:步:选择选择【【工具工具】】下拉菜单下拉菜单
第第22步:步:选择选择【【数据分析数据分析】】选项选项
第第33步:步:在分析工具中选择在分析工具中选择【【回归回归】】,选择,选择【【确定确定】】
第第44步:步:当对话框出现时当对话框出现时
在在【【YY值输入区域值输入区域】】设置框内键入设置框内键入YY的数据区域的数据区域
在在【【XX值输入区域值输入区域】】设置框内键入设置框内键入XX的数据区域的数据区域
在在【【置信度置信度】】选项中给出所需的数值选项中给出所需的数值
在在【【输出选项输出选项】】中选择输出区域中选择输出区域
在在【【残差残差】】分析选项中选择所需的选项分析选项中选择所需的选项
11-45
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
回归直线的拟合优度
11-46
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS变差
(第六版)
1.因变量y的取值是不同的,y取值的这种
波动称为变差。变差来源于两个方面
n由于自变量由于自变量xx的取值不同造成的的取值不同造成的
n除除xx以以外外的的其其他他因因素素((如如xx对对yy的的非非线线性性影影响响、、
测量误差等测量误差等))的影响的影响
2.对一个具体的观测值来说,变差的大小可
以通过该实际观测值与其均值之差来
表示
11-47
作者:贾俊平,中国人民大学统计学院
统计学误差的分解
STATISTICS
(第六版)(图示)
yy
yy
11-48xx
作者:贾俊平,中国人民大学统计学院
统计学误差平方和的分解
STATISTICS
(第六版)(三个平方和的关系)
{
{
{
总平方和总平方和回归平方和回归平方和残差平方和残差平方和
((SSTSST))((SSRSSR))((SSESSE))
SST=SSR+SSE
11-49
作者:贾俊平,中国人民大学统计学院
统计学误差平方和的分解
STATISTICS
(第六版)(三个平方和的意义)
1.总平方和总平方和((SST—SST—totaltotalsumsumofofsquaressquares))
n反映因变量的n个观察值与其均值的总误差
2.回回归归平平方方和和((SSRSSR——sumsumofofsquaressquaresofof
regressionregression))
n反映自变量x的变化对因变量y取值变化的影响,
或者说,是由于x与y之间的线性关系引起的y的
取值变化,也称为可解释的平方和
3.残差平方和残差平方和((SSESSE—sum—sumofofsquaressquaresofoferror)error)
n反映除x以外的其他因素对y取值的影响,也称为
不可解释的平方和或剩余平方和
11-50
作者:贾俊平,中国人民大学统计学院
统计学判定系数R2
STATISTICS
(第六版)(coefficientofdetermination)
1.回归平方和占总误差平方和的比例
2.反映回归直线的拟合程度
3.取值范围在[0,1]之间
4.R21,说明回归方程拟合的越好;R20,
说明回归方程拟合的越差
5.判定系数等于相关系数的平方,即R2=r2
11-51
作者:贾俊平,中国人民大学统计学院
统计学判定系数
STATISTICS
(第六版)(例题分析)
【【例例】】计计算算不不良良贷贷款款对对贷贷款款余余额额回回归归的的判判定定系系数数,,并并解解释释
其意义其意义
判判定定系系数数的的实实际际意意义义是是::在在不不良良贷贷款款取取值值的的变变差差中中,,
有有71.16%71.16%可可以以由由不不良良贷贷款款与与贷贷款款余余额额之之间间的的线线性性关关系系
来来解解释释,,或或者者说说,,在在不不良良贷贷款款取取值值的的变变动动中中,,有有
71.16%71.16%是是由由贷贷款款余余额额所所决决定定的的。。也也就就是是说说,,不不良良贷贷款款
取取值值的的差差异异有有2/32/3以以上上是是由由贷贷款款余余额额决决定定的的。。可可见见不不良良
贷款与贷款余额之间有较强的线性关系贷款与贷款余额之间有较强的线性关系
11-52
作者:贾俊平,中国人民大学统计学院
统计学估计标准误差
STATISTICS
(第六版)(standarderrorofestimate)
1.实际观察值与回归估计值误差平方和的均方根实际观察值与回归估计值误差平方和的均方根
2.反映实际观察值在回归直线周围的分散状况反映实际观察值在回归直线周围的分散状况
3.对对误误差差项项的的标标准准差差的的估估计计,,是是在在排排除除了了xx对对yy的的
线性影响后,线性影响后,yy随机波动大小的一个估计量随机波动大小的一个估计量
4.反反映用估计的回归方程预测映用估计的回归方程预测yy时预测误差的大小时预测误差的大小
5.计算公式为计算公式为
注:例题的计算结果为注:例题的计算结果为1.97991.9799
11-53
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
显著性检验
11-54
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS线性关系的检验
(第六版)
1.检验自变量与因变量之间的线性关系是否
显著
2.将回归均方(MSR)同残差均方(MSE)加以比
较,应用F检验来分析二者之间的差别是否
显著
§回回归归均均方方::回回归归平平方方和和SSRSSR除除以以相相应应的的自自由由
度度((自自变变量的个数量的个数kk))
§残残差差均均方方::残残差差平平方方和和SSESSE除除以以相相应应的的自自由由
度度((nn--kk-1)-1)
11-55
作者:贾俊平,中国人民大学统计学院
统计学线性关系的检验
STATISTICS
(第六版)(检验的步骤)
1.提出假设
nHH00::11=0=0线性关系不显著线性关系不显著
2.计算检验统计量F
3.确定显著性水平,并根据分子自由度1和分
母自由度n-2找出临界值F
4.作出决策:若F>F,拒绝H0;若F<F,不拒
绝H
11-560
作者:贾俊平,中国人民大学统计学院
统计学线性关系的检验
STATISTICS
(第六版)(例题分析)
1.提出假设
nHH00::11=0=0不不良良贷贷款款与与贷贷款款余余额额之之间间的的线线性性关关
系不显著系不显著
2.计算检验统计量F
3.确定显著性水平=0.05,并根据分子自由度1
和分母自由度25-2找出临界值F=4.28
4.作出决策:若F>F,拒绝H0,线性关系显著
11-57
作者:贾俊平,中国人民大学统计学院
统计学线性关系的检验
STATISTICS
(第六版)(方差分析表)
Excel输出的方差分析表
11-58
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS回归系数的检验
(第六版)
1.检验x与y之间是否具有线性关系,或者说,
检验自变量x对因变量y的影响是否显著
2.理论基础是回归系数的抽样分布
3.在一元线性回归中,等价于线性关系的显著性
检验
4.采用t检验
11-59
作者:贾俊平,中国人民大学统计学院
统计学回归系数的检验
STATISTICS
(第六版)(检验步骤)
1.提出假设提出假设
nHH00::bb11==00((没有线性关系没有线性关系))
nHH11::bb1100((有线性关系有线性关系))
2.计算检验的统计量计算检验的统计量
3.确定显著性水平确定显著性水平,并进行决策,并进行决策
§tt>>tt,,拒绝拒绝HH00;;tt<<tt,,不拒绝不拒绝HH00
11-60
作者:贾俊平,中国人民大学统计学院
统计学回归系数的检验
STATISTICS
(第六版)(例题分析)
对例题的回归系数进行显著性检验对例题的回归系数进行显著性检验((==0.050.05))
1.提出假设提出假设
nHH00::bb11==00
nHH11::bb1100
2.计算检验的统计量计算检验的统计量
3.tt=7.533515>=7.533515>tt=2.201=2.201,,拒拒绝绝HH00,,表表明明不不良良贷贷款款
与贷款余额之间有显著的线性关系与贷款余额之间有显著的线性关系
11-61
作者:贾俊平,中国人民大学统计学院
统计学回归系数的检验
STATISTICS
(第六版)(例题分析)
P值的应用
PP=0.000000<=0.000000<=0.05=0.05,,拒绝原假设,拒绝原假设,不良贷款与贷不良贷款与贷
款余额之间有显著的线性关系款余额之间有显著的线性关系
11-62
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS回归分析结果的评价
(第六版)
ll建建立立的的模模型型是是否否合合适适??或或者者说说,,这这个个拟拟合合的的模模型型有有多多
““好好””?要回答这些问题,可以从以下几个方面入手?要回答这些问题,可以从以下几个方面入手
1.1.所所估估计计的的回回归归系系数数的的符符号号是是否否与与理理论论或或事事先先预预期期相相
一致一致
n在不良贷款与贷款余额的回归中,可以预期贷款余额越多,
不良贷款也可能会越多,也就是说,回归系数的值应该是
正的,在上面建立的回归方程中,我们得到的回归系数
为正值,
2.2.如如果果理理论论上上认认为为xx与与yy之之间间的的关关系系不不仅仅是是正正的的,,而而且且是是
统计上显著的,那么所建立的回归方程也应该如此统计上显著的,那么所建立的回归方程也应该如此
n在不良贷款与贷款余额的回归中,二者之间为正的线性关
系,而且,对回归系数的tt检验结果表明而这之间的线性
11-63关系是统计上显著的
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS回归分析结果的评价
(第六版)
3.回归模型在多大程度上解释了因变量y取值的
差异?可以用判定系数R2来回答这一问题
n在在不不良良贷贷款款与与贷贷款款余余额额的的回回归归中中,,得得到到的的
RR22=71.16%=71.16%,,解解释释了了不不良良贷贷款款变变差差的的2/32/3以以上上,,
说明拟合的效果还算不错说明拟合的效果还算不错
4.考察关于误差项的正态性假定是否成立。因
为我们在对线性关系进行F检验和回归系数进
行t检验时,都要求误差项服从正态分布,否
则,我们所用的检验程序将是无效的。正态
性的简单方法是画出残差的直方图或正态概
率图
11-64
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICSExcel输出的部分回归结果
(第六版)
名称计算公式
AdjustedAdjustedRRSquareSquare
InterceptIntercept的抽样标准误差的抽样标准误差
Intercept95%Intercept95%的置信区间的置信区间
斜率斜率95%95%的置信区间的置信区间
11-65
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS11.3利用回归方程进行估计和预测
(第六版)
11.3.1点估计
11.3.2区间估计
11-66
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS利用回归方程进行估计和预测
(第六版)
1.根据自变量x的取值估计或预测因变量y
的取值
2.估计或预测的类型
n点估计点估计
lyy的平均值的点估计的平均值的点估计
lyy的个别值的点估计的个别值的点估计
n区间估计区间估计
lyy的平均值的的平均值的置信区间置信区间估计估计
lyy的个别值的的个别值的预测区间预测区间估计估计
11-67
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
点估计
11-68
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS点估计
(第六版)
1.对于自变量x的一个给定值x0,根据回归方
程得到因变量y的一个估计值
2.点估计值有
nyy的的平均值平均值的点估计的点估计
nyy的的个别值个别值的点估计的点估计
3.在点估计条件下,平均值的点估计和个别值的
的点估计是一样的,但在区间估计中则不同
11-69
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICSy的平均值的点估计
(第六版)
利用估计的回归方程,对于自变量x的一个
给定值x0,求出因变量y的平均值的一个
估计值E(y0),就是平均值的点估计
n在在前前面面的的例例子子中中,,假假如如我我们们要要估估计计贷贷款款余余额额
为为100100亿亿元元时时,,所所有有分分行行不不良良贷贷款款的的平平均均值值,,
就就是是平平均均值值的的点点估估计计。。根根据据估估计计的的回回归归方方程程
得得
11-70
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICSy的个别值的点估计
(第六版)
利用估计的回归方程,对于自变量x的一
个给定值x0,求出因变量y的一个个别值
的估计值,就是个别值的点估计
n例例如如,,如如果果我我们们只只是是想想知知道道贷贷款款余余额额为为72.872.8
亿亿元元的的那那个个分分行行((这这里里是是编编号号为为1010的的那那个个分分行行
))的的不不良良贷贷款款是是多多少少,,则则属属于于个个别别值值的的点点估估计计
。根据估计的回归方程得。根据估计的回归方程得
11-71
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
区间估计
11-72
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS区间估计
(第六版)
1.点估计不能给出估计的精度,点估计值与
实际值之间是有误差的,因此需要进行区
间估计
2.对于自变量x的一个给定值x0,根据回归
方程得到因变量y的一个估计区间
3.区间估计有两种类型
n置信区间估计置信区间估计((confidenceconfidenceintervalintervalestimateestimate))
n预测区间估计预测区间估计(prediction(predictionintervalintervalestimateestimate))
11-73
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS置信区间估计
(第六版)
1.利用利用估计的回归方程,对于自变量估计的回归方程,对于自变量xx的一个给定的一个给定
值值xx00,,求出因变量求出因变量yy的的平均值的估计区间平均值的估计区间,这,这
一估计区间称为一估计区间称为置信区间置信区间((confidenceconfidenceintervalinterval))
2.EE((yy00))在在1-1-置信置信水平下的置信区间为水平下的置信区间为
式中:se为估计标准误差
11-74
作者:贾俊平,中国人民大学统计学院
统计学置信区间估计
STATISTICS
(第六版)(例题分析)
【【例例】】求求出出贷贷款款余余额额为为100100亿亿元元时时,,不不良良贷贷款款95%95%置置
信水平下的置信区间信水平下的置信区间
解:解:根据前面的计算结果,已知根据前面的计算结果,已知nn=25=25,,
ssee==1.97991.9799,,tt(25-2)=2.069(25-2)=2.069
置信区间为置信区间为
当当贷贷款款余余额额为为100100亿亿元元时时,,不不良良贷贷款款的的平平均均值值
在在2.11412.1141亿元到亿元到3.80593.8059亿元之间亿元之间
11-75
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS预测区间估计
(第六版)
1.利用估计利用估计的回归方程,对于自变量的回归方程,对于自变量xx的一个给的一个给
定值定值xx00,,求出因变量求出因变量yy的的一个个别值的估计区一个个别值的估计区
间,这一区间称为间,这一区间称为预测区间预测区间(prediction(prediction
intervalinterval))
2.yy00在在1-1-置信水平下的预测区间为置信水平下的预测区间为
注意!
11-76
作者:贾俊平,中国人民大学统计学院
统计学预测区间估计
STATISTICS
(第六版)(例题分析)
【【例例】】求求出出贷贷款款余余额额为为72.872.8亿亿元元的的那那个个分分行行,,不不良良贷贷
款款95%95%的预测区间的预测区间
解:解:根据前面的计算结果,已知根据前面的计算结果,已知nn=25=25,,
ssee==1.97991.9799,,tt(25-2)=2.069(25-2)=2.069
预测区间为预测区间为
贷贷款款余余额额为为72.872.8亿亿元元的的那那个个分分行行,,其其不不良良贷贷款款
的预测区间在的预测区间在-2.2766-2.2766亿元到亿元到6.13666.1366亿元之间亿元之间
11-77
作者:贾俊平,中国人民大学统计学院
统计学置信区间和预测区间
STATISTICS
(第六版)(例题分析)
11-78
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS置信区间、预测区间、回归方程
(第六版)
y
预测上限
置信上限
置信下限
预测下限
11-79x
作者:贾俊平,中国人民大学统计学院
xxpp
统计学
STATISTICS11.4残差分析
(第六版)
11.4.1残差与残差图
11.4.2标准化
11-80
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS
(第六版)
残差与残差图
11-81
作者:贾俊平,中国人民大学统计学院
统计学残差
STATISTICS
(第六版)(residual)
1.因变量的观测值与根据估计的回归方程
求出的预测值之差,用e表示
2.反映了用估计的回归方程去预测而引起
的误差
3.可用于确定有关误差项的假定是否成立
4.用于检测有影响的观测值
11-82
作者:贾俊平,中国人民大学统计学院
统计学残差图
STATISTICS
(第六版)(residualplot)
1.表示残差的图形
n关于关于xx的残差图的残差图
n关于关于yy的残差图的残差图
n标准化残差图标准化残差图
2.用于判断误差的假定是否成立
3.检测有影响的观测值
11-83
作者:贾俊平,中国人民大学统计学院
统计学残差与标准化残差图
STATISTICS
(第六版)(例题分析)
11-84
作者:贾俊平,中国人民大学统计学院
统计学残差图
STATISTICS
(第六版)(形态及判别)
残残残残残
差差差差差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 14880-2:2024 EN Optics and photonics - Microlens arrays - Part 2: Test methods for wavefront aberrations
- DB12T 578-2015 液化气体汽车罐车用紧急切断阀检验方法与评定要求
- 新学期学习计划范文汇编6篇
- 智能运输系统 体系结构 服务 编制说明
- 全国连锁洗衣店分布简报 2024 -洗衣行业如何抢占商机 来看这份连锁洗衣店选址布局
- 春节期间通信保障方案
- 雪房子课件教学课件
- 部编版历史九年级上册第六单元 第17课《君主立宪制的英国》说课稿
- 高压电工作业题库
- 宝安区重点中学七年级上学期语文期中考试试卷
- 犟龟-完整版获奖课件
- 工业产品CAD技能三级试题及其评分标准
- 多元统计分析习题及解答
- 汉语词性专题练习(附答案)
- 劳动合同-高管补充协议20110520
- 浙江省温州市地图矢量PPT模板(图文)
- 上海市建设工程项目管理机构管理人员情况表
- 北师大版二年级数学上册第九单元《除法》知识点梳理复习ppt
- 空气能室外机保养维护记录表
- DB37∕T 5162-2020 装配式混凝土结构钢筋套筒灌浆连接应用技术规程
- 9-2 《第三方过程评估淋蓄水检查内容》(指引)
评论
0/150
提交评论