




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章相关和回归分析PowerPoint统计学开篇案例
一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点建设和固定资产投资等项目的贷款。近年来,随着经济环境的变化,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务带来较大的压力。开篇案例
为弄清楚不良贷款形成的原因,银行行长除了对经济环境做了广泛的调研外,还希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。
为此,有关人员收集了该银行所属的25家分行2010年的有关业务数据(如下表7—1)某商业银行2010年的主要业务数据分行编号各项贷款余额(亿元)贷款项目个数(个)固定资产投资额(亿元)不良贷款(亿元)167.3551.90.92111.31690.91.13173.01773.74.8480.81014.53.25199.71963.27.8616.212.22.77107.41720.21.68185.41843.812.5996.11055.91.11072.81464.32.61164.21142.70.312132.22376.74.0表7—1:银行业务数据1续表:分行编号各项贷款余额(亿元)贷款项目个数(个)本年固定资产投资额(亿元)不良贷款(亿元)1358.61422.80.814174.626117.13.515263.534146.710.21679.31529.93.01714.8242.10.21873.51125.30.41924.7413.41.020139.42864.36.821368.232163.911.62295.71044.51.623109.61467.91.224196.21639.77.225102.21097.13.2银行业务数据2
行长想知道,不良贷款是否与贷款余额、贷款项目的多少、固定资产投资等因素有关?如果有关系,它们之间是一种什么样的关系?关系强度如何?此外,能否将不良贷款与其它几个因素之间的关系用一定的数学关系式表达出来,并利用所建立的关系式来预测不良贷款?行长的要求回归分析理论回归计算公式相关计算案例思考?
如果你是这家银行的一位统计人员,怎样帮助行长解决这些问题???案例思考?问题剖析:
解决这些问题所需要用到的统计知识就是相关与回归分析。案例中提出的问题有两类:找出不良贷款与贷款余额、贷款项目数及固定资产投资等几个因素之间的关系;将它们之间的关系用一定的数学关系式表达出来,并通过这一关系式来预测不良贷款。问题剖析延伸思考......
在生产和经营活动中,还有很多此类的问题。比如:在企业生产中,我们要对影响生产成本的各种因素进行分析,以达到控制成本的目的;在农业生产中,我们需要研究农作物产量与施肥量之间的关系,以便分析施肥量对产量的影响,进而确定合理的施肥量;在商业活动中,我们需要分析广告费支出与销售量之间的关系,进而通过广告费支出来预测销售量,等等……延伸思考
相关关系的概念和种类
相关分析的方法
回归分析本章内容本章内容现象之间的关系表现为:1、函数关系:2、相关关系:1)现象之间确实存在数量上的相互依存关系;第一节相关关系的概念和种类一、相关关系的概念几个变量之间关系的例子……一种确定性、严格的依存关系,可以用数学表达式准确表示出来。现象之间确实存在的、数量上的非确定性的对应关系。2)这种依存关系的具体关系值不是固定的。【例7.1】在销售价格不变的情况下,某种产品的销售额与销售量之间的关系。【例7.2】园的面积与半径之间的关系。变量间的关系:【例7.3】一个人的收入水平同其受教育水平之间的关系。【例7.4】从遗传学的角度看,子女的身高与其父母身高之间的关系。【例7.5】学生的学习成绩与学习时间之间的关系。【例7.6】商品的销售量与广告费之间的关系。变量间的关系由于观察或测量等原因,函数关系在实际中往往通过相关关系表现出来;在研究相关关系时,常借助函数关系加以分析说明;从某种角度说,函数关系是相关关系的特例。函数关系和相关关系之间的联系:二、相关关系的种类按相关涉及的因素多少分类单相关:两个因素之间的相关关系复相关:三个或三个以上因素之间的相关关系按相关关系的表现形式分类直线相关(线性相关):表现近似直线曲线相关:表现近似曲线按相关的程度分类完全相关:实质就是确定性的函数关系不完全相关:介于上述之间无相关:因素之间完全没有关系正相关:变量同向变化负相关:变量反向变化按相关的方向分类相关表:是指将相关变量的数值,按标志值的大小顺序一一对应而平行排列起来的统计表。第二节相关分析的方法一、相关表和相关图相关分析的方法:定性分析(图表法)和定量分析(相关系数);定性分析一般只适用于两个变量。例(续前例1)相关图:在平面直角坐标系中,以横轴表示变量X,纵轴表示变量Y,将相关变量的资料数值在坐标图中表示出来(能较直观地看出两个变量之间相关关系的粗略形式),也称散点图、散布图。(1)正线性相关(2)负线性相关(3)完全正线性相关············X·Y······X··Y··(4)完全负线性相关XY··········(5)非线性相关XY·················(6)不相关XY····································X·····Y·····相关图例(续前例2)二、相关系数的计算和应用相关系数:用于测定两个变量之间线性相关程度和相关方向的统计分析指标(用r表示)。1、积差法计算r:2、简捷计算方法1.特点:2.判断标准:相关系数的特点和相关程度的判断标准
相关系数取值及其意义-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加举例回归分析:对具有相关关系的变量,根据其关系形态,选择一个合适的数学模型(称为回归方程式),用以近似地表示变量之间的数学变化关系。第三节回归分析一、回归分析的概念直线回归(线性回归)曲线回归(非线性回归)简单直线回归(一元线性回归)多元线性回归回归分析的种类:回归分析与相关分析的区别和联系:1)2)
相关分析的两个变量是对等的,不必区分自变量和因变量;回归分析必须根据研究目的具体确定自变量和因变量。3)
相关分析的两个变量都是随机变量;回归分析中,自变量是可控制的量(给定的值),因变量是随机变量(随x而变动)。
相关分析中,改变x,y位置不影响相关系数r的数值;回归分析中,改变x,y位置,则回归方程会发生变化。联系:1)相关分析是回归分析的前提和基础;2)回归分析是相关分析的深入和继续。区别:二、简单直线回归(一元线性回归)
一般根据问题的性质、相关理论和常识确定。如果不能确定,或者两个变量互为根据,则可以有两个回归方程:确定自变量x和因变量y:②y为自变量,x为因变量(x倚y)的回归方程:①x为自变量,y为因变量(y倚x)的回归方程:
注:两个现象之间的相关系数r只有一个,但回归方程(回归系数)可能有两个。(这里采用第一个模型)
a的经济含义一般不作解释,b的经济含义是自变量变动一个单位,因变量平均变动b个单位。简单线性回归方程的建立及应用
计算待估参数a和b:一般根据最小平方法(最小二乘法)计算,推导如下:
1)根据最小平方法原理,参数要使得理论值与实际值的离差平方和最小:计算待估参数a、b2)假设Q是连续可微,将代入Q,得,分别求一阶偏导:整理得到二元一次方程:3)从中可以解出:举例这样就得到了直线回归方程:回归方程
链接开篇案例
回归直线或曲线是用来代表变量之间关系的一般水平。根据回归线推测的因变量显然与实际值有差异,这种差异大小说明推算的准确性以及回归线代表性的大小。·········yx回归线回归方程的评价常用的评价回归方程的指标有:估计标准误差和判定系数
另外一个公式(简捷计算):1.估计标准误差——因变量实际值(观测值)y和估计值
(简称:估计标准误)
yc的平均离差。用来代表回归直线
代表性大小的统计分析指标。Syx越小观测值离回归直线越近,回归直线代表性越大;Syx越大观测值离回归直线越远,回归直线代表性越小;Syx=0所有相关点都落在回归直线上,估计结果完全准确。例2.判定系数R2——用来度量回归直线与样本观察值拟合优劣的程度。R2越接近1,说明回归直线拟合程度越好;R2越接近0,说明回归直线拟合程度越差;R2为相关系数r的平方,但两者表示意义不同:r——说明两变量之间的相关程度大小;R2——说明直线回归方程的代表性大小。R2的实际意义是,在因变量的总变动中,可以由回归直线来解释的比率。或者说,在因变量的总变动中,可以由自变量所决定的百分比。例1、越大,越小。极端时,,此时,实际值与理论值完全相等,完全相关。2、越小,越大。极端时,,
此时,两变量不相关。
相关系数与估计标准误的关系:可见:r与Syx在数值大小上表现为相反的关系。r与Syx从不同角度说明了相关密切与否,由于r表明了关系程度更明确,并且能说明相关的方向(正相关或负相关),故一般情况下使用r。相关系数、回归系数及估计标准误的关系可见:r与b一定同符号。
相关系数与回归系数的关系利用回归方程进行分析和预测
回归分析的目的是根据所建立的回归方程来进行分析和预测(控制)。不良贷款倚贷款余额的直线回归方程:[分析]:b(回归系数)的经济含义:表示贷款余额每增加1亿元,不良贷款平均增加0.0379亿元。[预测]:当贷款余额增加到500亿元时,则可以预测不良贷款为:[续前例]链接到相关表练习题三、多元线性回归(介绍)模型:同样采用最小平方法求解,得到多元线性回归方程:常数项偏回归系数随机误差项一般先将曲线用代换法线性化,再按照最小平方法进行处理。指数模型:四、曲线回归(非线性)例题贷款余额和不良贷款的相关表各项贷款余额(亿元)不良贷款(亿元)14.80.216.22.724.71.058.60.864.20.367.30.972.82.673.50.479.33.080.83.295.71.696.11.0102.23.2各项贷款余额(亿元)不良贷款(亿元)107.41.6109.61.2111.31.1132.24.0139.46.8173.04.8174.63.5185.412.5196.27.2199.77.8263.510.2368.211.6————返回返回至回归分析和预测不良贷款与贷款余额的相关图返回链接到相关系数的计算不良贷款与贷款项目数的相关图返回不良贷款与固定资产投资额的相关图返回分行编号贷款余额(亿元)不良贷款(亿元)167.30.92111.31.13173.04.8480.83.25199.77.8616.22.7.........合计3006.793.20.811.2123.0410.2460.847.29...4529.2912387.6929929.006528.6439880.09262.44...516543.4660.160.57122.43830.4258.561557.6643.74...17080.1即不良贷款和贷款余额之间为高度的正相关关系。相关系数的计算举例返回返回至行长要求【续例】:同理,我们可以计算出:相关系数的计算举例2
不良贷款与贷款项目数之间的相关系数为
0.7003,属显著正相关;
不良贷款与固定资产投资额之间的相关系数为0.5158,属显著正相关;从上面计算可看出,在不良贷款与其它几个变量的关系中,与贷款余额的相关系数最大,而与固定资产投资额的相关系数最小。返回回归方程建立的举例分行编号贷款余额(亿元)不良贷款(亿元)167.30.92111.31.13173.04.8480.83.25199.77.8616.22.7.........合计3006.793.24529.2912387.6929929.006528.6439880.09262.44...516543.460.57122.43830.4258.561557.6643.74...17080.1返回直线回归方程的建立
这样得出不良贷款倚贷款余额的直线回归方程:返回b(回归系数)的经济含义:表示贷款余额每增加1亿元,不良贷款平均增加0.0379亿元。估计标准误差的计算分行编号贷款余额(亿元)不良贷款(亿元)167.30.92111.31.13173.04.8480.83.25199.77.8616.22.7.........合计3006.793.20.811.2123.0410.2460.847.29...660.160.57122.43830.4258.561557.6643.74...17080.1续前例:返回估计标准误差的计算这就是说,根据贷款余额来估计不良贷款时,平均的估计误差为1.98亿元。
不良贷款和贷款余额之间的相关系数为:判定系数的计算返回[续前例]
由此,可计算出回归方程的判定系数为:
也就是说,在不良贷款的总变动中,有71.17%是由贷款余额所决定的。可见,不良贷款与贷款余额之间有较强的线性关系。
同时,也说明了不良贷款与贷款余额之间的线性回归方程具有较强的代表性。例1产量(公斤)生产费用(万元)20042204.52504.72704.82805.2合计122023.2某企业产量和生产费用资料如下:计算产量和生产费用的相关系数。19365763667612960.40960.01960.00360.02560.31360.772452028.163.360.364.1620.1656.2积差法:简捷法:产量(公斤)生产费用(万元)20042204.52504.72704.82805.2合计122023.21620.2522.0923.0427.044000048400625007290078400302200108.428009901175129614565717返回即产量和生产费用之间为高度的正相关关系。例2根据例1中的资料,配合生产费用倚产量的直线回归方程,说明回归系数的经济含义,并预测当产量为300公斤时的生产费用。产量(公斤)生产费用(万元)20042204.52504.72704.82805.2合计122023.240000484006250072900784003022005717800990117512961456这样得出生产费用倚产量的直线回归方程:b(回归系数)的经济含义表示产量增加一公斤,生产费用平均增加0.0124万元。
当产量增加到300公斤时,则可以预测生产费用为:返回例3计算例2回归直线的估计标准误差:产量(公斤)生产费用(万元)20042204.52504.72704.82805.2合计122023.21620.2522.0923.0427.044.09444.34244.71444.96245.0864108.4257178009901175129614560.0089110.0248380.0002070.0263730.0129050.073234根据回归方程计算出每个产量对应的生产费用的理论值另一种公式:返回练习题收入(元)支出(元)500300800500100060012007001500900合计500030009000025000036000049000081000025000064000010000001440000225000055800002000000334000015000040000060000084000013500001)计算相关系数,并判断相关程度和相关方向。2)配合值线回归方程,并说明回归系数(斜率)的经济含义3)估计收入为2000元时的支出1、某收入与支出的调查结果如下:参考答案12.
对某省六个地区的国内生产总值和财政收入进行调查分析。设国内生产总值为(亿元),财政收入为(亿元),调查资料经整理和计算后的结果如下:要求:(1)计算国内生产总值与财政收入的相关系数,并说明其相关程度;(2)建立国内生产总值与财政收入的直线回归方程,并说明回归系数的经济涵义;(3)估计国内生产总值为5亿元时的财政收入。
参考答案23.
已知、两变量的有关资料如下:要求:(1)计算两变量之间的相关系数,并说明其相关程度;(2)建立倚的直线回归方程,并说明回归系数的经济涵义;
参考答案34.某地区家计调查资料得到,每户人均年收入为6800元,标准差为800元,每户人均年消费支出为5200元,方差为40000,支出对于收入的回归系数为0.2。根据上述资料要求:(1)计算收入与支出的相关系数;(2)拟合支出对于收入的线性回归方程;(3)估计年收入在7300元时的消费支出(4)收入每增加1元时,支出平均增加多少元。参考答案41)可见,收入和支出之间为高度正相关参考答案12)模型为则回归系数b的经济含义是,当收入增加1元时,支出平均增加0.586元。3)当收入达到2000元时,支出为1186元返回参考答案2(1)国内生产总值与财政收入的相关系数:(2)设国内生产总值与财政收入的直线回归方程为:
故所求回归直线方程为:回归系数的经济涵义:当国内生产总值每增加1亿元时,财政收入
平均增加0.911亿元。可见,国内生产总值与财政收入之间为高度的线性相关。(1分)(4分)(2分)(2分)(1分)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025共同担保借款合同书模板
- 2025新农村建设项目:污水处理设施施工承包合同
- 2025关于出版社与作者版权转让合同
- 2025劳动合同法辞职规定
- 《2025年的青岛房屋租赁合同》
- 2025供应商与分销商合作合同模板
- 2025 水产品买卖合同
- 幼儿园中班课程艺术造飞机
- 2025租房合同书格式样本
- 2025商业办公房买卖合同模板
- 七类作业JSA分析记录表格模板
- 心理统计学考研历年真题及答案
- 2022年中国石油大学《化工原理二》完整答案详解
- 技术经纪人练习题集附有答案
- 内科学讲义(唐子益版)
- GB/T 4357-2022冷拉碳素弹簧钢丝
- GB/T 19845-2005机械振动船舶设备和机械部件的振动试验要求
- GB/T 14614-1993小麦粉吸水量和面团揉和性能测定法粉质仪法
- 酱酒行业发展趋势分析
- 《红楼梦》贾府平面图
- 养老机构全套服务管理流程图()
评论
0/150
提交评论