版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、回归分析回归分析 相关系数双向关系相关系数双向关系 回归方程单向关系回归方程单向关系 一元线性回归一元线性回归 一元线性回归方程的检验一元线性回归方程的检验 一元线性回归方程的应用一元线性回归方程的应用 多元线性回归简介多元线性回归简介一元线性回归一元线性回归 一元线性回归是指只有一个自变量的线一元线性回归是指只有一个自变量的线性回归性回归(linear regression)。 回归线回归线(regression line) 一条最能代表散点图上分布趋势的直线,这一条最能代表散点图上分布趋势的直线,这条最优拟合线即称为回归线。条最优拟合线即称为回归线。 常用的拟合这条回归线的原则,就是使各点
2、常用的拟合这条回归线的原则,就是使各点与该线纵向距离的平方和为最小。与该线纵向距离的平方和为最小。 回归线回归线回归线回归线回归线回归线回归线回归线回归方程回归方程 确定回归线的方程称回归方程。确定回归线的方程称回归方程。bXaYXbaYYXYXYbaXXYXY回归方程的建立回归方程的建立 用最小二乘方法求回归系数用最小二乘方法求回归系数(regression coefficient)nXXnYXYXXXYYXXbniiniiniininiiiiniiiniiYX/)(/ )( )()()( )(2112111121与相关系数与相关系数 r 比较比较YXniiiSnSYYXXr1)(回归方程的
3、建立回归方程的建立 求截距求截距(intercept)XbYaYXYX由由Y估计估计XnYYnYXYXYYYYXXbniiniiniininiiiiniiiniiXY/)(/ )( )()()( )(2112111121YbXaXYXY语文成绩与智商语文成绩与智商 序号序号X Y X2 Y2 XY 1234567891011 7871688575737265706674 136135120140130128122118119108120 60845041462472255625532951844225490043565476 1849618225144001960016900163841488
4、413924141611166414400 1060895858160119009750934487847670833071288880 总和总和7971376 58069 173038 100139计算计算368. 111/7975806911/1376797100139/)(/ )( )(22112111nXXnYXYXbniiniiniininiiiiYX96.2545.72368. 109.125XbYaYXYXXY368. 196.25一元线性回归方程的检验一元线性回归方程的检验 三种等效的方法:三种等效的方法: 对回归方程进行方差分析对回归方程进行方差分析 对两个变量的相关系数进行
5、与总体零相关的对两个变量的相关系数进行与总体零相关的显著性检验;显著性检验; 对回归系数进行显著性检验。对回归系数进行显著性检验。测定系数测定系数 回归平方和回归平方和(regression sum of squares, explained ) 残差平方和残差平方和(residual sum of squares, error , unexplained )niiiniiniiYYYYYY121212)()()(测定系数测定系数 测定系数测定系数(coefficient of determination)指指回归平方和在总平方和中所占比例,这回归平方和在总平方和中所占比例,这个比例越大,意味
6、着误差平方和所占比个比例越大,意味着误差平方和所占比例越小,预测效果就越好。测定系数同例越小,预测效果就越好。测定系数同时等于相关系数的平方。时等于相关系数的平方。niiniiYYYYr12122)()(例题例题企业企业12345678910产量产量(X)40424855657988100 120 140费用费用(Y)150140160170150162 185 165 190 185XY3978. 07909.1346524.01000.25543577.1666)()(12122niiniiYYYYr对回归方程的方差分析对回归方程的方差分析方差来源方差来源平方和平方和自由度自由度均方差均方
7、差F 值值回归回归SSR1MSRMSR/MSE残差残差SSEn - 2MSE总差异总差异SSTn - 1) 2, 1 (221212) 2/()1 () 2/()()(nniniFnrrFnYYYYF或方差分析方差分析 F 0.05,1,8 = 5.32 F 0.01,1,8 = 11.3方差来源方差来源平方和平方和自由度自由度均方差均方差F 值值回归回归1666.357711666.357715.0166残差残差887.74238110.9678总差异总差异2554.10009对回归系数进行显著性检验对回归系数进行显著性检验 估计误差的标准差估计误差的标准差 由于与由于与 X 各点相对应的诸
8、各点相对应的诸 YX 值之平均数和值之平均数和标准差均为未知,故估计误差的标准差只能标准差均为未知,故估计误差的标准差只能从样本加以估计。其无偏估计量为:从样本加以估计。其无偏估计量为:212nYYSniiiYX对回归系数进行显著性检验对回归系数进行显著性检验 在回归线上,当与所有自变量在回归线上,当与所有自变量X相对应的相对应的各组因变量各组因变量Y的残值都呈正态分布,并且的残值都呈正态分布,并且残值方差为齐性时,可以用以下公式进残值方差为齐性时,可以用以下公式进行显著性检验。行显著性检验。 公式公式)2/()()()()(012121212nYYXXbSXXbXXSbSbtniiiniiY
9、XYXniiYXniiYXYXbYXYX一元线性回归方程的应用一元线性回归方程的应用 用样本回归方程推算因变量的回归值用样本回归方程推算因变量的回归值 点估计:点估计:语文成绩为语文成绩为8080分的学生的智商是多少分的学生的智商是多少? 区间估计:区间估计:体重为体重为2020千克的男童的简单反应时千克的男童的简单反应时95%95%的置信区间的置信区间 =(5501.9693.67)=(550183.6)或或(366.4,733.6) 00XbaYYXYXYXnStY2, 2/4 .13580368. 196.25368. 196.2500XY一元线性回归方程的应用一元线性回归方程的应用 对
10、因变量真值的预测对因变量真值的预测 回归方程是由样本数据列出的,由于抽样误回归方程是由样本数据列出的,由于抽样误差的影响,其回归值并不是因变量的真值。差的影响,其回归值并不是因变量的真值。要预测其真值还需考虑到各样本回归方程之要预测其真值还需考虑到各样本回归方程之间的变异。间的变异。对因变量真值的预测对因变量真值的预测二元线性回归方程二元线性回归方程 二元线性回归方程是指一个因变量二元线性回归方程是指一个因变量Y与两与两个自变量个自变量X1与与X2之间建立的线性回归方之间建立的线性回归方程。程。 二元线性回归方程也用最小二乘法来确二元线性回归方程也用最小二乘法来确定回归系数。定回归系数。221
11、1XbXbaY 式中各个式中各个L都是相应的离差平方和或离差都是相应的离差平方和或离差乘积和乘积和二元线性回归方程的偏回归系数二元线性回归方程的偏回归系数21222111222211LLLLLLLbYY21222112111122LLLLLLLbYY例题例题序号序号数学成绩数学成绩Y学习能力学习能力X1逻辑学逻辑学X212345678910836774487266905471658868766074578662634575476057796367587069答案答案21413. 0606. 0214. 1XXY二元线性标准回归方程二元线性标准回归方程 为了比较两个自变量在估计预测因变量为了比较
12、两个自变量在估计预测因变量时所起作用的大小,需要将三个变量分时所起作用的大小,需要将三个变量分别转换成标准分数,然后比较由标准分别转换成标准分数,然后比较由标准分数所建立的标准回归方程中的两个标准数所建立的标准回归方程中的两个标准回归系数,以此判断两个自变量作用的回归系数,以此判断两个自变量作用的大小。大小。2121316.0655.0*2*1XXXXYZZZbZbZ二元线性回归的检验二元线性回归的检验 二元线性回归的检验二元线性回归的检验 检验回归方程的显著性检验回归方程的显著性 检验两个偏回归系数的显著性检验两个偏回归系数的显著性二元线性回归的检验二元线性回归的检验 二元线性回归方程的显著
13、性检验方法:二元线性回归方程的显著性检验方法: 方差分析方差分析 复相关系数复相关系数(multiple correlation coefficient)显著性检验。显著性检验。 复相关系数表示两个自变量组合起来与因变量之复相关系数表示两个自变量组合起来与因变量之间的相关程度。可通过对二元测定系数开平方根间的相关程度。可通过对二元测定系数开平方根得到,然后通过查表进行显著性检验。得到,然后通过查表进行显著性检验。niiniiYYYYYR1212122)()(二元线性回归的检验二元线性回归的检验 偏回归系数偏回归系数(partial regression coefficient)的显著性检验的显
14、著性检验)1 (0)1 (021222221211121rLMSEbtrLMSEbtbb3)(12nYYMSEniii多元线性回归方程多元线性回归方程pYpppppYppYppLLbLbLbLLbLbLbLLbLbLb.22112222221111122111ppXbXbXbYa.2211多元线性回归方程中自变量的选择多元线性回归方程中自变量的选择 穷举法穷举法 对所有可能的回归方程逐一检验,选择一个显著性对所有可能的回归方程逐一检验,选择一个显著性程度最强的方程。程度最强的方程。 逐步回归逐步回归(step-wise regression) 逐步回归的原理是按每个自变量对因变量的作用,逐步回归的原理是按每个自变量对因变量的作用,从大到小逐个地引入回归方程从大到小逐个地引入回归方程 每引入一个自变量要对回归方程中的每一个自变量每引入一个自变量要对回归方程中的每一个自变量都进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 6月运动品牌直播促销方案
- 酒吧卫生安全管理方案
- 铁路隧道瓦斯安全监测方案
- 运输行业单梁起重机动态控制方案
- 餐饮行业核酸检测实施方案
- 幼儿园与家长签订的安全协议书(2篇)
- 医院数据备份与恢复方案
- 家具合同范本(2篇)
- 美容院墙面瓷砖施工方案
- 病死畜禽处理的环境保护方案
- 班级中的规训与惩罚基于班级要素的社会学分析
- 树消防意识 创平安校园课件
- 砂石资源专项整治工作措施
- 医院食堂经营方案写
- 锅炉煤粉细度
- 《防治校园霸凌》课件
- 小学各年级小学一年级提高思维能力的方法主题班会
- SOAP病历冠心病介绍
- 《深化运用监督执纪“第一种形态”实施细则(试行)》测试题【附答案】
- 新媒体视听节目制作 第八章 剪辑的法则
- 环境、社会与公司治理(ESG)
评论
0/150
提交评论