版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人的体重与身高、胸围血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损半径与辐射的温度、照射的时间一个变量的变化直接与另一组变量的变化有关:如:当前1页,总共42页。Multivariatelinearregression的概念多元线性回归分析也称复线性回归分析(multiplelinearregressionanalysis),它研究一组自变量如何直接影响一个因变量。自变量(independentvariable)是指独立自由变量的变量,用向量X表示;因变量(dependentvariable)是指非独立的、受其它变量影响的变量,用向量Y表示。当前2页,总共42页。多元回归分析数据格式当前3页,总共42页。内容一、一元线性回归和多元线性回归的例子二、多元线性回归方程模型三、多元线性回归分析的步骤四、逐步回归分析当前4页,总共42页。一、一元线性回归和多元线性回归的例子例1,一元线性回归当前5页,总共42页。第二步运行结果当前6页,总共42页。当前7页,总共42页。例2,多元线性回归当前8页,总共42页。当前9页,总共42页。第二步运行结果当前10页,总共42页。当前11页,总共42页。假定因变量Y与自变量间存在如下关系:式中,是常数项,称为偏回归系数(partialregressioncoefficient)。的含义为在其它自变量保持不变的条件下,自变量改变一个单位时因变量Y的平均改变量。为随机误差,又称残差(residual),它表示的变化中不能由自变量解释的部分。二、多元线性回归方程模型当前12页,总共42页。x1x2y当前13页,总共42页。应用条件:注意:虽然模型要求因变量是连续数值变量,但对自变量的类型不限。若自变量是分类变量,特别是无序分类变量,要转化为亚变量才能分析。对于自变量是分类变量的情形,需要用广义线性回归模型分析。当前14页,总共42页。三、多元线性回归分析的步骤(一)估计各项参数,建立多元线性回归方程模型(二)对整个模型进行假设检验,模型有意义的前提下,再分别对各偏回归系数进行假设检验。(三)计算相应指标,对模型的拟合效果进行评价。当前15页,总共42页。(一)模型的参数估计当前16页,总共42页。27名糖尿病患者的血清总胆固醇(x1)、甘油三酯(x2)、空腹胰岛素(x3)、糖化血红蛋白(x4)、空腹血糖(y)的测量值列于表中,试建立血糖与其它几项指标关系的多元线性回归方程。
例3当前17页,总共42页。各变量的离差矩阵当前18页,总共42页。线性回归方程模型为:当前19页,总共42页。1、对模型的假设检验—F检验2、对偏回归系数的假设检验—F检验和t检验3、标准化偏回归系数(二)对模型及偏回归系数的假设检验当前20页,总共42页。1、对模型的假设检验—F检验当前21页,总共42页。SS回归=b1l1y+b2l2y
+b3l3y+b4l4y=0.1424×67.6962+0.3515×89.8025+0.2706×142.4347+0.6382×84.5570=133.7107;ν回归=m=4各变量的离差矩阵接例3当前22页,总共42页。SS总=lyy=222.5519;ν总=n-1=26SS剩余=SS总-SS回归=222.5519-133.7107=88.8412ν剩余=n-m-1=22
MS回归=
SS回归/ν回归;
MS剩余=
SS剩余/ν剩余;F=
MS回归/MS剩余当前23页,总共42页。模型有意义当前24页,总共42页。2、对偏回归系数的假设检验—F检验和t检验回归方程成立只能认为总的来说自变量与因变量间存在线性关系,但是否每一个自变量都与因变量间存在线性关系,须对其偏回归系数进行假设检验。①方差分析法②t检验法当前25页,总共42页。①偏回归系数的假设检验--方差分析法当前26页,总共42页。当前27页,总共42页。ParameterStandardStandardizedVariableDFEstimateErrortValuePr>|t|Estimate
变量自由度偏回归系数标准误t值P值标准化回归系数
Intercept225.943272.828592.100.04730X1220.142450.365650.390.70060.07758X2220.351470.204201.720.09930.30931X322-0.270590.12139-2.230.0363-0.33948X4220.638200.243262.620.01550.39774②偏回归系数的假设检验—t检验当前28页,总共42页。注意当前29页,总共42页。
变量回归系数bj标准化偏回归系数b’jX10.142450.07758X20.351470.30931X3-0.27059-0.33948X40.63820.39774接例3当前30页,总共42页。(三)计算相应指标,对模型的拟合效果进行评价评价回归方程回归效果的优劣是回归分析的重要内容之一。常用评价指标有:复相关系数、决定系数、校正决定系数、剩余标准差等。
当前31页,总共42页。1.复相关系数
复相关系数(R),衡量因变量Y与回归方程内所有自变量线性组合间相关关系的密切程度。0<=R<=1,没有负值。
R的值越接近1,说明相关关系越密切;越接近0说明相关关系越弱。当前32页,总共42页。2.决定系数当前33页,总共42页。3.剩余标准差当前34页,总共42页。当前35页,总共42页。4.校正决定系数当前36页,总共42页。四、逐步回归分析当前37页,总共42页。(一)最优子集回归法求出所有自变量可能组合子集的回归方程的模型(共有2m-1个),按一定准则选择最优模型,常用的准则有:①校正决定系数(考虑了自变量的个数)②Cp准则(C即criterion,p为所选模型中变量的个数;Cp接近p+1的模型为最优)③AIC(Akaike`sInformationCriterion)准则;AIC越小越好当前38页,总共42页。最优子集法的局限性
如果自变量个数为4,则所有的回归有24-1=15个;当自变量数个数为10时,所有可能的回归为210-1=1023个;……..;当自变量数个数为50时,所有可能的回归为250-1≈1015个。当前39页,总共42页。(二)逐步选择法
1.前进法(forwardselection)2.后退法(backwardelimination)3.逐步回归法(stepwiseregression)它们的共同特点是每一步只引入或剔除一个自变量。决定其取舍则基于对偏回归平方和的F检验:当前40页,总共42页。(1)前进法
自变量从无到有、从少到多
Y对每一个自变量作直线回归,对回归平方和最大的自变量作F检验,有意义(P小)则引入。在此基础上,计算其它自变量的偏回归平方和,选取偏回归平方和最大者作F检验,…。
局限性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO/PAS 8235:2024 EN Road vehicles - Ergonomic aspects of human vehicle interactions - Taxonomy for the classification of adaptive interactive vehicle systems
- 年度智能安防系统设计与施工合同04
- 2024年度工程建设项目钢筋采购合同2篇
- 员工住宿免责的协议书
- 锅炉合同范本范本完整版 2篇
- 装修包工包料简易合同
- 二零二四年度保险代理居间协议3篇
- 2024版建筑工程给排水劳务分包合同3篇
- 二零二四年度文化艺术公司艺术品买卖合同2篇
- 《输血管理制度》课件
- 销售罗盘精髓-课件
- 借调通知函(模板)
- 《诗意中国》朗诵稿
- 第四章-技术美-(《美学原理》课件)
- 2021版《安全生产法》培训课件
- 小学数学二年级上册认识时间练习课3市公开课一等奖省名师优质课赛课一等奖课件
- 最新人教版三年级英语上册课件(完美版)Unit 1 Part B 第1课时
- 航站楼管理部《机场使用手册》实施细则
- 城市医疗集团管理制度
- 金坛区苏科版二年级上册劳动《08不倒翁》课件
- 三级安全教育培训课件(项目级)
评论
0/150
提交评论