数学建模多元线性回归分析.ppt_第1页
数学建模多元线性回归分析.ppt_第2页
数学建模多元线性回归分析.ppt_第3页
数学建模多元线性回归分析.ppt_第4页
数学建模多元线性回归分析.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十五章 多元线性回归分析 (Multiple Linear Regression) Multiple linear regression Choice of independent variable Application 讲述内容 第一节 多元线性回归 第二节 自变量选择方法 第三节 多元线性回归的应用 及其注意事项 目的:作出以多个自变量估计应变量的多元 线性回归方程。 资料:应变量为定量指标;自变量全部或大 部分为定量指标,若有少量定性或等级指标 需作转换。 用途:解释和预报。 意义:由于事物间的联系常常是多方面的, 一个应变量的变化可能受到其它多个自变量 的影响,如糖尿病人的血糖变化可能受胰岛 素、糖化血红蛋白、血清总胆固醇、甘油三 脂等多种生化指标的影响。 第一节 多元线性回归 变量:应变量 1 个,自变量m 个,共 m+1 个。 样本含量:n 数据格式见表15-1 回归模型一般形式: 一、多元线性回归模型 表15-1 多元回归分析数据格式 条件 一般步骤 建立回归方程 (2)检验并评价回归方程 及各自变量的作用大小 二、多元线性回归方程的建立 例15-1 27名糖尿病人的血清总胆固 醇、甘油三脂、空腹胰岛素、糖化血红 蛋白、空腹血糖的测量值列于表15-2中 ,试建立血糖与其它几项指标关系的多 元线性回归方程。 表15-2 27名糖尿病人的血糖及有关变量的测量结果 求偏导数 原 理 最小二乘法 三、假设检验及其评价 1. 方差分析法: (一)对回归方程 表15-4 例15-1的方差分析表 表15-3 多元线性回归方差分析表 2. 决定系数R 2: 3.复相关系数 (二)对各自变量 指明方程中的每一个自 变量对Y的影响(即方差分析和决定系数检 验整体)。 1. 偏回归平方和 表15-5 对例15-1数据作回归分析的部分中间结果 各自变量的偏回归平方和可以通过拟合包含不同 自变量的回归方程计算得到,表15-5给出了例15-1数 据分析的部分中间结果。 结 果 2. t 检验法 是一种与偏回归平方和检验完全等 价的一种方法。计算公式为 结 果 结 论 3标准化回归系数 变量标准化是将原始数据减去相应变量的均数 ,然后再除以该变量的标准差。 计算得到的回归方程称作标准化回归方程, 相应的回归系数即为标准化回归系数。 注意: 一般回归系数有单位,用来解释各自 变量对应变量的影响,表示在其它自变量保 持不变时, 增加或减少一个单位时Y的平 均变化量 。不能用各 来比较各 对 的影响大小。 标准化回归系数无单位,用来比较各 自变量对应变量的影响大小, 越大, 对 的影响越大。 结 论 第二节 自变量选择方法 目的:使得预报和(或)解释效果好 一、全局择优法 目的:预报效果好 意义:对自变量各种不同的组合所建立 的回归方程进行比较 择优。 选择方法: 例15-2 用全局择优法对例15-1数据的自变量进行选择。 二、逐步选择法 1. 1.前进法,回归方程中的自变量从无到有、从少到多 逐个引入回归方程。此法已基本淘汰。 2. 后退法,先将全部自变量选入方程,然后逐步剔除 无统计学意义的自变量。 剔除自变量的方法是在方程中选一个偏回归平方和最 小的变量,作F检验决定它是否剔除,若无统计学意义则 将其剔除,然后对剩余的自变量建立新的回归方程。重复 这一过程,直至方程中所有的自变量都不能剔除为止。理 论上最好,建议使用采用此法。 3.逐步回归法,逐步回归法是在前述两种方法的基础 上,进行双向筛选的一种方法。该方法本质上是前进法。 表15-7 逐步回归过程 表15-8 例15-3方差分析表 “最优”回归方程为 结果表明:血糖的变化与甘油三脂、胰岛素 和糖化血红蛋白有线性回归关系,其中与胰岛素 负相关。由标准化回归系数看出,糖化血红蛋白 对空腹血糖的影响最大。 表15-9 例15-3的回归系数的估计及检验结果 第三节 多元线性回归的应用及注意事项 一、多元线性回归的应用 1. 影响因素分析 例如影响高血压的因素可能有年龄、饮 食习惯、吸烟状况、工作紧张度和家族史 等,在影响高血压的众多可疑因素中,需 要研究哪些因素有影响,哪些因素影响较 大。 在临床试验中,则可能由于种种原因难以 保证各组的指标基线相同,如在年龄、病 情等指标不一致出现混杂的情况下,如何 对不同的治疗方法进行比较等。 这些问题都可以利用回归分析来处理。 控制混杂因素(confounding factor)的一个 简单办法就是将其引入回归方程中,与其 他主要变量一起进行分析 2. 估计与预测 如由儿童的心脏横径、心脏纵径和心脏宽 径估计心脏的表面积;由胎儿的孕龄、头 颈、胸径和腹径预测出生儿体重等。 3. 统计控制 逆估计。 例如采用射频治疗仪治疗脑肿瘤,脑 皮质的毁损半径与射频温度及照射时间有 线性回归关系,建立回归方程后可以按预 先给定的脑皮质毁损半径,确定最佳控制 射频温度和照射时间。 二、多元线性回归应用的注意事项 1指标的数量化 分2类,可用一个(0,1)变量。如性别 分k类,k-1个(0,1)变量,如血型。 数据格式回归方程 建立回归方程 b1 :相当A 型相对于O 型的差别 b2 :相当B 型相对于O 型的差别 b3 :相当AB 型相对于O 型的差别 (3)等级 定量。 一般是将等级从弱到强转换为 (或 )如文化程度分为小学、中学、大学、 大学以上四个等级。Y为经济收入。 解释:b(b1)反映X(X1) 增加1个单位, 增加b个单位 (如:500元)。 表示中学文化较小学收入多500, 大学较中学多500,余类推。 b1,b2,b3分别反映中学、大学、大学以上相对于小学 文化程度者经济收入差别的大小 也可将K个等级转换为K-1个(0,1)变量 2样本含量: n =(510)m。 3关于逐步回归: 对逐步回归得到的结果不要盲 目的信任,所谓的“最优”回归方程并不一定是最 好的,没有选入方程的变量也未必没有统计学意 义。例如,例15-3中若将选入标准和剔除标准定 为 和 选入的变量是 , 而不是 , 结果发生了改变。 不同回归方程适应于不同用途,依专业知识定。 4. 多重共线性 即指一些自变量之间存在较强的线性关系。 如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量 通常是高度相关的,有可能使通过最小二乘法建立回归方 程失效,引起下列一些不良后果: (1)参数估计值的标准误变得很大,从而t值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论