




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、简单回归分析简单回归分析 贾贾 睿:成都中医药大学公共卫生与管理学院睿:成都中医药大学公共卫生与管理学院 电电 话:话:6625206466252064 电子邮箱:电子邮箱:22ruijia16322ruijia163 1.1.直线回归直线回归Linear regressionLinear regression 概述概述 Y Y 因变量,呼应变量因变量,呼应变量 (dependent (dependent variablevariable,response variable)response variable) X X 自变量,解释变量自变量,解释变量 (independent (indepe
2、ndent variable, explanatory variable)variable, explanatory variable) 直线回归的方式:直线回归的方式:bXaY Regression 释义释义 1.1 1.1 直线回归方程的建立直线回归方程的建立 最小二乘法(least square estimation) XX XY l l XX YYXX b 2 )( )( XbYa bXaY 例例 某地某地1010名名3 3岁儿童体重与体外表积岁儿童体重与体外表积 编号编号 X X 体重,体重,KgKg Y Y 体外表积,体外表积,103cm2103cm2 1 111.011.05.2
3、835.283 2 211.811.85.2995.299 3 312.012.05.3585.358 4 412.312.35.2925.292 5 513.113.15.6025.602 6 613.713.76.0146.014 7 714.414.45.8305.830 8 814.914.96.1026.102 9 915.215.26.0756.075 101016.016.06.4116.411 1010名名3 3岁男童体重与体外表积散点图岁男童体重与体外表积散点图 111213141516 5.0 5.5 6.0 6.5 体重(kg),X 体 表 面 积 Y (103cm2)
4、体重与体外表积的回归体重与体外表积的回归 9396. 55439. 19040.24 7266. 544.13 XYYYXX lll Y X )/10(2385. 0 9040.24 9396. 5 23 kgcm l l b XX XY 5212. 20.238513.44-5.7266 a XY2385. 05212. 2 1.2 1.2 回归直线的绘制回归直线的绘制 计算不太接近的两点的计算不太接近的两点的Y Y值:值: X=12kgX=12kg时时 Y=2.5212+0.2385 Y=2.5212+0.238512=5.3832(103cm2)12=5.3832(103cm2) X=1
5、5kgX=15kg时时 Y=2.5212+0.2385 Y=2.5212+0.238515=6.0987(103cm2)15=6.0987(103cm2) XY2385. 05212. 2 1010名名3 3岁男童体重与体外表积回归图岁男童体重与体外表积回归图 XY2358. 05211. 2 111213141516 5.0 5.5 6.0 6.5 体重(kg),X 体 表 面 积 Y (103cm2) 1.3 1.3 回归系数和回归方程的意义及性质回归系数和回归方程的意义及性质 b b 的意义的意义 a a 的意义的意义 的意义的意义 的意义的意义 的意义的意义 bXaY YY 2 1 n
6、 ii i YY Y b b 的意义的意义 斜率斜率(slope) (slope) 2.5212 + 0.2385 X2.5212 + 0.2385 X 体重每添加体重每添加1 kg, 1 kg, 那么体外表积平均那么体外表积平均 添加添加 0.2385(103cm2) 0.2385(103cm2) b b 的单位为的单位为 (Y (Y的单位的单位/X/X的单位的单位) ) Y a a 的意义的意义 l a截距截距(intercept, constant) l X=0 时,时,Y的估计值的估计值 l a的单位与的单位与Y值一样值一样 l 当当X能够取能够取0时,时,a才有实践意义才有实践意义
7、bXaY 估计值估计值 的意义的意义 X=11时, =5.145, 即体重为 11 kg 的三岁女童, 其平均体外表积之 估计为 5.145 (103cm2); X=15时, =6.099, 即体重为 15 kg 的三岁女童, 其平均体外表积之 估计为 6.099 (103cm2). 给定X时,Y的估计值。 当 时, Y Y Y XX YY 由体重由体重(kg)(kg)估计体外表积估计体外表积 (103cm2 )(103cm2 ) 编编 号号 X X 体重,体重,KgKg Y Y 体外表积,体外表积,103cm2103cm2 Y Y的估计值的估计值 1 111.011.05.2835.2835
8、.1455.145 2 211.811.85.2995.2995.3355.335 3 312.012.05.3585.3585.3835.383 4 412.312.35.2925.2925.4555.455 5 513.113.15.6025.6025.6465.646 6 613.713.76.0146.0145.7895.789 7 714.414.45.8305.8305.9565.956 8 814.914.96.1026.1026.0756.075 9 915.215.26.0756.0756.1466.146 101016.016.06.4116.4116.3376.337 Y
9、 的意义的意义 YY YY 为残差:点到直线的纵向间隔。 111213141516 5.0 5.5 6.0 6.5 的意义的意义 残差平方和残差平方和 (residual sum of squares) (residual sum of squares) 综合表示点距直线的间隔。综合表示点距直线的间隔。 在一切的直线中,回归直线的残差平方和在一切的直线中,回归直线的残差平方和 是最小的。是最小的。( (最小二乘最小二乘) ) 2 ) (YY YY n YY YY 1 0 XX XY YY l l lYY 2 2 回归直线的有关性质回归直线的有关性质 直线经过均点直线经过均点 直线上方各点到直线
10、的纵向间隔之和直线上方各点到直线的纵向间隔之和= = 直直 线下方各点到直线的纵向间隔之和线下方各点到直线的纵向间隔之和, ,即即: : 各点到该回归线纵向间隔平方和较到其它各点到该回归线纵向间隔平方和较到其它 任何直线者为小。任何直线者为小。 0) (YY 22 bXaYYY ),(YX 1.4 回归系数的假设检验回归系数的假设检验 回归系数为0,那么回归关系不存在。 H0:总体回归系数为0, =0; H1:总体回归系数不为0,0; =0.05。 回归系数的回归系数的 t 检验检验 2 2 . n YY s l s s XY XX XY b 2 0 n s b t b b , 体重与体外表积
11、回归系数的假设检验体重与体外表积回归系数的假设检验 H 0H 0:总体回归系数:总体回归系数 0 0,即体重与体外表积无回归关系;,即体重与体外表积无回归关系; H 1H 1:总体回归系数:总体回归系数 00,即体重与体外表积有回归关系。,即体重与体外表积有回归关系。 =0.05 =0.05。 0.0001P 8, ,435. 9 02528. 0 2385. 0 02528. 0 9040.24 1262. 0 1262. 0 810 127318. 0 ,127318. 0 . 2 vt s sYY b b XY 体重与体外表积间存在回归关系。 回归系数与相关系数的假设检验回归系数与相关系
12、数的假设检验 rb tt 结果等价。 1.5 1.5 因变量总变异的分解因变量总变异的分解 X P (X,Y) Y Y )(YY )( YY Y )(YY Y Y Y的总变异分解的总变异分解 未引进回归时的总变异:未引进回归时的总变异: (sum of squares about the mean of Y) (sum of squares about the mean of Y) 引进回归以后的变异引进回归以后的变异( (剩余剩余):): (sum of squares about regression) (sum of squares about regression) 回归的奉献,回归平
13、方和:回归的奉献,回归平方和: (sum of squares due to regression) (sum of squares due to regression) 2 )(YY 2 )(YY 2 )(YY Y Y的总变异分解的总变异分解 22 2 YYYYYY 剩回总 SSSSSS 剩回总 总 回归 决定系数 SS SS r 2 YYYYYY lrlrl 22 )1( YY lYY 2 )( YY lrYY)1() ( 22 YY lrYY 22 )( 剩余规范差剩余规范差 2 2 n YY s XY (1) 扣除了X的影响后Y方面的变异; (2) 引进 回归方程后, Y方面的变异。
14、1.6 1.6 回归问题的区间估计回归问题的区间估计 回归系数的可信区间估计 估计值 的可信区间估计 个体Y值的允许区间估计 Y 复习复习 均数的可信区间:均数的可信区间: 均数均数界值规范误界值规范误 (4.3,4.4)(4.3,4.4) 个体的允许区间个体的允许区间( (参考值范围参考值范围):): 均数均数界值规范差界值规范差 (2.37)(2.37) 1.6.1 1.6.1 总体回归系数总体回归系数 的可信区间估计的可信区间估计 根据根据 t t 分布原理估计:分布原理估计: 0.2385+/-2.3060.2385+/-2.3060.025280.02528 0.18020.2968
15、(103cm2/kg)0.18020.2968(103cm2/kg) 2 0 n s b t b b , bn stb 2, 1.6.2 1.6.2 的可信区间估计的可信区间估计 Y 样本 总体 Y的总平均 给定X时Y的平均 (Y的条件均数) Y Y Y 2 2 .2,2, )( )(1 XX XX n stYstY XYn Y n 根据 t 分布原理根据: X=12时,求时,求 的的95%可信区间可信区间 =13.44, lXX=24.9040, =0.1262。 当X=12时, =5.3832, Y X XY s . Y 05400 904024 124413 10 1 12620 2 .
16、 . ).( .sY )10)(5077. 5 ,2587. 5( 0540. 0306. 23832. 5 23 2, cm stY Y n 1.6.3 1.6.3 的允许区间估计的允许区间估计 Y 给定 X 时 Y 的估计值是 Y 的均数的一个估计。 给定X 时 Y 值的允许区间是 Y 值的能够范围。 的100(1- )%允许限: 2 2 .2,2, )( )(1 1 XX XX n stYstY XYnYn Y 的可信区间与的可信区间与Y Y的允许区间的允许区间 可信区间是针对条件均数的,而允许区间是针对Y的取值范围 的。 X=12时, 的可信区间为:5.25785.5077(103cm
17、2), 表示:体重为12kg的3岁男童,估计其平均体外表积为 5.3832,95可信区间为(5.2587,5.5077) (103cm2)。 X=12时,Y的允许区间为:5.06665.6998(103cm2), 表示:体重为12kg的3岁男童, 估计有95的人其体外表 积在5.06665.6998 (103cm2)之间。 Y Y 结论:结论: 体重为体重为12kg12kg的的3 3岁男童,估计有岁男童,估计有95%95%的的 人其体外表积在人其体外表积在 5.06665.6998(103cm2)5.06665.6998(103cm2)之间,平均体之间,平均体 外表积为外表积为5.3832(1
18、03cm2)5.3832(103cm2),9595可信可信 区间为区间为(5.2587(5.2587,5.5077) (103cm2)5.5077) (103cm2)。 可信区间与允许区间表示可信区间与允许区间表示 (confidence band & tolerance band)(confidence band & tolerance band) 111213141516 4.5 5.0 5.5 6.0 6.5 7.0 1.8 1.8 过定点的直线回归过定点的直线回归 在用荧光光度法测定全血硒的研讨中,分别取不同硒含量的规在用荧光光度法测定全血硒的研讨中,分别取不同硒含量的规 范液,消化后
19、测定其荧光强度,试作规范直线。范液,消化后测定其荧光强度,试作规范直线。 含硒量含硒量( (g)X g)X 荧光强度荧光强度Y Y 0.0000.000 0.000.00 0.0250.025 4.364.36 0.0500.050 9.319.31 0.1000.100 17.1317.13 0.1500.150 25.0325.03 0.2000.200 33.2233.22 过定点过定点(X0,Y0)(X0,Y0)的直线回归方的直线回归方 程程 bXbXYY XXbYY )( )( 00 00 bXXbYY )( 普通的直线回归方程(过X的均数和Y的均数): 过定点过定点(X0,Y0)(
20、X0,Y0)的直线方程估计的直线方程估计 1 )( )( )( )()( )( )( )( 2 . 2 0 2 00 2 0 2 2 0 00 00 n YY s XX YYXX YYYY XX YYXX b XXbYY XY 不同硒含量所得荧光强度的过定点的回归不同硒含量所得荧光强度的过定点的回归 荧荧 光光 强强 度度 Y 0 0.025 0.05 0.075 0.1 0.125 0.15 0.175 0.2 0 5 10 15 20 25 30 35 硒含量硒含量X (g) XY7488.167 1.9 1.9 直线回归与直线相关的区别直线回归与直线相关的区别 r r 没有单位,没有单位
21、,b b有单位;所以,相关系有单位;所以,相关系 数与单位无关,回归系数与单位有关;数与单位无关,回归系数与单位有关; 相关表示相互关系,没有依存关系;相关表示相互关系,没有依存关系; 而回归有依存关系;而回归有依存关系; 1.9 1.9 直线回归与直线相关的区别直线回归与直线相关的区别 对资料的要求不同: 当X和Y都是随机的,可以进展相关和回归分析; 当Y是随机的(X是控制的),实际上只能作回归而不能 作相关分析; I型回归:X是准确控制的; II型回归:X是随机的。 由X推算Y: 由Y推算X: YbaX XbaY YXYX XYXY . . 1.10 1.10 直线回归与直线相关的联络直线回归与直线相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年老年能力评估师考试模拟试卷(老年人健康生活方式评估)及答案
- Msoffice考试信息提炼试题及答案
- 计算机基础知识回顾与Python题及答案
- 2025年乡村医生考试题库:常见疾病诊疗与社区健康服务
- 2025年校园心理危机干预应急预案心理健康教育课程评价
- 2025学年一年级上学期数学计算能力测试卷:解题策略解析
- 【《一级能耗电力变压器油箱及热计算过程案例综述》】
- 安徽省滁州市定远县民族中学2025届高三上学期9月教学质量检测试题(英语)
- 2025年日语专业四级考试:语法与词汇实战演练与深度强化测试卷
- 高考语文复习- 高考语高考试题简流程 (知识提示)
- 河南省确山县三里河治理工程
- 水利工程合同工程完工验收工程建设管理工作报告
- photoshop实训指导书
- 多级泵检修及维护(1)
- 涵洞孔径计算
- 测量未知电阻的方法
- 中国民主同盟入盟申请表
- SAP项目用户操作手册CO月结
- 观感质量检查表
- 企业信息登记表
- 孙志刚事件1doc
评论
0/150
提交评论