实用生物统计第2版唐志宇第14讲 回归_第1页
实用生物统计第2版唐志宇第14讲 回归_第2页
实用生物统计第2版唐志宇第14讲 回归_第3页
实用生物统计第2版唐志宇第14讲 回归_第4页
实用生物统计第2版唐志宇第14讲 回归_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第二节第二节 简单线性回归简单线性回归一元线性回归一元线性回归一元线性回归的方差分析一元线性回归的方差分析2一、一、“回归(回归(regressionregression)”的由来的由来0.51633.73sonfatherhh父辈身高增加一父辈身高增加一个单位,儿子身个单位,儿子身高仅增加半个单高仅增加半个单位左右;父辈身位左右;父辈身高减少一个单位,高减少一个单位,儿子身高仅减少儿子身高仅减少半个单位左右;半个单位左右;子代的平均高度子代的平均高度向中心靠近向中心靠近 回回归效应归效应.3例例1 1从大白鼠出生第从大白鼠出生第6 6天起,每天起,每3 3天称一次体重,天称一次体重,直到第

2、直到第1818天天. .两个不同的连续变量(两个不同的连续变量(xi,yi)4例例1 1 散点图散点图散点沿一条直线周围分布散点沿一条直线周围分布.回归的目的回归的目的: y、x关系的形式关系的形式.iiyx i 5残差残差ei(,)iixy(,)iixyiiyabxiiyy ie 6二、拟合回归直线二、拟合回归直线 最小二乘估计最小二乘估计评价一条直线评价一条直线(ya+bx)与数据点与数据点(xi,yi)拟合拟合(吻合)的好坏(吻合)的好坏 残差残差ei平方和:平方和:最小二乘估计最小二乘估计(least square estimate):使原始:使原始数据(数据(yi)与拟合数据()与拟

3、合数据(a+bxi)的差的平方)的差的平方和和sse最小最小.222111()()nnneiiiiiiiisseyyyabx71.模型模型1 1:过原点的直线:过原点的直线yx 121niiiniix ybx 2211()()nneiiiiiissyyybx1d2()0dneiiiissybx xb 82.模型模型2:过定点(:过定点(x0,y0)的直线的直线001122011()()()nniiiiiinniiiix yxxyybxxx 00 xxxyyy121niiiniix ybyxx 00= ()yyxx=yx 93.模型模型3:一般直线:一般直线00120001()()()=)nii

4、iniixxyybxyxxyx aybx yx()()yyxx00(,)( , )xyx y 121()()()niiiniixx yybxx xyxxss yx10最小二乘估计最小二乘估计121()()()niiiniixxyybxx 121niiiniix ybx yx yx第一种情况第一种情况:过原点:过原点()()()yyxx 第三种情况:第三种情况:第二种情况:过定点第二种情况:过定点001201()()()niiiniixxyybxx 00()yyxx11最小二乘估计最小二乘估计(1)最小二乘原则同样适用于非线性回归,只是非最小二乘原则同样适用于非线性回归,只是非线性回归模型的正则

5、方程比较复杂,经常无解线性回归模型的正则方程比较复杂,经常无解析解;析解;21()neiiissyy 12例例1 1 回归方程回归方程136.5 1.516790104.5601.51672.699655xyxxsbsaybx 13问题问题1:4.53488.4326hage 某地调查了某地调查了418岁男孩与女孩的平均身高,岁男孩与女孩的平均身高,试描述男孩与女孩平均身高与年龄间的关系试描述男孩与女孩平均身高与年龄间的关系.14问题问题1:散点图:散点图4.53488.4326hage 15最小二乘估计(最小二乘估计(2)无论无论x和和y的真实关系是什么样的,用线性模型的真实关系是什么样的,

6、用线性模型的最小二乘的解总是存在的的最小二乘的解总是存在的. so,正确选择模型很重要;正确选择模型很重要;用最小二乘得出的结果要经过假设检验用最小二乘得出的结果要经过假设检验.121()()()niixyinxxiixxyysbaybxsxx 16三、一元线性回归模型假设三、一元线性回归模型假设( (lineline) )( (l line)ine)线性性线性性: : y与与x之间是线性关系:之间是线性关系:( (i independence)ndependence)独立性:样本独立独立性:样本独立( (n normal)ormal)正态性:误差正态性:误差服从正态分布,均值为服从正态分布,

7、均值为0.0.( (e equal)qual)方差齐性:不同方差齐性:不同x值对应的值对应的的方差完全相的方差完全相同。即同。即: : yx ,(|)y xe yxxx 2(,)ynx 2(0,)n 171.1.一元线性回归模型假设一元线性回归模型假设(line)(line)hfatherhson263(,)sonhn ,(|)y xsonfathere hhxx 22(,)sonxhn 32(,)sonxhn 632x3xx2(,)sonxhn 18截距截距, , 斜率,称为回归系数斜率,称为回归系数. . 给定给定x 下下y 的估计值的估计值. .给定给定x 下下y 的平均值的平均值y 的

8、条件数学期望的条件数学期望. .回归直线的意义回归直线的意义(|)( )e y xxf xx19例例1 1 回归方程的含义回归方程的含义斜率斜率(1.5167)(1.5167)日龄每增长日龄每增长1 1天,平均体重天,平均体重增加增加1.5167g1.5167g出生出生x天的大白鼠,体重天的大白鼠,体重为为: :出生出生x天的大白鼠,平均体重天的大白鼠,平均体重为为: :,2.69961.5167y xx 2.69961.5167yx20if b0hfatherhson2( ,)sonhn a 2(,)sonhna 2( ,)sonhn a 632x3xx2( ,)sonhn a 21问题问题

9、2 2:b0?0?某研究小组随即抽查了某研究小组随即抽查了20名名15岁健康男童,测岁健康男童,测量其身高(量其身高(h)与体重()与体重(w):):121()()=()niixyinxxiixx yysbsxx ()58.2350.7158 ()w kgh cm ( )5823571580 ()w gh m 222.参数的点估计、区间估计和假设检验参数的点估计、区间估计和假设检验2(,)ynx 22( )( )()(2)2(iieyyse bnasneee 2221( )( )()xxxxxd bd asns 22xyexxsssbaybxsn 2221()ebaexxxxmsxssmssn

10、s 参数的点估计、区间估计和假设检验参数的点估计、区间估计和假设检验2( ,)xxb ns 00:h 02(0,1)xxbns 0 (2)xxebtt nsms 22eenssms 12(2)exxbtnsms 参数的点估计、区间估计和假设检验参数的点估计、区间估计和假设检验021220,01220000121:(2)()()1:(2)()()1:)1(2)(xxy xxeexxexxxatnnsxxytnmsnsxxyxytnmsnsms 25例例1 1 参数的检验(参数的检验(p215p215,例,例5.25.2)0:0, :0ahh 0:0, :0ahh 26例例1 1 参数的检验(参数

11、的检验(p215p215,例,例5.25.2)273. 分解数据分解数据 yiyy iyy iiyy iyy iyy iiyy 模型:模型: y的变化的变化 x的作用的作用随机误差随机误差28分解数据分解数据iiixy ()()iiiiyyyyyy()()iiiabxabxbyyxx ()()()iiiiiiixabxab xyy ( )( )e bbe aa随机随机x的作用的作用随机随机29总离差平方和的分解总离差平方和的分解222()()iiiiyyyyyy syy:总离差平方和:总离差平方和sse :残差平方和残差平方和,反映随机误差引起的变异,反映随机误差引起的变异ssr:回归平方和回

12、归平方和,反映随机误差及,反映随机误差及x对对y的线性影响的线性影响产生的变异产生的变异syy ssessr()()()iiiiyyyyyy303个平方和个平方和222()()iiiiyyyyyy ()()iiiabxabxbyyxx 2()rissyy 22()ibxx 2xxb s 22xyyyyyrxxxyyyyyexxsssb sbssssssss 2()iyyysy 2(1)ynsxyxxsbs 2xyxyxxsbss314. 回归方程的检验回归方程的检验 方差分析方差分析2()2eenss (1,2)(2)erressmsnsfsfmns 0:0h 222()()()iiiiyyy

13、yyy22()rxxse sssyy sse ssr32例例1 1 回归方程的检验(回归方程的检验(p219p219,例,例5.45.4)0:0, :0ahh 207.033.17210.20yryesssss 21.06ems 335.决定系数决定系数 r22207.030.985210.20ryysssr =x能解释能解释变化的百分比,越接近于变化的百分比,越接近于1,表示,表示回归效果越好回归效果越好.2207.033.17210.201.06yyeressmssss 1.06ems 0.992r 34决定系数与相关系数决定系数与相关系数2()iryssy 22xyxxxyxxsb sb

14、ss222xyyyxxyyxyxxssssrss2ryysssr 35例例2 2 模拟数据模拟数据1r 21r 31199.68074644.70206 10199.6807464yyersssss 210eyyrsssssr 36例例2 2 散点图散点图210eyyrsssssr 某作者分析淋巴细胞转换率与年龄的关系:某作者分析淋巴细胞转换率与年龄的关系:n252,r0.2回归方程为:回归方程为:结论是淋巴细胞转换率与年龄密切相关结论是淋巴细胞转换率与年龄密切相关. .请请问:这个结论是否有使用价值,为什么?问:这个结论是否有使用价值,为什么? 37问题问题3 376.00.4agey 0.

15、01p 386.3yx23,(0,0.5 )yxn 3923,(0,1.5 )yxn 23,(0,2.5 )yxn 4023,(0,3.5 )yxn 23,(0,4 )yxn 41不拒绝原假设时不拒绝原假设时所得的线性回归方程无意义:所得的线性回归方程无意义:lx 、y 无线性关系;无线性关系;l误差过大,掩盖了误差过大,掩盖了x 、y 间的线性关系;间的线性关系;lx 对对y 的影响为非线性的;的影响为非线性的;l除除x 外还有其它不可忽略的变量,从而削弱外还有其它不可忽略的变量,从而削弱了了x 对对y 的影响,用多元线性回归的影响,用多元线性回归.0:0, :0ahh 四、相关与回归四、相

16、关与回归22xyrxxxxyxyxxxxyyyxxsssssrbss sb sbss22xyxxyysrs s xyxyy a bxx ab yxxyyssbbss 2ryyssrs关于斜率的检验关于斜率的检验0:0h 0:0h (1,2)reffsmsnm (2)xxebttmsns附表附表c.1022exxmsbts22 (2)1r ntt nr 44回归分析回归分析 最小二乘原则(最小二乘原则(lse)估计回归方程参数:)估计回归方程参数:、2 得到回归方程:得到回归方程: 检验回归方程:检验回归方程:h0:= 0 yabx45例例3富有的美国加州富有的美国加州beverly hills

17、和和palm springs地区的理疗医生在年轻人当中发现了一种新的地区的理疗医生在年轻人当中发现了一种新的疾病疾病. 当一个人想要体验极端速度变化的刺激当一个人想要体验极端速度变化的刺激,不断变换宝马,不断变换宝马l7系车的加速器和制动器,系车的加速器和制动器,那么此人很有可能患上这种被称为宝马膝的病那么此人很有可能患上这种被称为宝马膝的病. 这种疾病的病因一直不太明确这种疾病的病因一直不太明确. 观察治疗学家观察治疗学家sausalito发现这种奇怪的疾病的严重程度与患发现这种奇怪的疾病的严重程度与患者的雅皮士程度密切相关者的雅皮士程度密切相关. 生物统计学基础生物统计学基础,凌莉,凌莉,

18、p13246例例31.测量这种疾病的严重程度仅需用量角器测量测量这种疾病的严重程度仅需用量角器测量膝关节活动度(膝关节活动度(rom).2.雅皮士程度得分(雅皮士程度得分(chicc)汽车(汽车(cars):汽车拥有量(欧洲产越野车现):汽车拥有量(欧洲产越野车现代小马车、雪佛兰或小货车)代小马车、雪佛兰或小货车)健康(健康(health):俱乐部(网球滑雪健身):俱乐部(网球滑雪健身)收入(收入(income):):1万美金为单位万美金为单位饮食(饮食(cuisine):香油的总消费量(公升)冰箱):香油的总消费量(公升)冰箱中芥末类型的数量中芥末类型的数量服饰(服饰(clothes):衣柜中):衣柜中gucci、lacoste和和saint laurent等高档品牌服饰的数量等高档品牌服饰的数量47例例30:0h 2220.01()0.5610.8184rr48小结小结 相关系数的含义及其计算、检验相关系数的含义及其计算、检验 线性回归模型、回归方程的含义线性回归模型、回归方程的含义 回归分析:回归分析: 最小二乘原则(最小二乘原则(lse)估计回归方程参)估计回归方程参数:数:、2 回归方程:回归方程:y=a+bx检验回归方程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论