




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,生物统计 附 试验设计Biostatistics and Experimental Design,畜牧、兽医专业,2,二 直线回归,3,“回归”的来历,“回归”一词由英国统计学家F Galton首先提出,他在研究父亲的身高与儿子身高之间的关系时发现:高个子父亲(高于群体平均数)所生的儿子比他更高的概率小于比他矮的概率;同样,矮个子父亲(矮于群体平均数)所生的儿子比他更矮的概率小于比他高的概率,即儿子的身高有向群体平均身高回归的趋势.,4,回归分析: 研究一个变量对另一个变量的单向依存关系,即研究一个变量随另一个变量变化而变化的规律。 后一个变量叫自变量,前一个变量叫依变量或应变量。,5,回
2、归的现象: 生物的各性状之间以及性状与环境条件之间都有着一定的相互关系。改变某一性状,就会引起另一性状也发生变异。 例如:奶牛的产奶量越高,乳脂率反而减少。 猪、鸡的生长速度越快,肉质和风味下降。 母猪的体重越大,仔猪出生重越大。,6,一元线性回归的含义要点: 1 研究两个变量之间的回归关系。 2 当一个变量数值增大时,另一个变量 数值也随着增大或减少。这种增大或 减少以坐标的形式来表示,散点图形 呈直线的趋势。,7,自变量x,因变量y,代表散点,8,二 直线回归,回归分析:是研究呈因果关系的相关变量间的关系。 (1)通过计算回归系数和建立回归方程,表明两变量的数量变化关系 (2)并进行回归关
3、系的显著性检验,以便由一个变量对另一个变量进行估测。,9,两变量的回归分析,如果两变量关系呈直线趋势,那么需要找出一条直线,建立回归方程来代表他们的线性关系,从而能从一个变量的变化来估测另一个变量的具体变化。,直线回归,配合回归方程,由x的变化估测 y的变化,10,(一) 一元线性回归的数学模型,如果变量X和变量Y之间存在线性函数关系,可用如下方程表示:,11,在线性回归关系中,对于X的每一个取值,Y的取值是不确定的。但是,我们假定有一个Y的期望值与之对应,或者说Y的期望值与X之间存在线性函数关系:,截距,YX:下标的第一个为依变量;第二个为自变量,回归参数,12,当两个变量间存在直线回归关系
4、时,其数据的散点在坐标图上趋近于一条直线。回归直线则是在一切直线中最接近所有散点的直线。,(二) 一元线性回归方程的建立,13,或者说,这条直线来代表两个变量的关系,与实际数据的误差比任何其他直线都要小,即它是一条对各散点配合的最好直线。 为了找到这样一条直线,配合的最好方法是“最小二乘法”,14,1 “最小二乘法”配合的回归直线,要求符合下述一些条件:,即要求所配合的直线上方各点与直线的距离和,同直线下方各点与直线的距离和相等。 距离:指实际y与由直线方程所估测的 之间的距离,称为估计误差.,P1,P3,P2,P4,代表实际Yi值,(1),代表y的估计值,15,1 “最小二乘法”配合的回归直
5、线,要求符合下述一些条件:,最好的直线是使总的估计误差达到最小的直线,由于估计误差有正负,我们不能用估计误差之和作为度量指标.,P1,P3,P2,P4,代表实际Yi值,(1),代表y的估计值,16,(2),即要求各点实际y值与回归直线所估测的 值之间离差的平方和最小,或者说从 估计Y值的误差平方和最小, 这种使估计误差平方和达最小的参数估计方法称为最小二乘法。,(3)直线能代表一般情况 即直线要通过 两直线的交点 。,17,如何求a和b?,任何一条直线都能用 表示,因此只要确定了a和b,就可决定直线的位置。,那么如何求a和b呢? 利用,所以称为“最小二乘方法”,18,根据数学中求极值的原理,要
6、使上面的式子为最小,必须使a、b的微分方程都等于零。 依次求Q关于 a和b的一阶偏导数,并令偏导数等于0,得如下方程:,正规方程组,19,解上述方程组得:,得直线回归方程:,由X估测Y,样本回归系数,20,(1) a为截距(constant),即X=0 时的Y 值。 (2) b为斜率,在统计学中称为样本回归系数(regression coefficient)。 (3) b为正值,则X增大,Y也随之增大; (4) b为负值,则X增大,Y却随之减少。 (5) b=0,X与Y不存在线性关系。,21,.,2 回归系数的计算公式:,22,byx,注意下脚标,下脚标:前面字母代表依变量 后面字母代表自变量
7、,23,回归系数的性质 (1)x与y各观察值加或减一常数,回归系数不变。 (2)x与y各观察值乘或除一常数,回归系数应 校正。 x=x/k y=y/c byx =byx*c/k,24,例:根据10只绵羊的胸围(cm)和体重(kg)的资料,配合由胸围估计体重的回归方程。,25,26,27,得回归方程:,回归系数是有单位的,是依变量单位与自变量单位的比值。 上例中表示由胸围估计体重时,胸围每增加或减少1cm,则体重在-115.3768的基础上平均增加或减少2.5469kg。,28,回归方程是有一定范围的,限在自变量的最小值和最大值之间。 不能任意的扩大自变量的范围或者把回归曲线向两端任意延长。 因
8、为一旦超出这个范围,两变量之间的关系就不一定是线性的了。,29,(三) 回归关系的显著性检验,30,(三) 回归关系的显著性检验,回归方程在一定程度上揭示了两个相关变量之间的内在规律。 由样本观察值配合的回归方程,必须经过假设检验,来确定它的效果如何,方程所揭示的规律性是否强,估测的准确性如何;或者说Y是否对X确实有线性回归关系。 由样本推断总体,31,全部观察值的总变异:,1 对回归方程的 F 检验,总变异由两部分组成: 一种是由自变量的不同引起的; 另一种是由随机误差引起的。 所以,对总变异进行剖分。,32,任一点 P(Xi ,Yi)在回归直线的估计值的离均差都可以分解为:,33,A,B,
9、C,34,对上面的式子两端平方,然后对所有n点求和,得。,=0,35,回归平方和,记作SSR,SSR是估计值与依变量总均数之差的平方和; 可以看作总变异中由于自变量x的取值变化而引起依变量y变化的部分; 反映了Y总变异中由于X与Y的线性关系,而引起的Y变化部分。 这部分变异可以通过控制X值而避免。,36,离回归平方和或误差平方和,记作SSE,它是y各观察值与估计值之差的平方和; 它与自变量x的大小无关,是依据回归方程进行估计时,存在估计误差造成的; 它是除了 X对Y的线性影响之外的一切因素(包括X对Y的非线性影响以及观测误差)对Y变异的作用。,37,平方和的计算公式:,38,回归方程效果的好坏
10、取决于SSR和SSE,或者说取决于SSR在总平方和中所占的比例,这个比例越大,回归的效果越好。由 X估计Y的准确性越高。,39,Y变量的总自由度: dfT=n-1 回归自由度对应于自变量的个数,由于受一个自变量的影响,所以:dfR=1 误差自由度:dfE=n-2,40,列方差分析表:,41,例:以上题为例 根据10只绵羊的胸围(cm)和体重(kg)的资料,做回归方程的显著性检验。 1 H0:b=0,或者绵羊的胸围与体重之间不存 在线性回归关系。 HA:b0,或者绵羊的胸围与体重之间存在 线性回归关系。,42,2 求平方和和自由度,43,44,列回归关系方差分析表:,结论: 绵羊体重对胸围的回归
11、关系显著,表明两者有线性关系存在。,45,回顾相关关系检验结果,统计推断: 接受备择假设,认为r是高度显著的,即说明绵羊的胸围与体重的相关非常显著。,46,2 对回归系数和截距的t检验,47,2 对回归系数和截距的t检验,目的: 确定样本回归系数是来自无回归关系的双变量总体,还是来自有回归关系的双变量总体。 确定回归直线是否通过原点。,48,49,例:以上题为例 根据10只绵羊的胸围(cm)和体重(kg)的资料,做回归系数和截距的显著性检验。,50,1 假设: H0:=0,绵羊的胸围与体重之间不 存在线性回归关系。 =0,回归直线通过原点。 HA:0,绵羊的胸围与体重之间存 在线性回归关系。
12、0,回归直线不通过原点。,51,2、确定显著性水平=0.05和=0.01 3、确定检验统计量-t检验,52,统计推断:接受备择假设,认为b是高度显著的,回归方程的效果显著。,53,54,统计推断:接受备择假设,认为a是高度显著的,回归方程不经过原点。,55,(四)回归方程的拟合度-决定系数R2,56,(四)回归方程的拟合度-决定系数R2,配合回归方程的过程也称为拟合,原理是最小二乘原理。所以对于每一个特定的资料来说,能够满足误差平方和最小的要求。 但是对于不同的资料,回归方程的拟合程度不同。 如果资料中各个观测值的散点非常紧密,说明两个变量之间的相关程度较高,那么得到的回归方程就好。反之就差。
13、,决定系数:度量回归方程拟合程度的好坏。,57,决定系数为依变量的总变异中由自变量所造成的变异所占的比例,等于相关系数的平方。 决定系数越大,说明自变量对依变量的影响也越大,用所配合的回归方程进行估计和预测的效果也越好。,58,(六) 简单线性相关与回归的联系 回归与相关之间关系密切 正相关 回归系数为正 负相关 回归系数为负 零相关 回归系数为零,59,60,如果以x 为依变量,y为自变量,回归方程为:,相关系数r是正反两个回归系数的几何平均数,61,相关显著性检验与对回归的显著性检验的关系 回归平方和与相关平方和相等,(1)所以:对回归关系的F 检验与对相关关系的F 检验是等价的。 (2)对回归系数的t 检验与对相关系数的t 检验也是等价的。,62,对于简单相关和回归来说,相关系数r、回归系数b、相关关系、回归关系的检验是等价的,只要其中一项检验结果为差异显著,则可以说明两个变量之间存在显著的相关和回归关系,建立的回归方程有意义,可以利用该方程进行间接估测。,63,、求相关系数,、相关系数的显著性检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第1课时 小数的性质(教学设计)-2023-2024学年四年级下册数学人教版
- 2024-2025学年高中历史第三单元北魏孝文帝改革第1课改革迫在眉睫学案新人教版选修1
- 第一课 历史和人民的选择 教学设计-2023-2024学年高中政治统编版必修三政治与法治
- Unit 2 Language and Mind Reading A Grammar in use 教学设计 -2024-2025学年高中英语上外版(2020)选择性必修第二册
- 第7课 全球联系的初步建立与世界格局的演变 教学设计-2023-2024学年高一统编版2019必修中外历史纲要下册
- 高中信息技术粤教版选修2教学设计-3.2 各种多媒体信息在计算机中的表示-
- Unit5 Launching Your Career Reading and Thinking 教学设计-2024-2025学年高中英语人教版(2019)选择性必修第四册
- Unit 2 Ways to go to school Part A(教学设计)-2024-2025学年人教PEP版英语六年级上册
- 8《安全记心上》《平安出行》教学设计-2024-2025学年道德与法治三年级上册统编版
- 第五单元第2课时《大数据与人工智能初感受-关爱老人之智能养老项目规划与项目实施》 教学设计 2023-2024学年教科版(2019)高中信息技术必修1
- 2024年资助政策主题班会课件
- 中国慢性阻塞性肺疾病基层诊疗与管理指南(2024年)
- 部编四年级道德与法治下册全册教案(含反思)
- 建筑施工安全检查标准-JGJ59-2011完整版
- 八年级下册道德与法治第一单元教案(4篇)
- 黄恕伯:必修教材教学建议
- 练字常用的稿纸-红色单线稿纸-书写纸张打印即可
- 中国传统二十四节气立春节气介绍PPT模板课件
- Q∕GDW 11612.1-2018 低压电力线高速载波通信互联互通技术规范 第1部分:总则
- 排球比赛记录表
- ASM铸造缺陷的国际分类7大类(学习版0228)
评论
0/150
提交评论