版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
简单线性回归11.直线回归概述多个变量之间关系研究:例:某人群年龄、BMI与收缩压的关系;儿童身高、胸围与肺活量的关系;在此,介绍两个变量间线性的数量依存关系,即线性回归。11.直线回归
“回归”的由来11.直线回归Regression释义11.直线回归大多数高个子父代的子一代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平;大多数矮个子父代的子一代的平均身高不是更矮,而是稍高于其父代水平。
Galton将这种趋向于人群平均水平的现象称之为“回归”。
Regression释义11.直线回归
Galton数据散点图(英寸)11.直线回归直线回归的概念
回归
——
F.Galton和KarlPearson发现儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系:
一.“回归”(regression)一词的由来11.直线回归
人们借用“回归”这个词来描述通过自变量(independentvariable)的数值预测反应变量(responsevariable)的平均水平。为了通过可测或易测变量对未知或难测或不可测量的状态进行估计,可以借助于回归分析(regressionanalysis)。
例如:可以用身高体重活量估计心室输出量,体循环总血量。尿雌三醇含量估计胎儿的体重。11.直线回归LINE假定xy标准差相等
EQUALSTANDARDDEVIATION
对于任何X值,随机变量Y的标准差
Y|X相等独立INDEPENDENCE
每一观察值之间彼此独立
y|X=α+x直线回归模型的四个假定线性LINEARITY
反应变量均数与X间呈直线关系
Y|X=a+
X正态
NORMALITY
对于任何给定的X,Y服从正态分布,均数为
Y|X,标准差为
Y|X11.直线回归直线回归的一般表达直线回归的概念
a:常数,截距(intercept)
当X取值为0时相应Y的均数估计;b:斜率(slope),回归系数(cofficientofregession)
当X变化一个单位时Y的平均改变的估计值。11.直线回归直线回归方程的求法最小二乘法(leastsquaremethod)原理最小二乘法原则(leastsquaremethod):使各实际散点(Y)到直线()的纵向距离的平方和最小。即使最小。11.直线回归最小二乘(Leastsquares)法图解Yi(Y的估计值)
=a+bXi
Yi估计值i残差i=Yi–估计值i寻找使S(残差i)2最小的直线11.直线回归直线回归方程的求法根据数学上的最小二乘法(leastsquaremethod)原理,可导出a、b的算式如下:
因为直线一定经过“均数”点11.直线回归直线回归中的统计推断回归系数的假设检验总体回归系数的可信区间11.直线回归回归系数的假设检验直线回归中的统计推断b≠0原因:①总体回归系数β=0,由于抽样误差引起
b≠0②总体回归系数β≠0,存在回归关系因此需作β是否为零的假设检验。方法:方差分析t检验11.直线回归X方差分析方法基本思想——需要对应变量Y的离均差平方和作分解。应变量Y的平方和划分示意图:11.直线回归Y的离均差平方和的分解11.直线回归统计量F的计算公式为:
分别称为回归均方与剩余均方。统计量F服从自由度为的F分布。求F值后,查F界值表,得P值,按所取检验水准作出推断结论。直线回归中的统计推断11.直线回归t检验方法
直线回归中的统计推断
Sy..x为y的剩余标准差-----扣除x对Y的线性影响后y对回归线的离散程度。
11.直线回归回归方程的评价假设检验RootMSE(剩余标准差)R-Square(决定系数)AdjR-Sq(校正决定系数)11.直线回归R-Square:回归平方和在Y的总离均差平方和中所占比重R-Square=SS回归/SS总=1-SS剩余/SS总0≤R-Square≤1当回归系数=0,则R-Square=0当所有的观测值正好落在拟和的回归线上时,则R-Square=1
R-Square越接近1,说明回归模型对资料的拟合优度越佳,故R-Square作为衡量模型优劣的测度。
11.直线回归使用R-Square评价模型时需注意:
较大的R-Square并不一定意味着拟合模型是有用的,可能是因为:只取得自变量很少几个水平的观察值,此时,尽管R-Square很大,甚至趋于1,但它不能作为衡量模型优劣的测度统计量;11.直线回归AdjR-Sq:校正决定系数可见,校正决定系数是相对SS残与SS总的自由度进行的加权调整。11.直线回归总体回归系数β的可信区间β的1-α双侧可信区间为:
直线回归中的统计推断Sb为回归系数的标准误11.直线回归描述预报
控制直线回归的应用11.直线回归描述两变量的依存关系通过回归系数的假设检验,若认为两变量间存在着直线回归关系,则可用直线回归来描述两变量的依存关系。直线回归方程的应用11.直线回归利用回归方程进行预测(forecast)把预报因子(自变量X)代入回归方程对预报量(应变量Y)进行估计。直线回归方程的应用11.直线回归利用回归方程进行统计控制(statisticalcontrol)
利用回归方程进行逆估计,如要求应变量Y在一定范围内波动,可以通过自变量X的取值来实现。直线回归方程的应用11.直线回归总体均数的可信区间给定X=X0时,总体均数的可信区间
其中
直线回归的应用11.直线回归直线回归中的统计推断个体Y值的预测区间
给定X=X0时,对应的个体Y值也存在一个波动范围。其标准差SY0按如下公式计算:
给定X=X0时个体Y值的1-α预测区间为:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 牙齿抛光病因介绍
- 牙源性上颌窦炎病因介绍
- 开题报告:智能技术赋能的智慧生成性教学模式设计研究
- 铁路站房水电安装工程施工组织设计
- 开题报告:以文化人:大学红色文化育人体系研究
- 开题报告:新型城镇化背景下传统村落文化记忆的教育传承研究
- 开题报告:新时代儿童格局培育的时空路径研究
- 北京某高压燃气工程施工组织设计方案
- 2024年度健身器材采购与安装协议
- 2024年小学羽毛球特色教学教案羽毛球
- 人行天桥桩基础施工方案
- 基于价值链模型的组织结构优化
- 针织学试卷及答案2套
- 《年鉴培训讲义》ppt课件
- 物理教学计划(初三复读班)
- 零星修缮工程年度合同
- 1:1000地形图测绘质检报告
- 花键强度校核程序
- 斯瓦西里语常用词(网上收集整理版)
- 铝锭来料检验记录表
- (完整版)员工人事变动表
评论
0/150
提交评论