




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章直线相关与回归医学统计学及其软件包上海第二医科大学生物统计教研室第1页第1页
分析两个变量间关系惯用回归及相关分析统计办法。如两个变量间关系是线性,可用直线相关与回归分析;如两个变量间关系是非线性需用非线性(曲线)回归。回归分析适合用于分析变量间因果关系;用一个自变量值来预计另一个应变量值。相关分析用于分析两变量间互相联系密切程度及相关方向。
第一节概述
第2页第2页第二节相关系数
相关分析目的在于通过相关系数r来描述和度量两变量线性联系程度和方向。r>0正相关图例1r<0负相关图例2r=0零相关图例3零相关即两变量间无关。样本相关系数不等于零,并不表示总体相关系数不等于零,还要作明显性检查。next第3页第3页r=0.7495回第4页第4页r=-0.83597回第5页第5页第6页第6页
相关系数计算:
X和Y离均差积和X离均差平方和第7页第7页
相关系数明显性检查
样本相关系数原则误查t界值表,得P值第8页第8页
例6.1极谱法和碘量法测定水中溶解氧含量,两法测得值是否有相关性?
两法测得值有相关(P<0.01)第9页第9页
第三节直线回归方程目的:找出描述x与y依存关系直线方程。Y为应变量(dependentvariable)X为自变量(independentvariable)A为截距(intercept)b为回归系数(regressioncoefficient)回归系数b表示x每改变一个单位,y平均改变b个单位。第10页第10页Y=10x+5
=4.22+0.20x体重心脏横径第11页第11页
设有n对x,y观测值,先在直角坐标系中作散点图,假如散点分布呈直线趋势,则可设法求出直线方程。通惯用最小二乘法,依据:各点与该直线纵向距离平方和为最小先由(6.3)式求得b,再由(6.4)式求得a,就得出直线回归程。
第12页第12页xy最小第13页第13页回归系数明显性检查从样本资料中算得回归系数b,也有抽样误差,因此需作明显性检查,检查其是否是回归系数为零总体中抽得。H0:β=0H1:β≠0。当回绝H0时,可认为x与y间直线回归方程有统计学意义。明显性检查可有两种办法:t检查法和方差分析法。第14页第14页
t检查法:样本回归系数原则误剩余原则差预计误差平方和第15页第15页方差分析法:Y总变异X和Y线性关系引起变异误差引起变异回归平方和误差平方和第16页第16页总自由度:n-1(总例数减1)回归自由度:1(自变量个数)误差自由度:n-2(总自由度减去回归自由度)df1=1,df2=n-2查方差分析用F界值表,得P值第17页第17页例6.2研究正常男性年龄与运动后最大心率关系,求直线回归方程。第18页第18页直线回归相关分析注意事项:
1.相关分析只是以相关系数来描述两个变量间线性相关程度和方向,并不阐明事物间存在联系本质,也不是两事物间存在联系证据。要阐明两事物间本质联系,必须凭专业知识从理论上加以论证。因此,把两个毫无关系事物放在一起作相关分析是毫无意义。同样,作回归分析也要有实际意义。
第19页第19页第20页第20页直线回归相关分析注意事项:在进行直线回归前应绘制散点图,有直线趋势时,才适宜作直线回归分析。散点图还能提醒资料有无异常点。3.直线回归方程合用范围普通以自变量取值范围为限。第21页第21页直线回归相关分析注意事项:4.对同一组资料作回归和相关分析,其相关系数和回归系数明显性检查结果完全相同。由于相关系数明显性检查结果可直接查表,比较以便;而回归系数明显性检查计算复杂,故在实际应用中惯用相关系数明显性检查结果代替回归系数明显性检查。第22页第22页直线回归相关分析注意事项:5.在资料要求上:相关分析要求两个变量服从双变量正态分布。回归分析要求因变量服从正态分布,自变量能够是准确测量和严格控制变量。如两个变量服从双变量正态分布,则能够作两个回归方程,用X推算Y,或用Y推算X。
第23页第23页第五节过定点直线回归医学研究中在拟合直线时,除了要求与观测点尽也许靠近外,还经常要求必须通过某定点(m,n)。比如在光电比色、荧光分析、火焰光度测定以及同位素测定等试验方法绘制标准直线时就常有这么要求。此定点也能够是(m,0),(0,n)或(0,0)等,尤以(0,0)为最常见。计算公式和实例见第116页。第24页第24页第六节直线相关与回归SAS程序SASCORR过程可用于求变量之间线性相关系数及偏相关系数。;SASREG过程可用于各种线性回归分析,包括多元回归(见第七章),逐步回归和最优子集回归(见第八章)等。第25页第25页第七章多元回归及相关第一节多元线性回归基本概念
事物间互相联系往往是多方面,在诸多情况下相应变量y发生影响自变量往往不止一个。多元线性回归目的就是用一个多元线性回归方程表示多个自变量和1个应变量间关系。:截距:原则偏回归系数原则偏回归系数表示其它自变量固定情况下,xi改变一个单位,y平均改变bi个单位。第26页第26页多元线性回归应用条件:1.独立性:各观测对象间相互独立。2.线性:自变量与应变量间关系为线性。正态性:自变量取不同值时,应变量分布为正态。方差齐性:自变量取不同值时,应变量总体方差相等。当不符合条件时,可对自变量进行变换。如:第27页第27页第二节多元回归计算
1.计算截距和各偏回归系数。2.多元回归方程明显性检查:(1)整个方程明显性检查:用方差分析。(2)对各偏回归系数明显性检查:F检查:去掉xj后回归平方和减少是否明显。t检查:回归系数除以它原则误。第28页第28页第三节原则偏回归系数
要比较各个自变量对于应变量作用大小,不能用偏回归系数,因为各偏回归系数单位不同。必须把偏回归系数标准化,化成没有单位标准偏回归系数,公式为:消除不同单位影响后,标准偏回归系数绝对值越大,该自变量对于应变量作用越大,但该差异是否有统计意义,也必须经过检验。第29页第29页第四节偏相关系数
相关系数r应称为简朴相关系数,由于它只考虑了x1和
x2之间互相影响,而未注意到其它变量对x1和x2也许有影响。事实上,客观事物间关系是错综复杂,变量之间互相影响也往往是各种多样。比如,当存在x1,x2,x3三个变量时,假如我们不考虑x3,而只对x1,x2计算其相关系数r,则这r大小往往不反应客观真实情况;如r很大,也许意味着x1,x2之间关系很密切,但也也许事实上x1,x2之间并无什么关系,而x3却对x1,x2能同时发挥很大影响,我们所看到较大r值但是是x3对x1作用和x3对x2作用客观表现而已。反之,x1,x2之间算得一个小r值,也不一定就意味着x1,x2之间关系确实微弱,也有也许x1,x2之间虽相关联,但此关联性却被x3对它们作用所抵消,以致被掩盖了。第30页第30页因此在较单纯情况下,假如x1,x2与周围其它变量没什么关系话,则用简朴相关系数来表示x1,x2之间相关性是可行;假如存在着对x1,x2关系密切其它变量,则r就不能确切地表示x1,x2之间真实关系,这就需要用到偏相关系数。所谓偏相关系数指是当把x1,x2以外其它变量对它们影响都扣除掉(或平衡掉)以后,x1,x2之间相关系数。表示把x3作用扣除掉以后x1和x2偏相关系数表示把x3和x4作用扣除掉以后x1和x2偏相关系数偏相关系数可从简朴相关系数计算得到,也要作明显性检查。第31页第31页第五节多元相关系数及决定系数在多元回归中可算得一个多元相关系数,用R表示,它是y与之间简朴相关系数,也可理解为y与自变量组合之间相关系数。R2称为多元回归方程决定系数,即y变异中可由方程中自变量组合所决定部分。R2值介于0~1之间,R2越靠近1,阐明回归方程效果越好。R2越靠近0,阐明回归方程效果越差,即y变异中只有很少一部分能由方程中自变量组合所决定,即使该方程有明显意义,也不能认为该方程效果能够令人满意,启示我们还应进一步寻找其它对y也许有明显作用变量或变量组合。R2也可用于检查多元回归方程明显性。第32页第32页第六节多元回归在医学中应用
1.一。依据较易测得自变量推算不易测得应变量如:用身高,体重推算体表面积。二。确定各自变量xi取不同值时,y正常值范围如:建立一个由身高,体重推算心象面积多元回归方程,利用此方程就可分别求出身高,体重取不同值组合时,心象面积正常值范围。三。预测预报如:建立心肌梗塞预报方程或脑卒中预报方程。四。回顾推断如:推断死亡时间。
第33页第33页第七节多元回归及相关SAS程序
求偏相关系数用CORR过程。求多元回归及相关用REG过程。第34页第34页第八章逐步回归及最优子集回归第一节逐步回归分析一.逐步回归分析基本概念逐步回归分析目的是建立“最优”回归方程。“最优”回归方程是指包括所有对y有明显作用自变量,而不包括对y作用不明显自变量方程。第35页第35页二.逐步回归分析计算办法在供选自变量Xi中,按其对y作用大小,由大到小地把自变量逐一引入方程,每引入一个自变量就对它作明显性检查,明显时才引入,而当新自变量进入方程后,对方程中原有自变量也要作检查,并把作用最小且退化为不明显自变量逐一剔出方程。因此,逐步回归每一步(引入一个变量或剔除一个变量都称为一步)前后都要作明显性检查,以确保每次引入新变量前方程中只包括作用明显自变量。这样一步步进行下去,直至方程中所含自变量都明显而又没有新作用明显自变量可引入方程为止。第36页第36页逐步回归分析办法示意:yx1、x2、x3、……
xmxjXj是否明显结束引入方程方程内自变量中选择对y作用最小xi剔除方程外:作用最大自变量:第37页第37页第三节最优子集回归回归方程优劣评价:(P为选入方程自变量数)1.剩余原则差最小:2.变异系数最小:3.复相关系数最大:4.校正R2最大:5.cp统计量最小第38页第38页第三节最优子集回归把一切也许自变量组合方程都求出来,然后选出一个符合最优原则回归方程。这个办法称为最优子集回归。y~x1y~x2y~x3y~x1、x2y~x1、x3y~x2、x3y~x1、x2、x3最优回归准则:(1)R2最大:只能用于相同个数自变量方程间比较。(2)校正R2最大:能用于不同个数自变量方程间比较。(3)最小cp统计量:能用于不同个数自变量方程间比较。第39页第39页第三节逐步回归和最优子集回归应用实例及SAS程序用REG过程
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年上半年中国联通颍上分公司招聘20人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年中国石油宝鸡石油钢管限责任公司招聘10人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年中国烟草总公司江西省公司招聘40人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年中国华融资产管理股份限公司北京市分公司招聘易考易错模拟试题(共500题)试卷后附参考答案
- CNAS-CC180:2023 食品安全管理体系认证机构要求
- 党的建设知识培训课件内容
- 2024-2025学年湖北省部分学校高三上学期12月联考历史试题(解析版)
- 2025年高分子粘接材料项目合作计划书
- 尿素专业知识培训课件
- 工业过程测量控制和自动化 智能制造 第1部分:术语和定义 征求意见稿
- 艾滋病耐药报告解读
- 创新思维与创造力开发(山西经贸职业学院)知到智慧树答案
- 2024年潍坊护理职业学院单招职业适应性测试题库及答案解析
- 2024年安徽省公务员录用考试《行测》真题及答案解析
- 舞蹈学课件教学课件
- 医学综合题库(含答案)
- 2024年贵州省公务员考试《行测》真题及答案解析
- 丝绸之路上的民族学习通超星期末考试答案章节答案2024年
- 铁路基础知识题库单选题100道及答案解析
- 四年级语文下册第六单元【集体备课】(教材解读+教学设计)
- 第二章 疾病概论课件
评论
0/150
提交评论