版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学欢迎学习2/7/2023广西医科大学卫统黄高明编
医学统计学
第十一章回归与相关分析
2/7/2023广西医科大学卫统黄高明编
本章学习重点1、直线回归与相关的概念;2、直线回归方程的建立;3、回归系数、相关系数的建设检验;4、直线回归与相关的区别和联系;5、直线回归与相关的应用。2/7/2023广西医科大学卫统黄高明编回归与相关概述什么是标准体重,如何测量?
男性:身高(cm)-105=标准体重(kg)女性:身高(cm)-100=标准体重(kg)
北方人理想体重=(身高cm-150)×0.6+50(kg)南方人理想体重=(身高cm-150)×0.6+48(kg)2/7/2023广西医科大学卫统黄高明编
回归与相关是研究变量之间相互关系的统计分析方法,它是一类双变量或多变量统计分析方法(本章主要介绍双变量分析方法),在实际之中有着广泛的应用。如年龄与体重、年龄与血压、身高与体重、体重与肺活量、体重与体表面积、毒物剂量与动物死亡率、污染物浓度与污染源距离等都要运用回归与相关方法对资料进行统计分析。
2/7/2023广西医科大学卫统黄高明编
变量之间的关系:(1)直线关系(线性关系);(2)曲线关系(非线性关系)。在回归与相关分析中,直线回归与相关是最简单的一种,是本章主要内容。
2/7/2023广西医科大学卫统黄高明编直线回归分析:分析两个变量间的数量关系,目的是用一个变量推算另一个变量(建立回归方程)。
直线相关分析:分析两个变量之间有无相关关系以及相关的性质(正、负相关)和相关的密切程度。2/7/2023广西医科大学卫统黄高明编第一节直线回归
一、直线回归的概念“回归”一词首先由英国生物统计学家S.F.Galton(1885)提出,他发现,高个子的父代其子代平均身高不是更高,而是稍矮;相反,矮个子的父代其子代平均身高不是更矮,而是稍高于其父代水平,他把这种身高趋向种族稳定的现象称为“回归”。目前回归的含义已经演变成变量之间的某种数量依存关系。
2/7/2023广西医科大学卫统黄高明编函数关系:确定的关系。例如园周长与半径:y=2πr。回归关系:不确定的关系(随机的关系)。例如血压和年龄的关系,称为直线回归(linearregression)。
北方人理想体重=(身高cm-150)×0.6+50(kg)
变量间的关系2/7/2023广西医科大学卫统黄高明编
变量间的回归关系
由于生物间存在变异,故两相关变量之间的关系具有某种不确定性,如同性别、同年龄的人,其肺活量与体重有关,肺活量随体重的增加而增加,但体重相同的人其肺活量并不一定相等。因此,散点呈直线趋势,但并不是所有的散点均在同一条直线上,肺活量与体重的关系与严格对应的函数关系不同,它们之间是一种回归关系,称直线回归。这种关系是用直线回归方程来定量描述。2/7/2023广西医科大学卫统黄高明编回归分析涉及到两个变量,X与Y,其中X称自变量,Y为因变量或反应变量。回归分析对资料的要求Y—必须是呈正态分布的随机变量。可以是非随机变量:年龄、药物浓度或剂量—Ⅰ型回归也可以是随机变量:身高、体重、血清胆固醇的含量,血红蛋白的含量—Ⅱ型回归X2/7/2023广西医科大学卫统黄高明编
X与Y:年龄与身高药物剂量与动物死亡率肺活量与体重身高与体重、年龄与体重、年龄与血压、体重与体表面积、毒物剂量与动物死亡率、污染物浓度与污染源距离2/7/2023广西医科大学卫统黄高明编例如:年龄(X)与尿肌酐含量(Y)研究;身高(X)与(Y)体重研究人为确定随机变量两个都是随机变量2/7/2023广西医科大学卫统黄高明编由X推算Y的直线回归方程一般表达式(11-1)a称为截距,b为回归系数,即直线的斜率。ab>0yx2/7/2023广西医科大学卫统黄高明编2、回归系数b的统计学意义b>0时,Y随X增大而增大;b<0时,Y随X的增大而减少;b=0时,X与Y无直线关系。b的统计学意义是:X每增(减)一个单位,Y平均改变b个单位。2/7/2023广西医科大学卫统黄高明编b>0b<0b>0b<0d2/7/2023广西医科大学卫统黄高明编b=0b=0b=0b=0d2/7/2023广西医科大学卫统黄高明编
二、直线回归方程的建立
式中、分别是X、Y的均数;为X的离均差平方和;为X与Y的离均差积和,按下式计算。2/7/2023广西医科大学卫统黄高明编回归分析的步骤1、用原始数据绘制散点图;2、求a和b(如果呈直线关系)3、对回归系数b作假设检验(方法:a.F检验b.t检验c.用r检验来代替)。
4、如果x与y存在直线关系(b假设检验的结果P<0.05),列出回归方程。否则,不列回归方程。2/7/2023广西医科大学卫统黄高明编例11.12/7/2023广西医科大学卫统黄高明编
(1)画散点图2/7/2023广西医科大学卫统黄高明编求ΣX、ΣY、ΣX2、ΣY2及ΣXY;本例:ΣX=592.6、ΣY=1428.70;ΣX2=41222.14,ΣY2=220360.47;ΣXY=91866.46计算、、lxx、lyy、lxy;(2)计算a、b2/7/2023广西医科大学卫统黄高明编2/7/2023广西医科大学卫统黄高明编(4)列出回归方程:(3)对回归系数b作假设检验(见下)2/7/2023广西医科大学卫统黄高明编
三、回归系数b的假设检验
所建立的回归方程,不一定都有意义,必须对回归方程和回归系数进行假设检验。直线回归方程一般只对回归系数进行假设检验。2/7/2023广西医科大学卫统黄高明编
P(X,Y)
Y
X
图11.2应变量Y的平方和划分示意
Y的离均差平方和的划分2/7/2023广西医科大学卫统黄高明编P为散点图上任意一点,其纵向距离(纵坐标)被回归直线和Y值的均数分割三段:第一段:表示P点与回归直线的纵向距离,即实测值Y与估计值之差,称剩余或残差。第二段:即估计值与均数之差,它与回归系数的大小有关。|b|值越大,的差值也越大,反之越小。当b=0时,则=也就是回归直线并不能使残差减小。第三段:,是应变量Y的均数。2/7/2023广西医科大学卫统黄高明编上述三个线段的代数和为:=++
移项得:=+对上式两边同时平方后求和可以得到:其中:称总平方和,用SS总表示,称回归平方和,用SS回表示;称剩余平方和,用SS剩表示。
1、三种平方和的关系是:SS总=SS回+SS剩
2/7/2023广西医科大学卫统黄高明编2、三种平方和的意义(1)SS总,为Y值的离均差平方和,说明未考虑X与Y的回归关系时Y总的变异。(2)SS回,它反映在Y的变异中由于X与Y的直线关系而使Y变异减少的部分,也是在总平方和中可以用X解析的部分。SS回越大,说明回归效果越好。2/7/2023广西医科大学卫统黄高明编3、三种平方和的自由度及其关系如下
υ总=n-1,υ回=1,υ剩=n-2υ总=υ回+υ剩
(3)SS剩,反映X对Y的线性影响之外其它因素对Y的变异的作用,也是在总平方和中无法用X解析的部分。SS剩越小,说明回归方程的估计误差越小。2/7/2023广西医科大学卫统黄高明编SS回及SS剩的计算方法
1、先计算SS剩,再反推SS回SS剩的计算采用直接法进行,见表11.1;SS剩=7746.2189,SS总=16242.101,则SS回=SS总-SS剩=16242.101-7746.2189=8495.8821。2/7/2023广西医科大学卫统黄高明编2、先计算SS回,再反推SS剩SS回=blxy=(lxy)2/lxx本例lxx=6104.664,lxy=7201.70,lyy=16242.101,则SS回=(7201.70)2/6104.664=8495.878379SS剩=SS总-SS回=16242.101-8495.878379=7746.222622/7/2023广西医科大学卫统黄高明编
(三)b的假设检验方法
1、方差分析方法将SS总分解为SS回和SS剩两部分后,按下式计算F值:MS回,MS剩分别为回归均方及剩余均方,求出F值后查F界值表确定P值,按所取检验水准推断结论。2/7/2023广西医科大学卫统黄高明编2、t检验法按下列公式计算t值:上式中,Sb为样本回归系数的标准误,Sy.x为剩余标准差,也称回归标准差,它表示应变量Y的观察值对于回归直线的离散程度;Sy.x可以作为回归方程估计的精度指标。2/7/2023广西医科大学卫统黄高明编(四)例1.1回归系数b的假设检验
2/7/2023广西医科大学卫统黄高明编1、t检验方法假设及检验水准H0:β=0H1:β≠0α=0.05本例n=10,SS剩=7746.2189
,lxx=306.6667,b=1.17972/7/2023广西医科大学卫统黄高明编2/7/2023广西医科大学卫统黄高明编
按v=8查t界值表得,t0.02,8=2.821,t0.01,8=3.2501由于t0.01,8>t>t0.02,8,故0.02>P>0.01,按α=0.05水准,拒绝H0,接受H1,故可以认为SAH患者血清IL-6和脑积液IL-6之间有直线关系,所求回归方程存在。2/7/2023广西医科大学卫统黄高明编
2、方差分析方法
假设及检验水准同前
2/7/2023广西医科大学卫统黄高明编方差分析表
变异来源自由度SSMSFP
回归18495.8838495.8838.7740.018残差87746.2161968.277总变异916242.1000注意:t2=F2/7/2023广西医科大学卫统黄高明编按v1=1,v2=8,查F界值表得,F0.05,1,8=5.32,F0.01,1,8=11.26,0.05>P>0.01,按α=0.05水准,拒绝H0,接受H1,故可以认为SAH患者血清IL-6和脑积液IL-6之间有直线关系,所求回归方程存在。2/7/2023广西医科大学卫统黄高明编直线回归分析的区间估计(一)总体回归系数β的估计用样本回归系数b估计总体回归系数β,方法如下:β95%可信区间是:(b-t0.05,(n-2)Sb,b+t0.05,(n-2)Sb),缩写为b±t0.05,(n-2)Sb
Sb为回归系数的标准误,n-2为自由度。2/7/2023广西医科大学卫统黄高明编
(二)总体均数
的区间估计是总体中当X为某定值X0时Y的总体均数。而将X的值代入回归方程中所求得的为样本均数,是的估计值。比如,SAH患者(指总体),血清IL-6为50的人,其脑脊液IL-6平均含量就是,而往往未知,可以通过来估计,计算方法如下:2/7/2023广西医科大学卫统黄高明编(1-)的可信区间是:(-tα,n-2,+tα,n-2),缩写为±tα,n-2
是的标准误。2/7/2023广西医科大学卫统黄高明编例11.4利用例11.1的结果,计算当X0=50时,的95%可信区间。的95%可信区间为:(109.43,154.47)其含义是:当血清IL-6为50时,脑脊液的IL-6的总体均数为131.95(点值估计),95%可信区间为:109.43-154.47(区间估计)。2/7/2023广西医科大学卫统黄高明编(三)个体值Y的容许区间当即总体中,当X为某定值时,个体值Y的波动范围,个体值Y的离散程度用Sy(称个体值的标准差)来表示,其计算方法如下:当X与接近,且n充分大时,可用Sy.x代替Sy。2/7/2023广西医科大学卫统黄高明编个体值Y的1-α容许区间计算方法如下:2/7/2023广西医科大学卫统黄高明编例11.4利用例11.1的结果,计算当X0=50时,相应个体值的95%容许区间。经计算,得:当X0=50时,相应个体值的95%容许区间为:(56.73,207.16)其含义是:当血清IL-6为50时,有95%的病人其脑脊液的IL-6的含量在56.73-207.16范围内。即在100个血清IL-6为50的病人中,有95个病人的脑脊液的IL-6的含量在56.73-207.16范围内。2/7/2023广西医科大学卫统黄高明编2/7/2023广西医科大学卫统黄高明编四、直线回归方程的应用1、描述两变量间依存的数量关系。=72.961+1.1797X就是描述SAH患者第1天脑脊液IL-6随血清IL-6变化的定量表达式。2、利用回归方程进行预测这是回归方程重要的应用方面。将预报因子(自变量X)代入回归方程,对预报量(应变量Y)进行估计。预报量的波动范围可按求个体值Y的容许区间进行计算。2/7/2023广西医科大学卫统黄高明编例某地防疫站根据近10年来乙脑发病率(1/10万,预报量Y)与相应前一年7月份日照时间(小时,预报因子X)建立回归方程,将乙脑发病率作平方根反正弦变换,即取y=sin-1,求得回归方程:=-1.197+0.0068X,Sy.x=0.0223,=237.43,lxx=5690,n=10。已知1990年7月份日照时间X=260,试估计1991年该地乙脑发病率(设α=0.05)。2/7/2023广西医科大学卫统黄高明编
(1)、求个体值Y的离散度Sy
(2)、求X=260时,=-1.197+0.0068(260)=0.571α=0.05时,t0.05,8=2.30695%容许区间是:(-t0.05(n-2)Sy,+t0.05(n-2)Sy)(0.571-2.306×0.0243,0.571+2.306×0.0243)=(0.5150,0.6270)2/7/2023广西医科大学卫统黄高明编取原函数,Y=(siny)2,得乙脑发病率95%容许区间(0.0000808,0.0001197),故可预测该地1991年乙脑发病率有95%的可能在8.08~11.97/10万之间。(注:将y还原时,角度单位定为度)2/7/2023广西医科大学卫统黄高明编3、用容易测量的指标估计不易测量的指标4、利用回归方程制定医学参考值范围体重(易)→体表面积(难)计算个体值Y的容许区间。如年龄与身高有线性关系,可根据回归方程估计年龄为X时,身高的波动范围(容许区间),即医学参考值范围。2/7/2023广西医科大学卫统黄高明编5、利用回归进行统计控制统计控制是利用回归方程进行逆估计,也就是已知y之后反推x。如要求y在一定范围内波动时,可按求Y的容许区间来推算x的取值来实现。2/7/2023广西医科大学卫统黄高明编例:某市环境监测站在交通点连续测定30天,每天定时采样3次,测得大气中NO2浓度Y(mg/m3)与当时汽车流量X(辆/小时),共90对数据,求得回归方程:=-0.064866+0.000133X,
剩余标准差Sy.x=0.032522,若NO2的最大容许浓度为0.15/m3,则汽车流量应如何控制?设α=0.05。2/7/2023广西医科大学卫统黄高明编分析:NO2的浓度以过高为异常,应求个体值y的单侧波动范围的上限值,其95%的波动范围是:+t(0.05,v)Sy=-0.064866+0.000133X+t(0.05,v)Sy要求NO2的最高容许浓度为0.15,即:-0.064866+0.000133X+t(0.05,v)Sy=0.152/7/2023广西医科大学卫统黄高明编单侧t0.05,(90-2)=1.662,以Sy.x代替Sy,带入上式得:-0.064866+0.000133X+1.662×0.032522=0.15解上式得:X=1209.13(辆/小时)即只要把汽车流量控制在1209辆/小时以下,就有95%的可能使NO2浓度不超过0.15mg/m3。2/7/2023广西医科大学卫统黄高明编(1)作回归分析要有实际意义。(2)进行直线回归分析前,应绘制散点图。作用:①看散点是否呈直线趋势;②有无异常点、高杠杆点和强影响点;五、应用直线回归分析应注意的问题异常点2/7/2023广西医科大学卫统黄高明编(3)注意建立线性回归模型的基本条件
线性、独立性、正态性、方差齐性(4)直线回归方程的适用范围以求回归方程时X的实测值范围为限;若无充分理由证明超过该范围还是直线,应避免外延。(5)两变量有线性关系,不一定是因果关系,也不一定表明两变量间确有内在联系。2/7/2023广西医科大学卫统黄高明编
一、直线相关的概念
在实际应用中若只需了解两个随机变量之间相互关系的情况,而不要求由X推算Y,此时就宜进行直线相关分析(积差相关分析)。
1、相关分析的目的分析随机变量X与Y是否有直线相关关系以及相关的性质和相关的密切程度等(暂不考虑X和Y数量上的关系)。直线相关的性质可通过散点图直观地说明。
第二节直线相关2/7/2023广西医科大学卫统黄高明编2/7/2023广西医科大学卫统黄高明编
直线相关的性质(1)正相关(Y随X的增大而增大,如散点在一直线上,称完全正相关);(2)负相关(Y随X的增大而减小,如散点在一直线上,称完全负相关);
(3)零相关:散点分布呈圆形等,反映两变量间无直线关系,也可能存在曲线关系。2/7/2023广西医科大学卫统黄高明编
2、相关分析对资料的要求要求X与Y均呈正态分布的随机变量,称双变量正态分布资料。
3、相关分析方法相关分析是通过计算相关系数r(称积差相关系数)来定量地描述随机变量X与Y之间的关系。计算r之后,还要对r是否来自ρ=0的总体进行假设检验(采用t检验或直接查r界值表确定P值。
2/7/2023广西医科大学卫统黄高明编注意:通过相关分析认为X与Y有相关关系,并不一定是因果关系,可能是一种伴随关系,即X与Y同时受到另外一个因素的影响。因此,相关分析的任务就是对两变量之间的关系给以定量的描述。2/7/2023广西医科大学卫统黄高明编二、相关系数的意义及计算
1、r的计算方法
式中lxy称X和Y的离均差积和,lxx称X的离均差平方和;lyy称Y的离均差平方和。
2/7/2023广西医科大学卫统黄高明编
2、相关系数r的意义
r称为积差相关系数,没有单位,它反映具有直线关系的两个变量间,相关关系的密切程度和相关性质的指标,取值范围是-1≤r≤1。r为正表示正相关,r为负表示负相关,r的绝对值越大,则变量间的关系越密切;|r|=1,称为完全正(或负)相关。2/7/2023广西医科大学卫统黄高明编3、相关系数的计算例11.5对例11.1的资料计算SAH患者血清IL-6和脑脊液IL-6的相关系数。因为血清IL-6和脑脊液IL-6均是随机变量,且呈正态分布(可经检验证明),两变量呈直线趋势(见图11.1),故可进行直线相关分析。已知:lxx=6104.66,lyy=16242.10,lxy=7201.70
即血清IL-6和脑脊液IL-6的相关系数r=0.74952/7/2023广西医科大学卫统黄高明编
三、相关系数的假设检验根据样本资料计算所得的相关系数r,称样本相关系数,由于存在抽样误差,尽管r不为0,尚不能说明两变量之间有直线相关关系。因此,要对r是否来自ρ=0的总体进行假设检验。可用t检验或直接查附表15,r界值表确定P值。检验统计量t值的计算方法如下:2/7/2023广西医科大学卫统黄高明编
对例11.5计算所得r进行检验,以说明血清IL-6和脑脊液IL-6是否有直线相关关系。H0:ρ=0,血清IL-6和脑脊液IL-6之间无直线相关关系H1:ρ≠0,血清IL-6和脑脊液IL-6之间有直线相关关系α=0.05本例:n=10,r=0.7232,按式(11.19)得:ν=10-2=8,查附表2,t界值表得,t0.02,8=2.896,t0.01,8=2.998。因为t0.01,8>t>t0.02,8,所以0.02>P>0.01。2/7/2023广西医科大学卫统黄高明编
按α=0.05水准,拒绝H0,接受H1,可以认为血清IL-6和脑脊液IL-6之间呈正的直线相关关系。也可以按直接查附表15,r界值表(P280),确定P值。r0.02,8=0.715,r0.01,8=0.765。r0.02,8<r<r0.01,8,故0.02>P>0.01,结论同上。2/7/2023广西医科大学卫统黄高明编直线回归与相关的区别和联系一、区别
1、对资料要求不同(1)回归分析要求因变量Y是服从正态分布的随机变量,X是可以精确测量和严格控制的变量,一般称Ⅰ型回归,即只能由X作自变量推算Y。(2)相关分析要求两个变量X、Y是均服从正态分布的随机变量,即双变量正态分布。对这种资料进行回归分析称Ⅱ型回归,可以求出两个方程:2/7/2023广西医科大学卫统黄高明编由X推算Y的方程:由Y推算X的方程:
2、应用不同:说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。
3、意义不同:b表示X每增(减)一个单位,Y平均改变b个单位;r说明具有直线关系的两个变量间相关关系的密切程度与相关的方向。
4、算方法不同。
5、取值范围不同;-1≤r≤1,-∞<b<+∞。
6、b有单位,r没有单位。2/7/2023广西医科大学卫统黄高明编二、联系1、对一组数据若同时计算r与b,则它们的正负号是一致的。2、r和b的假设检验是等价的,即对同一资料,两者的t值相等()。在实际中常采用对r的检验来代替对b的检验。3、可用回归解析相关。
r的平方,即r2,称决定系数,它说明回归平方和(SS回)占总平方和(SS总)的比重,其取值范围在0~1之间。2/7/2023广西医科大学卫统黄高明编
上式说明,当SS总固定不变时,SS回的大小取决于r2。r2越大,则SS回就越大;SS回是由于引入了相关变量后使总平方和减少的部分。SS回越接近SS总,则r2越接近1,说明引入相关变量的效果越好。在临床研究中,若r2达到0.7以上,就可认为回归效果不错;但在实验室研究中,如标准曲线的配制,r2的要求很高,达到0.95以上。
2/7/2023广西医科大学卫统黄高明编
可通过r2的大小来确定两变量间相关关系的实际意义。例如r=0.2,n=100时,可以认为两变量间有直线相关关系,但r2=0.04,表示回归平方和在总平方和中仅占4%,即X对Y的影响仅占4%,实际意义不大。2/7/2023广西医科大学卫统黄高明编等级相关分析适用资料(1)不服从双变量正态分布而不宜作积差相关分析;(2)总体分布型未知;(3)原始数据用等级表示。第三节秩相关(等级相关)2/7/2023广西医科大学卫统黄高明编
一、Spearman等级相关与积差相关分析一样,等级相关分析是用等级相关系数rs来说明两个具有直线关系的两个变量间相关的密切程度与相关方向。rs计算方法如下:上式中,为每对观察值Xi、Yi的秩次Ui、Vi之差,n为对子数。
2/7/2023广西医科大学卫统黄高明编rs为样本等级相关系数,是总体等级相关系数ρs的估计值,其取值范围是:-1≤rs≤1。rs的意义同r。求出rs后还要检验rs是否来自ρs=0的总体,才能确定两变量间是否存在直线相关关系。对rs的假设检验可用查表法(附表16,rs界值表),或用下式作u检验(当n>50时,用该法)。2/7/2023广西医科大学卫统黄高明编
例11.6某地作肝癌病因研究,调查了10个乡肝癌死亡率(1/10万)与食物中黄曲酶毒素相对含量(以最高就含量为10),见表11.6(2)、(4)栏。试作等级相关分析。
2/7/2023广西医科大学卫统黄高明编
表11.6等级相关系数计算表
黄曲霉毒素肝癌死亡率相对含量(1/10万)dd2编号XUYV10.7121.53-2421.0218.920031.7314.412443.7446.57-3954.0527.341165.1664.69-3975.5746.361185.7834.253995.9977.610-111010.01055.1824
合计-----422/7/2023广西医科大学卫统黄高明编分析步骤如下:H0:ρs=0,即黄曲酶毒素含量与肝癌死亡率无直线关系H1:ρs≠0,即黄曲酶毒素含量与肝癌死亡率有直线关系α=0.05分别对X、Y的观察值从小到大编秩,若有相同的观察值则取平均秩次;求每对观察值秩次之差值d、d2及Σd2。本例Σd2=42。
2/7/2023广西医科大学卫统黄高明编计算rs:n=10,查附表16,rs界值表得:rs(0.02,10)=0.745,P=0.02,按α=0.05水准,拒绝H0,接受H1,可以认为黄曲霉毒素与肝癌死亡率之间存在正相关。2/7/2023广西医科大学卫统黄高明编三、rs的校正当X及Y中,相同的秩次个数较多时(如等级资料),宜用下式计算校正rs。
上式Tx(或Ty)=Σ(t3-t)/12,t为X(或Y)中相同秩次的个数。显然,当Tx=Ty=0时,式(11.23)与(11.21)相等。(11.23)2/7/2023广西医科大学卫统黄高明编假设上例中,黄曲酶毒素相对含量,1~5号乡相等,这5个乡平均秩次皆为(1+2+3+4+5)/5=3,则t=5;6~8号乡相同,平均秩次为7,则t=3;9~10号乡相同,平均秩次为9.5,则t=2。而肝癌发病率没有相同的秩次,故Tx=[(53-5)+(33-3)+(23-2)]/12=12.5;Ty=0据此假设算得Σd2=33.5,则:2/7/2023广西医科大学卫统黄高明编今以n=10,查附表15,0.02>P>0.01。如不校正0.01>P>0.005,可见若相同秩次较多时,如不校正,则rs偏大,而P值偏小。
2/7/2023广西医科大学卫统黄高明编
一、曲线拟合的意义在医学研究中,两变量之间的关系有时不呈直线而呈曲线关系。如药物在体内的浓度与时间的关系,儿童年龄与身长发育的关系等都不是简单的直线关系,这种资料就不能用直线回归分析,有时可以通过适当的变量变换使之直线化,从而扩大了直线回归的应用。
第四节曲线拟合2/7/2023广西医科大学卫统黄高明编
1、曲线拟合:就是用适当的曲线方程来描述变量之间的变化关系。曲线拟合最基本方法是曲线直线化,即通过适当的变量变换,使曲线关系变为直线关系,然后用直线回归分析方法求出直线方程,然后还原为曲线方程。
2、直接使用变量变换后的直线回归:若两变量呈曲线趋势,常使用直线化回归方程,绘制标准曲线。2/7/2023广西医科大学卫统黄高明编二、曲线拟合步骤
1、选定曲线类型
指数曲线示意图2/7/2023广西医科大学卫统黄高明编
2、将变量作对数变换选定X(或K-X)或Y(或K-Y)进行对数变换,K为常量,使变换后的两变量呈直线关系。也可以将实测数据在半对数坐标纸上作直线化尝试。2/7/2023广西医科大学卫统黄高明编3、按求直线回归方程的方法求直线化方程;4、将直线化方程转为曲线方程,作曲线图。
表11.7某地氰化物浓度与污染源距离的关系━━━━━━━━━━━━━━━━━━━━━与污染源氰化物距离(m)浓度(mg/m3)XYy=lgYY(1)(2)(3)(4)─────────────────────500.687-0.16300.5841000.398-0.40010.3641500.200-.069900.2272000.121-0.91720.1422500.090-1.0458
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年人民版九年级历史上册阶段测试试卷含答案
- 二零二五版农村集体资产农民房屋租赁合同2篇
- 2025年度智能化农场承包经营合同4篇
- 二零二五年度建筑幕墙施工安全协议合同4篇
- 二零二五年度健康营养面包研发与订购合同4篇
- 二零二五版专业摄影棚场地租赁及拍摄服务合同范本4篇
- 2025年度木饰面产品市场推广与广告投放合同
- 房屋抵债合同(2篇)
- 2025版南京商业地产租赁税费结算合同4篇
- 着火场景的火源辨识与处置
- 红色革命故事《王二小的故事》
- 《白蛇缘起》赏析
- 海洋工程用高性能建筑钢材的研发
- 苏教版2022-2023学年三年级数学下册开学摸底考试卷(五)含答案与解析
- 英语48个国际音标课件(单词带声、附有声国际音标图)
- GB/T 6892-2023一般工业用铝及铝合金挤压型材
- 冷库安全管理制度
- 2023同等学力申硕统考英语考试真题
- 家具安装工培训教案优质资料
- 在双减政策下小学音乐社团活动有效开展及策略 论文
- envi二次开发素材包-idl培训
评论
0/150
提交评论