医学统计学:第九章 双变量回归与相关_第1页
医学统计学:第九章 双变量回归与相关_第2页
医学统计学:第九章 双变量回归与相关_第3页
医学统计学:第九章 双变量回归与相关_第4页
医学统计学:第九章 双变量回归与相关_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章第九章 双变量回归与相关双变量回归与相关 研究两个数值变量间的数量关系研究两个数值变量间的数量关系 第一节第一节 直线回归直线回归 第二节第二节 直线相关直线相关 第三节第三节 秩相关秩相关 第四节加权直线回归第四节加权直线回归 第五节第五节两条回归直线的比较两条回归直线的比较 F. Galton K.Pearson 作散点图,观察点子是否呈直线趋势作散点图,观察点子是否呈直线趋势 作直线回归分析和相关分析作直线回归分析和相关分析 直线趋势直线趋势 结束结束 是是 否否 l某地方病研究所调查了某地方病研究所调查了8名正常儿童的尿肌酐名正常儿童的尿肌酐 含量含量(mmol/24h)。 l

2、X为选定变量,为选定变量,Y为随机变量。为随机变量。 8名正常儿童的年龄名正常儿童的年龄X岁与尿肌酐含量岁与尿肌酐含量(mmol/24h) 编号编号12345678 年龄年龄X131196810127 尿肌酐含量尿肌酐含量 Y 3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65 散点图散点图 l以横轴为年龄以横轴为年龄X,纵,纵 轴为尿肌酐轴为尿肌酐Y,将随,将随 机样本的机样本的n对变量值对变量值 (X1,Y1),(Xn,Yn), 即即(13,3.54), (11,3.01), (7,2.65) (表表9-1数据,共数据,共8个个 记录记录),绘于图中,绘于图中,

3、 得得散点图散点图。 散点图散点图 l若有直线趋势,可若有直线趋势,可 进行线性回归或相进行线性回归或相 关分析。关分析。 l尿肌酐含量尿肌酐含量Y 随年随年 龄龄X增加而增大,增加而增大, 且呈直线趋势。且呈直线趋势。 l异常点,异常点,outlier。 l明显远离主体的明显远离主体的 数据。数据。 X 年龄年龄 141210864 尿肌酐尿肌酐 3.6 3.4 3.2 3.0 2.8 2.6 2.4 Y bXaY 散点图散点图 lGraphs Scatter/Dot 散点图散点图 散点图散点图 12 4 3 5 选择选择Simple(简单简单); 单击单击Define(定义定义)。 Y A

4、xis:y X Axis:x 单击单击OK。 lSimple:简单散点图,:简单散点图, 显示一对变量。显示一对变量。 lOverlay:重叠散点图,重叠散点图, 显示多对变量。显示多对变量。 lSet Makers by:分组:分组 变量,用不同颜色表变量,用不同颜色表 示,如性别。示,如性别。 lLabel Cases by:标记:标记 变量,用此变量值标变量,用此变量值标 记,如序号。记,如序号。 散点图散点图 l注意:不一定是因果关系,应根据专业知识判注意:不一定是因果关系,应根据专业知识判 定是否有实际意义。定是否有实际意义。 散点图散点图 l有曲线趋势,应进一步拟合曲线关系。有曲线

5、趋势,应进一步拟合曲线关系。 散点图散点图 散点图散点图 l有一有一离群点离群点(outlier),会对分析结果带来了严,会对分析结果带来了严 重的影响,应对该重的影响,应对该离群点离群点进行认真核查与深入进行认真核查与深入 分析。分析。 l参阅参阅P159(2. 进行相关、回归分析前应绘制散进行相关、回归分析前应绘制散 点图点图)。 散点图散点图 l有一个观测值对分析结果带来了严重的影响,有一个观测值对分析结果带来了严重的影响, 应增加对不同的自变量应增加对不同的自变量 x增加一定的观测值再增加一定的观测值再 进行认真分析。进行认真分析。 回归概念回归概念 分析步骤分析步骤 直线回归方程的求

6、导直线回归方程的求导 统计推断统计推断 估计与预测估计与预测 l事物或现象间的数量依存关系。事物或现象间的数量依存关系。 l直线回归,直线回归,linear regression。 l简单回归简单回归,simple regression。 l两连续性变量两连续性变量X与与Y之间的线性数量之间的线性数量依存关系依存关系。 lX为自变量,为自变量,independent variable; lY为因变量,为因变量,dependent variable。 l回归关系是数量关系,并不是一一对应的函数回归关系是数量关系,并不是一一对应的函数 关系。关系。 l子女身高子女身高y与父亲身高与父亲身高x之间的

7、关系;之间的关系; l体重体重y与身高与身高x1、胸围、胸围x2之间的关系之间的关系 l体表面积体表面积y与体重与体重x之间的关系之间的关系 绘制散点图绘制散点图 求回归方程:回归系数和常数项求回归方程:回归系数和常数项 假设检验:方程、回归系数和常数项假设检验:方程、回归系数和常数项 回归方程的解释回归方程的解释与应用与应用 l某地方病研究所调查了某地方病研究所调查了8名正常儿童的尿肌酐名正常儿童的尿肌酐 含量含量(mmol/24h)。估计尿肌酐含量。估计尿肌酐含量(Y)对其年对其年 龄龄(X)的回归方程。的回归方程。 l根据变量间的关系,确定自变量和因变量。根据变量间的关系,确定自变量和因

8、变量。 l年龄年龄X为自变量,为自变量,independent variable; l尿肌酐含量尿肌酐含量Y为因变量,为因变量,dependent variable。 8名正常儿童的年龄名正常儿童的年龄X岁与尿肌酐含量岁与尿肌酐含量(mmol/24h) 编号编号12345678 年龄年龄X131196810127 尿肌酐含量尿肌酐含量Y 3.543.013.092.482.563.363.182.65 年龄 131211109876 尿肌酐 3.6 3.4 3.2 3.0 2.8 2.6 2.4 0 |XY 0 X bXaY (X,Y) Analyze Regression Linear. D

9、ependent因变量因变量 Independent(s)自变量自变量 Coefficients,系数:,系数: Dependent Variable,因变量,因变量 Model:模型;:模型; Constant:常数项。:常数项。 Unstandardized Coefficients,未标化系数。,未标化系数。 B:对应系数。此处含:对应系数。此处含“常数项常数项a”,和变量,和变量“年龄年龄”的的“回归系数回归系数 b”。 Std. Error:对应系数的标准误。:对应系数的标准误。 XbXaY139. 0664. 1 Coefficients a 1.664(a).2975.602.0

10、01 .139(b).0304.571.004 (Constant) 年龄年龄 Model 1 BStd. Error Unstandardized Coefficients tSig. Dependent Variable: 尿肌酐尿肌酐a. 年龄 131211109876 尿肌酐 3.6 3.4 3.2 3.0 2.8 2.6 2.4 0 |XY 0 X bXaY (X,Y) l截距,截距,intercept,回归直线在回归直线在Y轴的交点。轴的交点。 la = 0,交点在原点上;交点在原点上; la 0,交点在原点的上方;交点在原点的上方; la 0:直线从左下方走向右上方;直线从左下方

11、走向右上方; lb0:直线从左上方走向右下方;直线从左上方走向右下方; lb=0,即回归方程不存在,即回归方程不存在。 l统计意义:统计意义: l当当X变化一个变化一个 单位,单位,Y平均平均 改变的估计值改变的估计值 (b个单位个单位)。 l根据已求得的回归方程根据已求得的回归方程,取两点取两点(X1,Y1)和和 (X2,Y2)用直线连接。用直线连接。 l在在X实测值的范围内取实测值的范围内取X1(较小值较小值)和和X2(较大值较大值); l把把X1和和X2代入回归方程,求出代入回归方程,求出Y1和和Y2; l将将 (X1,Y1)和和 (X2,Y2) 两坐标点描绘在散点图中;两坐标点描绘在散

12、点图中; l用直线连接这两个坐标用直线连接这两个坐标 点,得到方程的回归直线。点,得到方程的回归直线。 l绘图时注意,两坐标点绘图时注意,两坐标点 之间要隔开一定的距离,之间要隔开一定的距离, 以减少回归线的误差。以减少回归线的误差。 年龄 131211109876 尿肌酐 3.6 3.4 3.2 3.0 2.8 2.6 2.4 1 2 3 4 若去掉此选项,则回归方程若去掉此选项,则回归方程 不含常数项,方程过原点不含常数项,方程过原点 l回归方程的检验:回归方程的检验: lH0:b b=0,H1:b b0, =0.05。 l对回归方程的检验:方差分析。对回归方程的检验:方差分析。 l对回归

13、系数的检验:对回归系数的检验:t检验。检验。 l一元直线回归一元直线回归(即一个自变量,一个因变量即一个自变量,一个因变量)中,上中,上 面两个检验等价。面两个检验等价。 l总体回归系数总体回归系数(含常数项含常数项)的可信区间:的可信区间: l总体回归系数总体回归系数b b的可信区间。的可信区间。 l总体常数项总体常数项 的可信区间。的可信区间。 l利用回归方程的估计和预测:利用回归方程的估计和预测: l总体均数总体均数 Y|X的可信区间。的可信区间。 l个体值个体值Y的预测区间。的预测区间。 lH0:b b=0,H1:b b0, =0.05。 lF=20.892,P=0.0040.05,按

14、,按 =0.05检验水准,拒检验水准,拒 绝绝H0,接受,接受H1,认为方程有统计学意义。,认为方程有统计学意义。 l回归的剩余标准差回归的剩余标准差 b ANOVA .8101.81020.892.004 a .2336.039 1.0437 Regression Residual Total Model 1 Sum of Squares df Mean SquareFSig. Predictors: (Constant), 年龄年龄a. Dependent Variable: 尿肌酐尿肌酐b. 039. 0 残残 MSS XY a. Predictors: (Constant), 年龄年龄

15、 l预测:常数、年龄,即回归方程中含常数项和年龄。预测:常数、年龄,即回归方程中含常数项和年龄。 b. Dependent Variable: 尿肌酐尿肌酐 l因变量因变量: 尿肌酐尿肌酐 lModel,模型,模型 lRegression,回归,回归 lResidual,残差,残差 lTotal,总计,总变异,总计,总变异 lSum of Squares,SS,平方和,平方和 ldf,degree of freedom,自由度,自由度 lMean Square,MS,圴方,圴方 回归系数检验回归系数检验t检验检验 lH0:b b=0,H1:b b0, =0.05。 l回归系数的回归系数的tb=

16、4.571,P=0.0040.05,按,按 =0.05检验检验 水准,拒绝水准,拒绝H0,接受,接受H1,认为,认为b b不为零,方程存在。不为零,方程存在。 lF=t2:直线回归中,:直线回归中,F检验与检验与t检验等价。检验等价。 XbXaY139. 0664. 1 Coefficientsa 1.664(a).2975.602.001 .139(b).030(Sb)4.571.004 (Constant) 年龄年龄 Model 1 BStd. Error Unstandardized Coefficients tSig. Dependent Variable: 尿肌酐尿肌酐a. 常数项检

17、验常数项检验t检验检验 lH0: =0,H1: 0, =0.05。 l常数项的常数项的ta=5.602,P=0.0010.05,按,按 =0.05检验检验 水准,拒绝水准,拒绝H0,接受,接受H1,认为回归方程过原点。,认为回归方程过原点。 XbXaY139. 0664. 1 Coefficientsa 1.664(a).2975.602.001 .139(b).030(Sb)4.571.004 (Constant) 年龄年龄 Model 1 BStd. Error Unstandardized Coefficients tSig. Dependent Variable: 尿肌酐尿肌酐a. 1

18、 2 3 操作:操作:在主对话框中单击在主对话框中单击 Statistics,选择选择 Confidence intervals,单单 击击Continue。 lEstimates:估计,默认项。:估计,默认项。 lModel fit:模型配合,默认:模型配合,默认 项。项。 lConfidence intervals:回归回归 系数系数B的的95%可信区间可信区间 Statistics 统计量统计量 l在在Statistics子对话框中选择子对话框中选择Confidence intervals(可信区间可信区间),则其结果显示在,则其结果显示在 “Coefficients(系数系数)”表的右

19、侧。表的右侧。 lConstant,常数。,常数。 l常数项常数项 的的95%可信区间为可信区间为(0.937,2.391)。 l回归系数回归系数b b的的95%可信区间为可信区间为(0.065,0.213)。 Coefficients a .9372.391 .065.213 (Constant) 年龄年龄 Model 1 Lower BoundUpper Bound 95% Confidence Interval for B Dependent Variable: 尿肌酐尿肌酐a. 尿肌酐 X 16.00 14.00 12.00 10.00 8.00 6.00 4.00 2.00 .00

20、5.0 4.0 3.0 2.0 1.0 0.0 X 16.00 14.00 12.00 10.00 8.00 6.00 4.00 2.00 .00 5.0 4.0 3.0 2.0 1.0 0.0 X 16.00 14.00 12.00 10.00 8.00 6.00 4.00 2.00 .00 5.0 4.0 3.0 2.0 1.0 0.0 X 16.00 14.00 12.00 10.00 8.00 6.00 4.00 2.00 .00 5.0 4.0 3.0 2.0 1.0 0.0 X 16.00 14.00 12.00 10.00 8.00 6.00 4.00 2.00 .00 5.0

21、4.0 3.0 2.0 1.0 0.0 预测区间预测区间 可信区间可信区间 回归方程回归方程 操作:操作:在主对话框中在主对话框中 单击单击Save,选择选择 Unstandardized,S.E. of mean predictions, mean,individual, 单击单击Continue。 lSave保存保存:在:在Data View中新产生相应的中新产生相应的 变量,并计算其数值。变量,并计算其数值。 1 2 3 2 2 1 2 34 l运行运行Linear Regression过程后,过程后,SPSS会在会在Data View中新产生的数据。中新产生的数据。 l当当X0=12时

22、:时: =3.33079。 l预测值均数的标准误预测值均数的标准误(Sep_1)为为 =0.10306; l总体均数的总体均数的95%可信区间为可信区间为3.078603.58297; l个体个体Y值的值的95%预测区间为预测区间为2.786853.87473。 0 Y S 0 Y 0 Y S l描述两个变量之间的数量依存关系。描述两个变量之间的数量依存关系。 l利用回归方程进行预测。利用回归方程进行预测。 l将年龄将年龄X代入回归方程可预测尿肌酐含量。代入回归方程可预测尿肌酐含量。 l适用范围一般不应超出样本中自变量的取值范围,此预测值适用范围一般不应超出样本中自变量的取值范围,此预测值 称

23、为内插,称为内插,interpolation; l超出自变量取值范围所得预测值称为外延,超出自变量取值范围所得预测值称为外延,extrapolation。 l利用回归方程进行控制。利用回归方程进行控制。 l用回归方程进行逆估计。但不是用回归方程进行逆估计。但不是Y推推X的回归方程。的回归方程。 l欲控制大气中二氧化氮的浓度在欲控制大气中二氧化氮的浓度在y=0.05mg/L以下,以下, 须将汽车流量控制在须将汽车流量控制在x=1183辆辆/小时以下。小时以下。 11830001838. 0/ )1674. 005. 0( 0001838. 01674. 0 x xy 直线相关概念直线相关概念 相

24、关系数相关系数r的意义的意义 r r的假设检验的假设检验 绘制散点图绘制散点图 计算相关系数计算相关系数 对总体相关系数进行假设检验对总体相关系数进行假设检验 l相关相关,correlation。 l研究两变量互相依赖的关系,但不是函数关系。研究两变量互相依赖的关系,但不是函数关系。 l研究两变量共同变化的关系:身高和体重。研究两变量共同变化的关系:身高和体重。 l直线相关,直线相关,linear correlation。 l简单相关简单相关,simple correlation。 l用于双变量正态分布用于双变量正态分布(bivariate normal distribution) 资料。资料

25、。 l研究研究 两个变量两个变量X,Y数量上的依存(或相关)数量上的依存(或相关) 关系。关系。 lPearson相关系数,积差相关系数,积差相关系数相关系数, 简单相关简单相关 系数。系数。 l英国统计学家英国统计学家Karl Pearson于于20世纪初提出的。世纪初提出的。 l描述变量之间直线的密切程度和方向的指标。描述变量之间直线的密切程度和方向的指标。 l不考虑其它变量的影响,表示任何两变量间的相关不考虑其它变量的影响,表示任何两变量间的相关 程度和方向。程度和方向。 l相关系数没有单位,其取值范围相关系数没有单位,其取值范围: -1,1。 l符号符号r表示样本相关系数;表示样本相关

26、系数; l符号符号r r (音:音:Rho,洛,洛)表示其总体相关系数。表示其总体相关系数。 )19( 8818. 0 )()( )( 22 例例 yyxx yyxx ll l r yyxx xy lr=0,零相关,零相关,zero correlation。 l无相关关系,无直线关系,并不能说无任何关系。无相关关系,无直线关系,并不能说无任何关系。 1. 非线性相关:可能是某曲线关系,但不是线性的。非线性相关:可能是某曲线关系,但不是线性的。 2. 无任何关系。无任何关系。 lr= 1,完全正完全正/负相关,负相关,完全直线关系完全直线关系。 lperfect positive/negativ

27、e correlation。 l-1r0,positive correlation,负相关负相关; l0r1,negative correlation,正相关正相关; l|r|愈接近愈接近1,相关愈密切;,相关愈密切; l|r|愈接近愈接近0,相关愈不密切。,相关愈不密切。 lr=0,零相关。零相关。 lr= 1,完全正完全正/负相关。负相关。 l-1r0,负相关。负相关。 l0r1 ,正相关。正相关。 l|r|从从 0 到到 1 变化时变化时, 散点散点 从散开逐渐聚到一直线从散开逐渐聚到一直线 上。上。 Analyze Correlate Bivariate. x,yVariables l

28、Correlation Coelficients: l相关系数,相关系数,Pearson为默认选项。为默认选项。 lKendalls tau-b,秩相关系数。,秩相关系数。 lSpearman,秩相关系数。,秩相关系数。 lTest of Significance, 检检 验意义。验意义。 lTwo-tailed, 双侧检验。双侧检验。 lOne-tailed, 单侧检验。单侧检验。 lFlag significance correlation,标,标 识有意义的相识有意义的相 关系数。关系数。 l*:P=0.05。 l*:P=0.01。 *:P0.01,双侧检验。,双侧检验。 l尿肌酐含量和

29、其年龄的相关系数尿肌酐含量和其年龄的相关系数r=0.881。 lH0 : =0,H1 : 0, = 0.05。 lp=0.004,按,按 =0.05检验水准,拒绝检验水准,拒绝H0,接受,接受H1, 认为总体相关系数不为零,可认为尿肌酐与年龄认为总体相关系数不为零,可认为尿肌酐与年龄 间有正的直线相关关系。间有正的直线相关关系。 Correlations 1.881* .004 88 .881*1 .004. 88 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 年龄年龄 尿肌酐尿肌酐 年龄

30、年龄尿肌酐尿肌酐 Correlation is significant at the 0.01 level (2-tailed).*. 05. 0317. 44.579 6 579. 4 21 6,005. 0 2 ptt 2n nr r s r t r r r , lH0 : =0,H1 : 0, =0.05。 lsr为相关系数的标准误。为相关系数的标准误。 l按按 =0.05检验水准,拒绝检验水准,拒绝H0,接受,接受H1,可认,可认 为为。 l相关程度说明相关的实际意义。相关程度说明相关的实际意义。 0.4 低低 lr 0.4r0.8 中中 度相关度相关 0.8 高高 ltanh的计算:

31、在计算机上的计算器输入的计算:在计算机上的计算器输入0.3185, 选择选择Hyp,单击,单击tan按钮,即得按钮,即得0.3081 )9971. 0(0.4678%95 1 1 )tanh( 1 . 3 )2749. 35073. 0(3/ 1 . 2 )1( )1( ln 2 1 3838. 1tanh . 1 2 2 2/ 1 ,可信区间可信区间的的 。; 可信区间。可信区间。的的作反变换得作反变换得 , 可信区间。可信区间。的的根据正态近似原理计算根据正态近似原理计算 ; 变换。变换。作作对对 r e e rzr r uz z r r zrz zr z z ltanh为双曲正切函数;为

32、双曲正切函数;tanh-1为反双曲正切函数。为反双曲正切函数。 l开始开始附件附件计算器。计算器。查看查看科学型。科学型。 ltanh-1:输入:输入0.8818,选择,选择Inv与与Hyp,单击,单击tan按钮,按钮, 即得即得1.3838。 ltanh:输入:输入0.5073,选择,选择Hyp,单击,单击tan按钮,即得按钮,即得 0.4678。 2 22 2 / r ll l l ll SS SS R YYXX YX YY XXYX 总总 回回 lcoefficient of determination。 l反映回归贡献的相对程度。反映回归贡献的相对程度。 l在在Y的总变异中回归关系所能

33、解释的百分比。的总变异中回归关系所能解释的百分比。 lSS总 总不变时,回归平方和的大小决定了 不变时,回归平方和的大小决定了|r|的大小。的大小。 lR2=0.7775,年龄可解释年龄可解释77.75%尿肌酐含量变异性,尿肌酐含量变异性, 但有但有22.25%的变异不能解释。的变异不能解释。 l注意:注意:R与与r的区别。的区别。 a. 预测:预测:(常数常数),年龄。,年龄。 l复相关系数复相关系数R=0.881 l决定系数决定系数R2=0.777 l调整决定系数调整决定系数=0.740 l剩余标准误剩余标准误sy.x=0.19696。 Model Summary .881 a .777.

34、740.19696 Model 1 RR Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), 年龄a. 1970. 0 2 2328. 0 2 ) ( 2 2 n n YY n SS s e XY l扩大扩大X的的 取值范围取值范围 可减少,可减少, 使使b b的估的估 计更稳定。计更稳定。 0304. 0 )( 2 XX S S XY b 579 . 4 b S b t Coefficientsa 1.664(a).2975.602.001 .139(b).030(Sb)4.571.004 (

35、Constant) 年龄年龄 Model 1 BStd. Error Unstandardized Coefficients tSig. Dependent Variable: 尿肌酐尿肌酐a. 根据分析目的选择变量及统计方法根据分析目的选择变量及统计方法 回归与相关说明的问题回归与相关说明的问题不同不同,但又有,但又有联联 系系 进行相关回归分析前应绘制散点图进行相关回归分析前应绘制散点图 用残差图考察数据是否符合模型假设用残差图考察数据是否符合模型假设 条件条件 结果的解释及正确应用结果的解释及正确应用 l直线回归:两变量间的依存关系;直线回归:两变量间的依存关系; lX和和Y N( ,s

36、 s) 。 lX:选定变量:选定变量(自变量自变量) 、Y N( ,s s) 。(建议选择建议选择) l根据专业要求选择因变量。根据专业要求选择因变量。 l直线相关:两变量间的互依关系。直线相关:两变量间的互依关系。 lX和和Y N( ,s s) :无主次之分。:无主次之分。 l均不服从正态分布时均不服从正态分布时, 宜用等级相关。宜用等级相关。 l因果关系因果关系相关相关关系;反之不成立。关系;反之不成立。 lX为选定变量为选定变量(建议选择建议选择) lX:年龄,以年龄,以1岁作间距;岁作间距; Y:身高,在:身高,在X处处Y服从正态分布。服从正态分布。 lX: 服药后时间,服药后时间,1

37、小时、小时、2小时、小时、; Y:血中药物的浓度,各:血中药物的浓度,各X值处的值处的Y服从正态分布。服从正态分布。 lX为随机变量为随机变量 l它随着实验结果的不同而变化,当实验结果确定后,它随着实验结果的不同而变化,当实验结果确定后, 它的值也就相应被确定。它的值也就相应被确定。 l某人群的体重某人群的体重X与肺活量与肺活量Y,服从双变量正态分布。服从双变量正态分布。 l对对r和和b的假设检验等价:的假设检验等价: ltr=tb; l两者符号相同;两者符号相同; l两者的绝对值大小无直接关系。两者的绝对值大小无直接关系。 l|r|越大,表示越大,表示X与与Y相关越紧密,各散点越靠近回相关越

38、紧密,各散点越靠近回 归直线。归直线。 l|b|越大,表示越大,表示Y随随X变化越快,回归直线越陡。变化越快,回归直线越陡。 lR2说明说明X与与Y直线比例。直线比例。 l条件:条件: l应变量与自变量关系为线性关系。应变量与自变量关系为线性关系。 l误差服从均数为误差服从均数为0的正态分布且方差相等。的正态分布且方差相等。 l各观测独立。各观测独立。 l残差图可作为检查方法:简单有效。残差图可作为检查方法:简单有效。 l纵轴:残差;横轴:纵轴:残差;横轴:Y。 l图图9-7a:数据较为理想;:数据较为理想; l图图9-7b:有一个点的残差较大;:有一个点的残差较大; l图图9-7c:曲线关系;:曲线关系; l图图9-7d:方差不齐;:方差不齐; l图图9-7e:与时间有关。:与时间有关。 niNYY iii ,.,1 )0() ( 2 s s , l无特殊的分布趋势,理想的残差分布;无特殊的分布趋势,理想的残差分布; l所建立的回归方程对资料的信息概括不全面,所建立的回归方程对资料的信息概括不全面, 需增加非线性回归项;需增加非线性回归项; l呈扇形,反映方差有随估计值的增大而增大呈扇形,反映方差有随估计值的增大而增大 的趋势。的趋势。 l检查是否有异常数据检查是否有异常数据特异点,特异点,ou

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论