




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、简单回归分析 回归分析回归分析(regression variable):): 研究一个变量如何随另一个变量变化的常用研究一个变量如何随另一个变量变化的常用方法。方法。 线性回归线性回归(linear regression):又称简单回归):又称简单回归(simple regression) 两个连续型变量之间线性依存关系的统计方两个连续型变量之间线性依存关系的统计方法。即描述一个因变量(法。即描述一个因变量(dependent variable)Y与一个或多个自变量(与一个或多个自变量( independent variable )X之间的线性依存关系。之间的线性依存关系。回归分析的要求 1
2、、应变量Y服从正态分布 2、自变量X可以是随机变动的,也可以是精确测量或人为取值的变量 线性回归模型的适用条件(line) L-线性 I-独立性 N-正态性 E-方差齐性残差图方差不齐模型还有别的变量需要引入曲线关系方差齐、直线关系 Analyze regression linear(线性回归分析)可进行以下几个过程 1、建立回归方程; 2、回归方程的配合适度检验:包括回归方程和回归系数或偏回归系数的假设检验、残差分析; 3、直线回归的区间估计:包括总体回归系数的区间估计;当x为某定值时,估计值总体均数的可信区间和个体Y值的容许区间 4、直线相关和偏相关分析。Linear regression
3、对话框Method:自变量筛选下拉菜单 Enter:强迫引入法;全部自变量均引入方程 Stepwise:逐步引入 Remove:强迫剔除法 backward:向后剔除法 Forward:向前引入法Statistics对话框独立性检验Plots对话框Options对话框例题11-1操作步骤:1、定义变量,输入数据先检验适用条件 一、线性(散点图): 1、x与y 2、x与非标准化残差的散点图(在多重回归分析中,效率高于散点图矩阵) 步骤: graphsscatter/Dotsimple scatter非标准化残差与自变量的散点图(从上图可见各点基本平均分布在0这条水平线的两边,没有明显偏正或偏负的
4、趋势) 二、正态性、方差齐性检验二、正态性、方差齐性检验 1、正态性即残差服从正态分布、正态性即残差服从正态分布N(0,2 2) 2 2、方差齐性即残差的大小不随所有变量取、方差齐性即残差的大小不随所有变量取值水平的改变而改变(值水平的改变而改变(标准化预测值和标标准化预测值和标准化残差的散点图)准化残差的散点图) 3 3、步骤:、步骤: analyzeregressionlinear plot正态性检验方差齐性检验正态性检验结果:QQ图上各点基本在直线上。从上图可见,不论Y的标化预测值如何变化,标化残差的波动基本保持稳定。 四、独立性:各观测间相互独立,即任两四、独立性:各观测间相互独立,即
5、任两个观测残差的协方差为个观测残差的协方差为0。 步骤:步骤: 通过通过linear regression过程过程statistics按钮按钮中的中的durbin-watson检验进行判断。检验进行判断。 该统计量取值在该统计量取值在04之间。一般若自变量之间。一般若自变量数少于数少于4个,统计量接近个,统计量接近2,基本上可以肯,基本上可以肯定残差间相互独立。定残差间相互独立。2、分析 Analyze -regression - linear Linear regression对话框Statistics对话框散点图1:因变量为Y轴标准化预测值为X轴散点图1:因变量为标准化残差标准化预测值为X
6、轴保存以下新变量描述性统计:均数、标准差、例数相关分析:Pearson相关系数0.964、单侧检验p值为0.001先是自变量纳入模型情况的汇总方差分析:p0.001,说明模型有意义(回归系数有统计学意义)。:XY42.6179.1106 t检验结果等(重要)常数项=1106.788,回归系数=61.423,直线回归方程为 第一行:对截距a的检验,有意义。 第二行:对回归系数b的检验,有意义。回归系数的标准误=4.881,总体回归系数95%可信区间为(50.788,72.058)。标准化回归系数=0.964,回归系数t检验的t值为12.584,p0.001,可认为两变量之间有直线关系,残差统计结
7、果:显示预测值、标准预测值等统计量的最小值、最大值、均数和标准差P-P图散点图: Y轴:因变量,x轴:标准化预测值散点图: Y轴:标准化残差, X轴:标准化预测值显示增加新变量二、非线性回归 例11-6直线方程对数方程二次方程三次方程指数方程多重线性回归分析研究一个研究一个因因变量与多个影响因素之间的变量与多个影响因素之间的关系关系反应变量:连续计量资料,正态随机变量反应变量:连续计量资料,正态随机变量 多重线性回归多重线性回归 例例13-1(第六版)(第六版) 为了研究有关糖尿病患者体内脂联素水平的影为了研究有关糖尿病患者体内脂联素水平的影响因素,某医师测定响因素,某医师测定30名患者的体重
8、指数名患者的体重指数BMI(kg/m2)、病程、病程LEP(ng/ml)、空腹血糖)、空腹血糖FPG(mmol/l)及脂联素水平。及脂联素水平。例13-1:1、定义变量,输入数据 考察线性考察线性 1、散点图矩阵、散点图矩阵graphsscatter/Dotmatrix scatter 2、自变量与残差的散点图、自变量与残差的散点图 graphsscatter/Dotsimple scatter选择enter,(选入全部变量)描述Descriptive Statistics18.82909.14503024.90003.0477306.7574.6403010.07306.3822308.07
9、02.20330脂 联 素 ADI(ng/ml)体 重 指 数 BMI(kg/m2)病 程 DY( 年 )瘦 素 LEP(ng/ml)空 腹 血 糖 FPG(mmol/l)MeanStd. DeviationN两两相关(简单相关)Correlations1.000-.776.011-.811-.049-.7761.000-.176.787-.009.011-.1761.000-.046.066-.811.787-.0461.000-.162-.049-.009.066-.1621.000.000.477.000.399.000.176.000.481.477.176.404.364.000.0
10、00.404.196.399.481.364.196.30303030303030303030303030303030303030303030303030脂联素ADI(ng/ml)体重指数BMI(kg/m2)病程DY(年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)脂联素ADI(ng/ml)体重指数BMI(kg/m2)病程DY(年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)脂联素ADI(ng/ml)体重指数BMI(kg/m2)病程DY(年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)Pearson CorrelationSig. (1-tailed)N脂联素AD
11、I(ng/ml)体重指数BMI(kg/m2)病程DY(年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)模型的基本情况Variables Entered/Removedb空腹血糖FPG(mmol/l), 体重指数BMI(kg/m2), 病程DY(年), 瘦素LEP(ng/ml)a.EnterModel1Variables EnteredVariablesRemovedMethodAll requested variables entered.a. Dependent Variable: 脂联素ADI(ng/ml)b. 四个自变量全部选入的复相关系数、决定系数、调整决定系数、标准误Mod
12、el Summary.855a.731.6885.1057Model1RR SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), 空腹血糖FPG(mmol/l), 体重指数BMI(kg/m2), 病程DY(年), 瘦素LEP(ng/ml)a. 方差分析结果,模型有意义ANOVAb1773.5884443.39717.009.000a651.7142526.0692425.30129RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Pred
13、ictors: (Constant), 空腹血糖FPG(mmol/l), 体重指数BMI(kg/m2), 病程DY(年), 瘦素LEP(ng/ml)a. Dependent Variable: 脂联素ADI(ng/ml)b. 系数(回归系数b、b的标准误、标准回归系数、t值、p值)Coefficientsa58.21711.5695.032.000-1.031.530-.344-1.945.063-.131.211-.067-.621.540-.811.253-.566-3.210.004-.578.447-.139-1.293.208(Constant)体重指数BMI(kg/m2)病程DY(
14、年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: 脂联素ADI(ng/ml)a. Coefficientsa58.21711.5695.032.00034.38982.044-1.031.530-.344-1.945.063-2.122.061-.776-.363-.202.3452.902-.131.211-.067-.621.540-.566.304.011-.123-.064.9361.06
15、9-.811.253-.566-3.210.004-1.331-.291-.811-.540-.333.3462.892-.578.447-.139-1.293.208-1.500.343-.049-.250-.134.9261.080(Constant)体重指数BMI(kg/m2)病程DY(年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95% Confidence Interval fo
16、rBZero-orderPartialPartCorrelationsToleranceVIFCollinearity StatisticsDependent Variable: 脂联素ADI(ng/ml)a. 多重共线性诊断一般,容忍度(Tolerance)小于0.1时,严重共线性方差膨胀因子VIF(Variance inflation factor)一般不应大于5,或大于102、分析Analyze -regression - linear 因变量:脂联素 自变量:其他四个变量全部选入 method:选择逐步stepwiseCorrelations1.000-.776.011-.811-.0
17、49-.7761.000-.176.787-.009.011-.1761.000-.046.066-.811.787-.0461.000-.162-.049-.009.066-.1621.000.000.477.000.399.000.176.000.481.477.176.404.364.000.000.404.196.399.481.364.196.30303030303030303030303030303030303030303030303030脂联素ADI(ng/ml)体重指数BMI(kg/m2)病程DY(年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)脂联素ADI(ng/m
18、l)体重指数BMI(kg/m2)病程DY(年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)脂联素ADI(ng/ml)体重指数BMI(kg/m2)病程DY(年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)Pearson CorrelationSig. (1-tailed)N脂联素ADI(ng/ml)体重指数BMI(kg/m2)病程DY(年)瘦素LEP(ng/ml)空腹血糖FPG(mmol/l)模型基本情况(每一步引入模型的变量,纳入、剔除自变量的水准0.05、0.10)模型概况第一行,引入一个变量第二行,引入两个变量Model Summaryc.811a.657.6455.4
19、509.65753.626128.000.841b.707.6855.1300.0504.612127.0412.275Model12RR SquareAdjustedR SquareStd. Error ofthe EstimateR SquareChangeF Changedf1df2Sig. F ChangeChange StatisticsDurbin-WatsonPredictors: (Constant), 瘦素LEP(ng/ml)a. Predictors: (Constant), 瘦素LEP(ng/ml), 体重指数BMI(kg/m2)b. Dependent Variable
20、: 脂联素ADI(ng/ml)c. 方差分析1,引入一个变量2,引入两个变量ANOVAc1593.35311593.35353.626.000a831.9482829.7122425.301291714.7332857.36632.578.000b710.5692726.3172425.30129RegressionResidualTotalRegressionResidualTotalModel12Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 瘦素LEP(ng/ml)a. Predictors: (Constant), 瘦素LE
21、P(ng/ml), 体重指数BMI(kg/m2)b. Dependent Variable: 脂联素ADI(ng/ml)c. Coefficientsa30.5281.88216.219.000-1.161.159-.811-7.323.000-.811-.811-.81153.50010.8424.934.000-.753.242-.525-3.111.004-.811-.514-.324-1.088.507-.363-2.148.041-.776-.382-.224(Constant)瘦素LEP(ng/ml)(Constant)瘦素LEP(ng/ml)体重指数BMI(kg/m2)Model
22、12BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Zero-order PartialPartCorrelationsDependent Variable: 脂联素ADI(ng/ml)a. Excluded Variablesc-.363a-2.148.041-.382.381-.027a-.237.814-.046.998-.185a-1.707.099-.312.974-.082b-.756.457-.147.947-.147b-1.385.178-.262.937体重指数BMI(kg/m2)病程
23、DY(年)空腹血糖FPG(mmol/l)病程DY(年)空腹血糖FPG(mmol/l)Model12Beta IntSig.PartialCorrelationToleranceCollinearityStatisticsPredictors in the Model: (Constant), 瘦素LEP(ng/ml)a. Predictors in the Model: (Constant), 瘦素LEP(ng/ml), 体重指数BMI(kg/m2)b. Dependent Variable: 脂联素ADI(ng/ml)c. ScatterplotDependent Variable: 脂联素ADI(ng/ml)脂联素ADI(ng/ml)50403020100Regression Standardized Residual3210-1-2 例12-1(第七版)1、定义变量,输入数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年CPSM各阶段备考计划试题及答案
- 物流信息的生命周期试题与答案
- 长租公寓品牌连锁运营行业跨境出海战略研究报告
- 高效豆类分离筛选机企业制定与实施新质生产力战略研究报告
- 高效木材切割机械升级行业跨境出海战略研究报告
- 环保材料装修应用企业制定与实施新质生产力战略研究报告
- 城市交通枢纽行业跨境出海战略研究报告
- 高效咖啡粉包装与混合线行业深度调研及发展战略咨询报告
- 绿色建筑运维管理企业制定与实施新质生产力战略研究报告
- 高亮度广视角IPS显示器行业跨境出海战略研究报告
- 48个国际音标大全(96张)
- 幼儿园绘本阅读《为什么我不能》课件
- 巡察办主任在巡前培训会上的讲话
- 2023年湖北省荆门市事业单位招聘230人(共500题含答案解析)笔试必备资料历年高频考点试题摘选
- EZ-长期待摊费用
- 普车加工技能训练(第3版)高职PPT完整全套教学课件
- 成长类作文万能素材
- 2023年中考英语真题分类汇编-阅读理解(判断正误型)
- 遥感原理与应用课件
- 化工企业特种设备
- 互联网营销及实战运营
评论
0/150
提交评论