[转载]logistic回归模型总结_第1页
[转载]logistic回归模型总结_第2页
[转载]logistic回归模型总结_第3页
[转载]logistic回归模型总结_第4页
[转载]logistic回归模型总结_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、转载logisti回归模型总结回归模型是最成熟也是应用最广泛的分类模型,通过学习和实践拟通过从入门、进阶到高级的过程对其进行总结,以便加深自己的理解也为对此有兴趣者提供学习的便利。、有关logisti的基本概念logisti回归主要用来预测离散因变量与一组解释变量之间的关系最常用的是二值型logistic即因变量的取值只包含两个类别例如:好、坏;发生、不发生;常用或表示表示解释变量则()表示在的条件下的概率,logisti回归的数学表达式为:log(1A=L其中称为优势比(ODDS)即发生与不发生的概率之比可以根据上式反求出()=1(1+e)根据样本资料可以通过最大似然估计计算出模型的参数然后

2、根据求出的模型进行预测下面介绍logisti回归在SAS中的实现以及输出结果的解释二、logisti回归模型初步SAS中丨ogistic回归输出结果主要包括预测模型的评价以及模型的参数预测模型的评价与多元线性回归模型的评价类似主要从以下几个层次进行(1)模型的整体拟合优度主要评价预测值与观测值之间的总体一致性。可以通过以下两个指标来进行检验1、Hos指sho统计量的原假设(是预测值和观测值之间无显著差异,因此指标的的值越大,越不能拒绝原假设,即说明模型很好的拟合了数据。在SAS中这个指标可以用AC选项进行调用2、AIC和SC指标即池雷准则和施瓦茨准则与线性回归类似AIC和SC越小说明模型拟合的

3、越好(2从整体上看解释变量对因变量有无解释作用相当于多元回归中的检验在logisti回归中可以通过似然比(lilioo)进行检验t(3解释变量解释在多大程度上解释了因变量与线性回归中的R作用类似在logisti回归中可以通过Rs和C统计量进行度量在SAS中通过RSQ来调用Rs,C统计量自动输出模型评价指标汇总统计量趋势拟合作用SAS调用命令备注AIC、SC越小越好类似与多元回归中的残差平方和模型自动输出似然比卡方越大越好类似与多元回归中的回归平方和自动输出值越小越好RSQUARE越大越好类似与多元回归中的R用RSQ选项调用C统计量越大越好度量观测值和条件预自动输出C统计量越大越好HL统计量越小

4、越好度量观测值和条件预测的相对一致性度量观测值和预测值总体的一致性自动输出用LC选项调用值越大越好说明:在实践中,对以上统计量最为关注的是C统计量,其次是似然比卡方,最后才是HL统计量。和极少关注,这一点和多元线性回归有很大的区别。根本原因就是多元线性回归模型是一个预测模型,目标变量的值具有实际意义;而是一个分类模型,目标变量只是一个分类标识,因此更关注预测值和预测值之间的相对一致性而不是绝对一致性。(注:引自姚志勇的编程与数据挖掘商业案例)(5)以帮助中例子为例对输出结果进行解释说明输出结果如下:红色字体是对输出结果的注释(一)系统Step1ffectFC1ente变量FC进入模型)S系统T

5、heLOISTICProcedureModelInformationDataSetRTST(注:指明模型所用的数据集)ResponseVariableTRDTRD(注:指明模型的因变量)CompleteRemissionNumberofResponse22(注:指明模型因变量取两类值)LevelsModelbinarylogit(注:指明模型是二分类logistic回归模型)OptimizationFishersscoring主:指明釆用的是fishe优Technique化方法)NumberofObservationsRead1NumberofObservationsUsed1Response

6、ProfileOrderedValueremissTotalFrequency1122(注:指明因变量的取值类型及取每一类变量的频数)Probabilitymodeledisremiss(注:这个要关注指明了模型求的是在自变量作用下因变量remiss的概率)(二)StepiseSelectionProcedure注:逐步回归的选择过程,说明了模型是怎么一步步根据一定的原则来选择最终进入模型的变量的)StepInterceptentere注:第一步只包含截距项而无变量时时的结果)ModelConvergenceStatusConvergencecriterionCONV1-satisfied(注

7、:用来判断模型的收敛状态的,也就是说经过迭代模型是否求得了参数satisfied兑明收敛了,unsatisfied明没收敛)-2LogL22ResidualChi-SquareTestChi-SquareDFPrChiSq21111ModelConvergenceStatusConvergencecriterionGCON=E-satisiedModelFitStatistics.亠亠Intercept小.Intercept,厂Criterion小1andOnlyCovariatesAIC20SC2-2LogL22(注:AIC、SC和-2Log都变小了说明加入变量FAC后模型拟合的更好了)R-

8、Square0Max-rescaledR-Square0TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPrChiSqLikelihoodRatio222000Score000Wald000(注:原假设是所有变量的参数为0,根据检验结果可以看出P00拒绝原假设,即变量的参数不全为0)ResidualChi-SquareTestChi-SquareDFPrChiSq22000接下来的跟上面的一样都是些变量的选择过程,进进出出的(三)最终的结果如下Note:NoeectsortheodelinSteparereovedStep2EffectFAC

9、3_1enteredSummaryofStepwiseSelectionStepEffectNumberInScoreChiSquareWaldChiSquarePrChiSqVariableLabelEnteredRemovedDF1FAC4_1115450001FAC4_12FAC3_112900002FAC3_1AnalysisofMaximumLikelihoodEstimatesParameterDFStandardWaldPrChiSqEstimateErrorChi-SquareIntercept1-2404050922900001FAC3_11-1140443592500144

10、FAC411-4230924355310001OddsRatioEstimatesEffect“.,匚,95%WaldPointEstimate小.ConfidenceLimitsFAC3_1030011090FAC41000900020042AssociationofPredictedProbabilitiesandObservedResponsesPercentConcordant951SomersD0902PercentDiscordant49Gamma0903PercentTied00Tau-a0454Pairs0c095-PartitionfortheHosmerandLemeshowTestGrouptrad=1TotalObservedExpectedtrad=0ObservedExpected11000111992100291113GroupPOftitionfortheHoSmelandLeWeshowTeSSt83170trad2i9317tradM0717ObservedExpectedObservedEXpeCted6178110695947171614491251817

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论