R语言 mgcv包 gam()函数中文帮助文档(中英文对照)_第1页
R语言 mgcv包 gam()函数中文帮助文档(中英文对照)_第2页
R语言 mgcv包 gam()函数中文帮助文档(中英文对照)_第3页
R语言 mgcv包 gam()函数中文帮助文档(中英文对照)_第4页
R语言 mgcv包 gam()函数中文帮助文档(中英文对照)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Generalizedadditivemodelswithintegratedsmoothnessestimation广义加性模型与集成的平滑估计描述DescriptionFitsageneralizedadditivemodel(GAM)todata,thetermGAMbeingtakentoineludeanyquadraticallypenalizedGLM.Thedegreeofsmoothnessofmodeltermsisestimatedaspartoffittting,gamcanalsofitanyGLMsubjecttomultiplequadraticpenalties

2、(includingestimationofdegreeofpenalization).Isotropicorscaleinvariantsmoothsofanynumberofvariablesareavailableasmodelterms,asarelinearfunctionalsofsuchsmooths;confidence/credibleintervalsarereadilyavailableforanyquantitypredictedusingafittedmodel;gamisextendable:userscanaddsmooths.适合一个广义相加模型(GAM)的数据

3、,“GAM被视为包括任何二次处罚GLM。模型计算的平滑度估计作为拟合的一部分。gam也可以适用于任何GLM多个二次处罚(包括估计程度的处罚)。各向同性或规模不变平滑的任意数量的变量的模型计算,这样的线性泛函平滑的信心/可信区间都是现成的使用拟合模型预测任何数量,“gam是可扩展的:用户可以添加平滑。Smoothtermsarerepresentedusingpenalizedregressionsplines(orsimilarsmoothers)withsmoothingparametersselectedbyGCV/UBRE/AIC/REMLorbyregressionsplineswit

4、hfixeddegreesoffreedom(mixturesofthetwoarepermitted).Multi-dimensionalsmoothsareavailableusingpenalizedthinplateregressionsplines(isotropic)ortensorproductsplines(whenanisotropicsmoothisinappropriate).Foranoverviewofthesmoothsavailableseesmooth.terms.Formoreonspecifyingmodelsseegam.models,random.eff

5、ectsandlinearfunctional.terms.Formoreonmodelselectionseegam.selection.Doreadgam.checkandchoose.k.平滑术语表示使用惩罚回归花键(或类似的平滑)与由GCV/UBRE的/AIC/REML或由固定的自由度(两个的混合物被允许)的的回归花键与选择的平滑化参数。多维平滑可使用惩罚薄板回归样条曲线(各向同性)或张量积样条线(各向同性的光滑是不恰当的)。的平滑的概述,请参阅smooth.terms。欲了解更多有关指定模型gam.models,random.effects和linear.functional.ter

6、ms。模型选择的更多信息,请参阅gam.selection。不要读为gam.check和choose.k。Seegamfrompackagegam,forGAMsviatheoriginalHastieandTibshiraniapproach(seedetailsfordifferencestothisimplementation).见GAM包gam,GAMS通过原来的Hastie和Tibshirani方法(详情请参阅本实施方案的差异)。Forverylargedatasetsseebam,formixedGAMseegammandrandom.effects.对于非常大的数据集,请参阅ba

7、m,混合GAM看到gamm和random.effects。用法Usagegam(formula,family=gaussian(),data=list(),weights=NULL,subset=NULL,na.action,offset=NULL,method=GCVCp,optimizer=c(outer,newton),control=list(),scale=0,select=FALSE,knots=NULL,sp=NULL,min.sp=NULL,H=NULL,gamma=1,fit=TRUE,paraPen=NULL,G=NULL,in.out,.)参数Arguments参数:fo

8、rmulaAGAMformula(seeformula.gamandalsogam.models).ThisisexactlyliketheformulaforaGLMexceptthatsmoothterms,sandtecanbeaddedtotherighthandsidetospecifythatthelinearpredictordependsonsmoothfunctionsofpredictors(orlinearfunctionalsofthese).一个GAM的公式(见formula.gam和gam.models)。这是完全一样的公式,除非GLM那光滑的条款,s和te可以被添

9、加到指定的线性预测依赖于光滑函数的预测(或线性泛函的右手边这些)。参数:familyThisisafamilyobjectspecifyingthedistributionandlinktouseinfittingetc.Seeglmandfamilyformoredetails.Anegativebinomialfamilyisprovided:seenegbin.quasifamiliesactuallyresultintheuseofextendedquasi-likelihoodifmethodissettoaRE/MLmethod(McCullaghandNelder1989,9.6

10、).这是一个家庭对象指定的分配和使用链接配件等glm和family更多的细节。负二项分布家庭提供:看到negbin。quasi家庭实际上导致在使用扩展的拟似然method设置为一个RE/ML方法(McCullagh和Nelder,1989年,9.6)。参数:dataAdataframeorlistcontainingthemodelresponsevariableandcovariatesrequiredbytheformula.Bydefaultthevariablesaretakenfromenvironment(formula):typicallytheenvironmentfromwh

11、ichgamiscalled.式所需的一个数据框或列表包含模型响应变量,协变量。默认情况下,变量从environment(formula):gam被称为典型的环境。参数:weightspriorweightsonthedata.现有的数据上的权重。参数:subsetanoptionalvectorspecifyingasubsetofobservationstobeusedinthefittingprocess.一个可选的矢量指定的装配过程中可以使用的观测值的一个子集。参数:na.actionafunctionwhichindicateswhatshouldhappenwhenthedatac

12、ontainNAs.Thedefaultissetbythena.actionsettingofoptions,andisna.failifthatisunset.The“factory-fresh”defaultisna.omit.一个函数,它表示时会发生什么数据包含“NA。默认设置是“na.action设置选项,na.fail如果是没有设置的。工厂新鲜的默认“na.omit。参数:offsetCanbeusedtosupplyamodeloffsetforuseinfitting.Notethatthisoffsetwillalwaysbecompletelyignoredwhenpred

13、icting,unlikeanoffsetincludedinformula:thisconformstothebehaviouroflmandglm.可以用来提供一个模型偏移量用于接头。请注意,此偏移量总是被完全忽略当预测,不像一个偏移量包含在formula:这符合的lm和glm的行为。参数:controlAlistoffitcontrolparameterstoreplacedefaultsreturnedbygam.control.Valuesnotsetassumedefaultvalues.一个合适的控制参数,以取代默认值返回gam.control。未设置假设值默认值。参数:meth

14、odThesmoothingparameterestimationmethod.GCWCptouseGCVforunknownscaleparameterandMallowsCp/UBRE/AICforknownscale.GACVCpisequivalent,butusingGACVinplaceofGCVREMLforREMLestimation,includingofunknownscale,P-REMLforREMLestimation,butusingaPearsonestimateofthescale.MLandP-MLaresimilar,butusingmaximumlikel

15、ihoodinplaceofREML.平滑参数估计方法。GCV.Cp使用GCV对未知的尺度参数和锦葵“的CP/UBRE/AIC已知的规模。GACV.Cp是等价的,但使用的GCVGACV的地方。REMLREML估计,包括不明刻度,P-REMLREML估计,但使用的Pearson估计规模。ML和P-ML是相似的,但用最大似然的地方REML。参数:optimizerAnarrayspecifyingthenumericaloptimizationmethodtousetooptimizethesmoothingparameterestimationcriterion(givenbymethod).p

16、erfforperformaneeiteration.outerforthemorestabledirectapproach.outercanuseseveralalternativeoptimizers,specifiedinthesecondelementofoptimizer:newton(default),bfgs,optim,nlmandnIm.fd(thelatterisbasedentirelyonfinitediffereneedderivativesandisveryslow).一个数组,指定的数值优化方法,使用优化的平滑参数估计准则(method)。perf性能迭代。out

17、er更稳定的直接方法。outer可以使用optimizer:newton(默认),bfgs,optim,nlm和第二个元素中指定的几种可供选择的优化,nlm.fd(后者则是完全基于上有限差分衍生工具,很慢)。参数:scaleIfthisispositivethenitistakenastheknownscaleparameterNegativesignalsthatthescaleparameterisunknown.0signalsthatthescaleparameteris1forPoissonandbinomialandunknownotherwise.Notethat(RE)MLme

18、thodscanonlyworkwithscaleparameter1forthePoissonandbinomialcases.如果这是正的,那么它被当作已知尺度参数。负信号,规模参数是未知的。0信号泊松分布和二项分布和未知的,否则,尺度参数为1。需要注意的是(RE)的ML方法只能工作与尺度参数的泊松分布和二项式情况下。参数:selectIfthisisTRUEthengamcanaddanextrapenaltytoeachtermsothatitcanbepenalizedtozero.Thismeansthatthesmoothingparameterestimationthatisp

19、artoffittingcancompletelyremovetermsfromthemodel.Ifthecorrespondingsmoothingparameterisestimatedaszerothentheextrapenaltyhasnoeffect.如果这是TRUE然后gam可以添加一个额外的处罚,以每学期,以便它可以被扣分零。这意味着平滑参数估计是拟合的一部分的,可以完全除去从模型中的条款。如果相应的平滑参数估计值为零,那么额外的罚款没有任何效果。参数:knotsthisisanoptionallistcontaininguserspecifiedknotvaluestobe

20、usedforbasisconstruction.Formostbasestheusersimplysuppliestheknotstobeused,whichmustmatchupwiththekvaluesupplied(notethatthenumberofknotsisnotalwaysjustk).Seetprsforwhathappensinthetp/tscase.Differenttermscanusedifferentnumbersofknots,uniesstheyshareacovariate.这是一个可选的列表,其中包含用户指定的节点值用于基础建设。对于最基础的用户只需

21、提供要使用的节,它必须匹配的k值(附注的节点数不是永远只是k)。见tprstp/ts情况下会发生什么。不同的术语可以使用不同的节数,除非他们共享一个协。参数:spAvectorofsmoothingparameterscanbeprovidedhere.Smoothingparametersmustbesuppliedintheorderthatthesmoothtermsappearinthemodelformula.Negativeelementsindicatethattheparametershouldbeestimated,andhenceamixtureoffixedandesti

22、matedparametersispossible.Ifsmoothssharesmoothingparametersthenlength(sp)mustcorrespondtothenumberofunderlyingsmoothingparameters.平滑化参数的一种向量,可以提供在这里。必须提供平滑参数的顺序,顺利的词出现在模型公式。负性元件表明应当估计的参数,因此,固定和估计参数的混合物是可能的。如果平滑份额平滑参数,那么length(sp)必须符合相关的平滑参数的数量。参数:min.spLowerboundscanbesuppliedforthesmoothingparamete

23、rs.Notethatifthisoptionisusedthenthesmoothingparametersfull.sp,inthereturnedobject,willneedtobeaddedtowhatissuppliedheretogetthesmoothingparametersactuallymultiplyingthepenalties.length(min.sp)shouldalwaysbethesameasthetotalnumberofpenalties(soitmaybeIongerthansp,ifsmoothssharesmoothingparameters).下

24、界能够供给的平滑化参数。请注意,如果使用此选项,然后平滑参数full.sp,返回的对象中,将需要添加什么是这里提供的平滑参数乘以处罚。length(min.sp)应始终是相同的刑罚(所以它可能是长于sp,如果平滑份额平滑参数)的总人数。参数:HAusersuppliedfixedquadraticpenaltyontheparametersoftheGAMcanbesupplied,withthisasitscoefficientmatrix.AcommonuseofthistermistoaddaridgepenaltytotheparametersoftheGAMincircumstanc

25、esinwhichthemodelisclosetounidentifiableonthescaleofthelinearpredictorbutperfectlywelldefinedontheresponsescale.用户提供的固定二次罚的GAM的参数可以提供,这是系数矩阵。使用这一术语是一个常见的添加脊处罚,GAM的情况下,该模型是未识别的线性预测的规模,但完全定义的响应规模的参数。参数:gammaItissometimesusefultoinflatethemodeldegreesoffreedomintheGCVorUBRE/AICscorebyaconstantmultiplie

26、r.Thisallowssuchamultipliertobesupplied.有时它是有用的GCV或UBRE的/AIC得分由一个常乘数充气模型的自由度。这允许将要提供这样一个乘法器。参数:fitIfthisargumentisTRUEthengamsetsupthemodelandfitsit,butifitisFALSEthenthemodelissetupandanobjectGcontainingwhatwouldberequiredtofitisreturnedisreturned.SeeargumentG.如果这种说法是TRUE然后gam设置模式和适合它,但如果它是FALSE然后对

27、模型进行设置和对象G包含将需要,以适应返回返回。请参阅参数Go参数:paraPenoptionallistspecifyinganypenaltiestobeappliedtoparametricmodelterms.gam.modelsexplainsmore.可选的列表,指定参数模型计算被应用到任何处罚。gam.models解释更多。参数:GUsuallyNULL,butmaycontaintheobjectreturnedbyapreviouscalltogamwithfit=FALSE,inwhichcaseallotherargumentsareignoredexceptforgam

28、ma,in.out,scale,control,methodoptimizerandfit.通常是NULL,但可能包含对象返回以前调用gam的fit=FALSE,在这种情况下,所有其它参数将被忽略,除了gamma,in.out,scale,control,methodoptimizer和fit。参数:in.outoptionallistforinitializingouteriteration.Ifsuppliedthenthismustcontaintwoelements:spshouldbeanarrayofinitializationvaluesforallsmoothingparame

29、ters(theremustbeavalueforallsmoothingparameters,whetherfixedortobeestimated,butthoseforfixeds.p.sarenotused);scaleisthetypicalscaleoftheGCV/UBREfunction,forpassingtotheouteroptimizerorthetheinitialvalueofthescaleparameterifthisistobeestimatedbyRE/ML.初始化外部循环的可选列表。如果提供,则必须包含两个要素:sp应该是一个数组初始化所有的平滑参数值(是

30、固定的还是要估计,必须有所有的平滑参数的值,而固定SPS不使用的话);scale是GCV/UBRE功能的的典型尺度,用于传递到外的优化器,或尺度参数的初始值,如果这是要估计的RE/ML。参数:furtherargumentsforpassingone.g.togam.fit(suchasmustart).在例如通过进一步的论据gam.fit(如mustart)。DetailsDetailsAgeneralizedadditivemodel(GAM)isageneralizedlinearmodel(GLM)inwhichthelinearpredictorisgivenbyauserspeci

31、fiedsumofsmoothfunctionsofthecovariatesplusaconventionalparametriccomponentofthelinearpredictorAsimpleexampleis:一个广义相加模型(GAM)是一个广义线性模型(GLM)的线性预测是由用户指定的协变量的函数平滑,再加上传统的参数化组件的线性预测的总和。一个简单的例子是:wherethe(independent)responsevariablesy_iPoi,andf_1andf_2aresmoothfunctionsofcovariatesx_1andx_2.Thelogisanexam

32、pleofalinkfunction.(独立的)响应变量y_iPoi和f_1和f_2是光滑函数的协变量x_1和x_2。的log的一个例子是一个链接函数。Ifabsolutelyanysmoothfunctionswereallowedinmodelfittingthenmaximumlikelihoodestimationofsuchmodelswouldinvariablyresultincomplexoverfittingestimatesoff_1andf_2.Forthisreasonthemodelsareusuallyfitbypenalizedlikelihoodmaximiza

33、tion,inwhichthemodel(negativelog)likelihoodismodifiedbytheadditionofapenaltyforeachsmoothfunction,penalizingitswiggliness.Tocontrolthetradeoffbetweenpenalizingwigglinessandpenalizingbadnessoffiteachpenaltyismultipliedbyanassociatedsmoothingparameter:howtoestimatetheseparameters,andhowtopracticallyre

34、presentthesmoothfunctionsarethemainstatisticalquestionsintroducedbymovingfromGLMstoGAMs.如果确实被允许在任何光滑的函数模型拟合,最大似然估计这些模型往往会导致复杂的过拟合估计f_1和f_2。出于这个原因的模型通常是适合由惩罚的可能性最大化,其中模型(负对数)的可能性被修改通过加入每个平滑函数罚款,惩罚wiggliness。要控制,之间的的惩罚wiggliness和惩罚不良适合每个罚球乘以相关的平滑参数:如何估计这些参数的权衡,以及如何在实践中代表顺利的功能是主要的统计问题,介绍了从GLMSGAMS。Them

35、gcvimplementationofgamrepresentsthesmoothfunctionsusingpenalizedregressionsplines,andbydefaultusesbasisfunctionsforthesesplinesthataredesignedtobeoptimal,giventhenumberbasisfunctionsused.Thesmoothtermscanbefunctionsofanynumberofcovariatesandtheuserhassomecontroloverhowsmoothnessofthefunctionsismeasu

36、red.mgcvgam实施顺利使用惩罚的回归样条曲线的功能,在默认情况下使用这些曲线的设计是最佳的,因为数基函数的基础功能。光滑的术语可以是任意数量的协变量的函数,并且用户具有一定的控制的函数的平滑度如何测量。gaminmgcvsolvesthesmoothingparameterestimationproblembyusingtheGeneralizedCrossValidation(GCV)criteriongam在mgcv解决了平滑参数估计问题通过使用广义交叉验证(GCV)标准,oranUn-BiasedRiskEstimator(UBRE)criterion或无偏风险估计(UBRE)标

37、准whereDisthedevianee,nthenumberofdata,sthescaleparameterandDoFtheeffectivedegreesoffreedomofthemodel.NoticethatUBREiseffectivelyjustAICrescaled,butisonlyusedwhensisknown.其中D是越轨行为,n数据的数量,s的尺度参数和DoF有效度模型的自由。请注意,UBRE实际上只是AIC重新调整,但只用在s被称为。AlternativesareGACVoraLaplaceapproximationtoREML.Thereissomeevide

38、ncethatthelattermayactuallybethemosteffectivechoice.替代品GACV,或Laplace逼近REML。有一些证据表明,后者实际上可能是最有效的选择。SmoothingparametersarechosentominimizetheGCVUBRE/AIC,GACVorREMLscoresforthemodel,andthemaincomputationalchallengesolvedbythemgcvpackageistodothisefficientlyandreliably.Variousalternativenumericalmethods

39、areprovidedwhichcanbesetbyargumentoptimizer平滑化参数的选择,以尽量减少GCV,UBRE/AIC,GACV或模型REML分数,和求解的主要计算挑战mgcv包是有效和可靠地做到这一点。各种替代数值方法提供了可以设置的参数optimizer。Broadlygamworksbyfirstconstructingbasisfunctionsandoneormorequadraticpenaltycoefficientmatricesforeachsmoothterminthemodelformula,obtainingamodelmatrixforthestr

40、ictlyparametricpartofthemodelformula,andcombiningthesetoobtainacompletemodelmatrix(/designmatrix)andasetofpenaltymatricesforthesmoothterms.Somelinearidentifiabilityconstraintsarealsoobtainedatthispoint.Themodelisfitusinggam.fit,amodificationofglm.fit.TheGAMpenalizedlikelihoodmaximizationproblemissol

41、vedbyPenalizedIterativelyReweightedLeastSquares(P-IRLS)(seee.g.Wood2000).Smoothingparameterselectionisintegratedinoneoftwoways.(i)PerformanceiterationusesthefactthatateachP-IRLSiterationapenalizedweightedleastsquaresproblemissolved,andthesmoothingparametersofthatproblemcanestimatedbyGCVorUBRE.Eventu

42、ally,inmostcases,bothmodelparameterestimatesandsmoothingparameterestimatesconverge.(ii)AlternativelytheP-IRLSschemeisiteratedtoconvergenceforeachtrialsetofsmoothingparameters,andGCV,UBREorREMLscoresareonlyevaluatedonconvergence-optimizationisthenoutertotheP-IRLSloop:inthiscasetheP-IRLSiterationhasto

43、bedifferentiated,tofacilitateoptimization,andgam.fit3isusedinplaceofgam.fit.Thedefaultisthesecondmethod,outeriteration.广义gam的工作原理是第一构造的基础功能和一个或多个二次罚系数矩阵中的模型公式为每个平滑内,获得模型矩阵模型公式为严格的参数的一部分,并结合这些以获得一个完整的模型/设计矩阵(矩阵)和刑罚矩阵顺利条款的一组。一些线性辨识性约束在这一点上也能获得。该模型是适合使用gam.fit,glm.fit修改。的的GAM处罚的可能性最大化问题得到解决,由受罚迭代加权最小二乘

44、法(P-IRLS)(如木材2000)。平滑参数的选择是集成在以下两种方式之一。(I)的性能迭代“,在每个P-IRLS迭代一个惩罚加权最小二乘问题的解决,这个问题可以平滑参数估计GCV或UBRE所使用的事实。最终,在大多数情况下,两个模型参数的估计和平滑参数估计值的收敛。(2)或者的P-IRLS计划的迭代收敛,为每个审判平滑参数,GCV,UBRE或REML分数的评价收敛-“外部是的P-IRLS循环的优化:在本情况下,P-IRLS迭代以加以区分,以方便优化,和gam.fit3被用于代替gam.fito默认的是第二种方法,外部循环。Severalalternativebasis-penaltytyp

45、esarebuiltinforrepresentingmodelsmooths,butalternativescaneasilybeadded(seesmooth.termsforanoverviewandsmooth.constructforhowtoaddsmoothclasses).Inpracticethedefaultbasisisusuallythebestchoice,butthechoiceofthebasisdimension(kinthesandteterms)issomethingthatshouldbeconsideredcarefully(theexactvaluei

46、snotcritical,butitisimportantnottomakeitrestrictivelysmall,norverylargeandcomputationallycostly).Thebasisshouldbechosentobelargerthanisbelievedtobenecessarytoapproximatethesmoothfunctionconcerned.Theeffectivedegreesoffreedomforthesmoothwillthenbecontrolledbythesmoothingpenaltyontheterm,and(usually)s

47、electedautomatically(withanupperlimitsetbyk-1oroccasionallyk).Ofcoursethekshouldnotbemadetoolarge,orcomputationwillbeslow(orinextremecasestherewillbemorecoefficientstoestimatethantherearedata).几种可供选择的依据,处罚类型建立模型平滑,但替代品可以很容易地添加(见smooth.terms的概述和smooth.construct如何添加平滑的类)。在实践中,默认的基础通常是最好的选择,但选择的基础尺寸(ks

48、和te条款)的东西,应该仔细考虑(确切值不是关键的,但重要的是不要使它限定小,也不是非常大的和计算昂贵)。应选择的基础上,要大于被认为是必要的近似的平滑函数有关。将被控制的有效程度的自由的顺利平滑的术语刑罚,和(通常情况下)自动选择(上限设定k-1或偶尔k)。当然,k不应该过大,或计算将是缓慢的(或在极端的情况下,将会有更多的系数估计比有数据)。NotethatgamassumesaveryinclusivedefinitionofwhatcountsasaGAM:basicallyanypenalizedGLMcanbeused:tothisendgamallowsthenonsmoothm

49、odelcomponentstobepenalizedviaargumentparaPenandallowsthelinearpredictortodependongenerallinearfunctionalsofsmooths,viathesummationconventionmechanismdescribedinlinearfunctional.terms.请注意,gam承担的最重要的一个GAM一个很大的包容性的定义:基本上,可用于任何处罚GLM:为此gam允许非光滑模型组件被处罚通过参数paraPen和允许的线性预测依赖上一般线性泛函的平滑,通过的求和约定机制,在linear.fun

50、ctional.terms。DetailsofthedefaultunderlyingfittingmethodsaregiveninWood(2011and2004).SomealternativemethodsarediscussedinWood(2000and2006).相关拟合方法的默认木材(2011年和2004年)。一些替代方法进行了探讨伍德(2000年至2006年)。gam()isnotacloneofTrevorHastiesoroginal(assuppliedinS-PLUSorpackagegam)Themajordifferencesare(i)thatbydefault

51、estimationofthedegreeofsmoothnessofmodeltermsispartofmodelfitting,(ii)aBayesianapproachtovarianceestimationisemployedthatmakesforeasierconfidenceintervalcalculation(withgoodcoverageprobabilities),(iii)thatthemodelcandependonany(bounded)linearfunctionalofsmoothterms,(iv)theparametricpartofthemodelcan

52、bepenalized,(v)simplerandomeffectscanbeincorporated,and(vi)thefacilitiesforincorporatingsmoothsofmorethanonevariablearedifferent:specificallytherearenoIosmooths,butinstead(a)stermscanhavemorethanoneargument,implyinganisotropicsmoothand(b)teort2smoothsareprovidedasaneffectivemeansformodellingsmoothin

53、teractionsofanynumberofvariablesviascaleinvarianttensorproductsmooths.Splinesonthesphere,DuchonsplinesandGaussianMarkovRandomFieldsarealsoavailable.Seegamfrompackagegam,forGAMsviatheoriginalHastieandTibshiraniapproach.gam()是不是克隆的特雷弗黑斯蒂的oroginal(提供S-PLUS或包GAM)的主要区别是:(i)默认情况下,估计模型的平滑程度是模型拟合,(II)的方差估计采

54、用贝叶斯方法,使得更容易置信区间计算(具有良好的覆盖概率),(三)该模型可以依赖于任何(有限)线性泛函的光滑条款,(iv)该参数的一部分,该模型可以受到惩罚,(五)简单随机效应可以注册成立,及(Vi)的设施,结合平滑的一个以上的变量是不同的:具体而言,有没有10平滑,而是(一)s条款可以超过一个参数,这意味着各向同性的平滑和(b)te或t2平滑的有效手段通过规模不变的造型流畅的相互作用任意数量的变量张量积平滑。样条在球体上,杜琼样条曲线和高斯马尔可夫随机场也可提供。见GAM包gam,Hastie和Tibshirani的方法GAMS通过。值ValueIffit=FALSEthefunctionr

55、eturnsalistGofitemsneededtofitaGAM,butdoesntactuallyfitit.如果fit=FALSE该函数返回一个列表G需要的物品,以适应GAM,但实际上并不适合它。OtherwisethefunctionreturnsanobjectofclassgamasdescribedingamObject.否则,该函数返回一个类的对象gam所描述的gamObject。警告WARNINGSThedefaultbasisdimensionsusedforsmoothtermsareessentiallyarbitrary,anditshouldbecheckedth

56、attheyarenottoosmall.Seechoose.kandgam.check.默认的基本尺寸用于平滑条款的本质上是任意的,应该检查他们是不是太小。见choose.k和gam.check。Youmusthavemoreuniquecombinationsofcovariatesthanthemodelhastotalparameters.(Totalparametersissumofbasisdimensionsplussumofnon-splinetermslessthenumberofsplineterms).您必须具有独特的组合比模型的协变量的总体参数。(总参数的基本尺寸加总和

57、非样条条款的数量越少样条计算)的总和。Automaticsmoothingparameterselectionisnotlikelytoworkwellwhenfittingmodelstoveryfewresponsedata.工作时,很少的响应数据的拟合模型的自动平滑参数的选择是不太可能。FordatawithmanyzeroesclusteredtogetherinthecovariatespaceitisquiteeasytosetupGAMswhichsufferfromidentifiabilityproblems,particularlywhenusingPoissonorbin

58、omialfamilies.Theproblemisthatwithe.g.logorlogitlinks,meanvaluezerocorrespondstoaninfiniterangeonthelinearpredictorscale.对于许多零的协变量空间中聚集在一起的数据,这是很容易建立GAMS遭受辨识性问题,特别是使用泊松或二项式家庭的当。的问题是,与例如log或罗吉特链接,平均值的零对应到一个无限的范围内的线性预测规模。(作者)Author(s)SimonN.Woodvahref=mailto:simon.woodv/aFrontenddesigninspiredbytheSfu

59、nctionofthesamenamebasedontheworkofHastieandTibshirani(1990).UnderlyingmethodsowemuchtotheworkofWahba(e.g.1990)andGu(e.g.2002).参考文献Referencesandmarginallikelihoodestimationofsemiparametricgeneralizedlinearmodels.JournaloftheRoyalStatisticalSociety(B)73(1):3-36generalizedadditivemodels.J.AmerStatist.

60、Ass.99:673-686.DefaultmethodforadditivecasebyGCV(butnoIongerforgeneralized)generalizedadditivemixedmodels.Biometrics62(4):1025-1036andHall/CRCPress.inmixedmodels.StatisticalComputing.ModelComponents.ScandinavianJournalofStatistics,39(1),53-74.andHall.withMultipleQuadraticPenalties.J.R.Statist.Soc.B6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论