Excel回归分析结果的详细阐释_第1页
Excel回归分析结果的详细阐释_第2页
Excel回归分析结果的详细阐释_第3页
Excel回归分析结果的详细阐释_第4页
Excel回归分析结果的详细阐释_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Excel回归分析结果得详细阐释利用Excel得数据分析进行回归,可以得到一系列得统计参量。下而以连续10年积雪深度与灌溉而积序列(图1)为例给予详细得说明。ABC1年份-1971最大积雪谏度滋米)灌、.、塁溉面积y(千28.62田)1523197210.419.34197321.240.55197418.635.66197526.448.9719恥23.4458197713.529.291978—16734.11019792446711198019・L37.4图1连续2年得最大积雪深度与灌溉面积(1971-1980)=J回归结果摘要(SummaryOutput)如下(图2):ABrCDEFGHISUHARYOUTPUT回归统计Multiple0.989416RSquare0.978944Adjusted0.976312-标准误差1.418924观测值10方差分析dfSSHSF;nificanceF回归分析1748.8542748.8542371.94535・42E-残差816.106762.013345总计9764.961Coefficient标准误差tStatP-valueLower95%UpDer95$F卩限95.0!上卩限95.Intercept2.356438最1.8278761.289167~~0.233363-1・6.57153-1-6.57153大积雪H.8129210.09400219.285885・42E-858652.029691858652.029691081.5961511.596151RESIDUALOUTPUTPROBABILITYOUTPUT观测值霍溉面积残差标准残差耳分比排槪面积?(千亩)29.91284-1.31284-0.9813621.21082-1.91082-1.4283640.79036-0.29036-0.21705436.07677-0.47677-0.35639550.21755-1.31755-0.984891519.31528.62529.23534.14535.6图2利用数据分析工具得到得回归结果第一部分:回归统让表这一部分给岀了相关系数、测立系数、校正测左系数、标准误差与样本数目如下(表1):表1回归统计表回归统计Multiple0.989416RSquare0.978944Adjusted0.976312标淮误差1.418924观测値10逐行说明如下:Multiple对应得数据就是相关系数(correlationcoefficient),RPR=0>989416。RSquare对应得数值为测定系数(determinationcoefficient),或称拟合优度(goodnessoffit),它就是相关系数得平方,即有R2=0、989416=0、978944cAdjusted对应得就是校正测左系数(adjusteddeterminationcoefficient),!T算公式为5-1)(1一疋)一〃?式中〃为样本数皿为变量数,以为测左系数。对于本例,心10皿=1底=0、978944.代入上式得R=1_(10-1)(1-0-978944)=0976312“10-1-1标准误差(standarderror)对应得即所谓标准误差,计算公式为$=JSSe\n—川一1这里SSe为剩余平方与,可以从下而得方差分析表中读出,即有SSe=16.10676,代入上式可得冒=*16.10676=1.418924\10-1-1最后一行得观测值对应得就是样本数目,即有n=10o第二部分,方差分析表方差分析部分包括自由度、误差平方与.均方差、F值.P值等(表2)。表2方差分析表(AN0VA)方差分析dfSSHSF;nificancE回归分析1748.8542748.8542371.94535―42E-08残差216.106762.013345总计9764.961逐列.分行说明如下:第一列df对应得就是自由度(degreeoffreedom),第一行就是回归自由度dfr,等于变捲数目,即dfr=/M:第二行为残差自由度dfc,等于样本数目减去变量数目再减1,即有dfg”讪-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例1,n=10,因此,dfr=1,dfe=n-w-1=8,dft=/i-1=9□第二列SS对应得就是误差平方与,或称变差。第一行为回归平方与或称回归变差SSr,即有SSr=f(氏-开尸=748.8542它表征得就是因变量得预测值对貝平均值得总偏差。第二行为剩余平方与(也称残差平方与)或称剩余变差SSc,即有SSe=f()U=i6」0676/-I它表征得就是因变量对其预测值得总偏差,这个数值越大•意味着拟合得效果越杲。上述得V得标准误差即由SSe给出。第三行为总平方与或称总变差SSt,即有SSr=A(y1.-x)2=764.961它表示得就是因变量对英平均值得总偏差。容易验证748、8542+16、10676=764.961,即有SSr+SSe=SSt而测泄系数就就是回归平方与在总平方与中所占得比重,即有<SSr748.8542八■

R・=——==0.978944SSt764.961显然这个数值越大,拟合得效果也就越好。第四列MS对应得就是均方差,它就是误差平方与除以相应得自由度得到得商。第一行为回归均方差MSr,即有MSr=SSr=748,8542=?488542dfr1第二行为剩余均方差MSc,即有MSe=SSe="10676=2()13345dfe8显然这个数值越小,拟合得效果也就越好。第四列对应得就是F值,用于线性关系得判泄。对于一元线性回归,F值得计算公式为F_R'_dfe/—1—(I-/?2)「用II-772-1式中R2=0、978944.dfc=10・1」二&因此8*0.978944=371.94531-0.978944第五列SignificanceF对应得就是在显箸性水平下得F临界值,其实等于P值,即弃真概率。所谓“弃真概率”即模型为假得概率,显然1屮便就是模型为真得槪率。可见f值越小越好。对F本例屮=0、0000000542V0.0001•故宜信度达到99、99%以上。第三部分,回归参数表回归参数表包括回归模型得截距、斜率及其有关得检验参数(表3)o表3回归参数表Coefficients标准误差tStatIntercept最犬积雪探度讥米)2.35643磁91.8278761.8129210650.0940021.28916719.28588P-valueLower95%Upper95%下限95.0%土限95.0%0.233363-1.858656.5715301-1.8586546.57153015.42E-081.5961512.02969131.59615082.0296913第一列Coefficients对应得模型得回归系数,包括截距356437929与斜率b=\、812921065,由此可以建立回归模型

氏=2.3564+1.8129兀y=2.3564+1.8129x(+斫z第二列为回归系数得标准误差(用打或勺表示),误差值越小,表明参数得精确度越髙。这个参数较少使用,只就是在一些特别得场合出现。例如L、Benguigui等人在Whenandwhereisacityfracta一文中将斜率对应得标准误差值作为分形演化得标准,建议采用0、04作为分维判定得统计指标(参见EPB2000)。不常使用标准误差得原因在于:其统汁信息已经包含在后述得(检验中。第三列tStat对应得就是统计量t值,用于对模型参数得检验,需要查表才能决宦。t值就是回归系数与瓦标准误差得比值,即有根据表3中得数据容易算出:2356438812921=19.285881.8278760.094002对于一元线性回归J值可用相关系数或测左系数汁算,公式如下R

t==I炉

\n-7/7-1将R=0、989416、“10、〃=1代入上式得到0.989416…t二——=19.28588{1—0.9894162—V1W1对于一元线性回归.F值与t值都与相关系数R等价,因此,相关系数检验就已包含了这部分信息。但就是,对于多元线性回归,t检验就不可缺省了。第四列Pvalue对应得就是参数得P值(双侧)。当PvO、05时,可以认为模型在a=0、05得水平上显著,或者置信度达到95%;当PV0、01时,可以认为模型在*0、01得水平上显著,或者豊信度达到99%;当PV0、001时,可以认为模型在a=0、001得水平上显著,或者置信度达到99、9%0对于本例,P=0、0000000542<0.0001,故可认为在*0、0001得水平上显著,或者宜信度达到99、99%0P值检验与t值检验就是等价得,但P值不用查表,显然要方便得多。最后几列给出得回归系数以95%为置信区间得上限与下限。可以瞧出,在a=0、05得显著水平上,截距得变化上限与下限为85865与6.57153,即有-1.85865<«<6.57153斜率得变化极限则为1、59615与2、02969,即有1.59615</?<2.02969第四部分,残差输岀结果这一部分为选择输出内容,如果在"回归”分析选项框中没有选中有关内容,则输岀结果不会给出这部分结果。残差输出中包括观测值序号(第一列,用i表示),因变疑得预测值(第二列,用九表示),残差(residuals,第三列,用e「•表示)以及标准残差(表4)。表4残差输岀结果观测值预测灌溉面积丫(千残差标准残差1亩29.91283811-1.31284-0.98136221.210817-1.91082-1.42836340.7903645-0.29036-0436.07676973-0.47677210.055639550.21755404-1.31755-0.98489&44.778790840.2212090.165356726.830872312.3691281.770947832.632219711.467781.097181945.866543480.8334570.6230171036.983230270.416770.31154预测值就是用回归模型氏=2.3564+1.8129无汁算得结果,式中筠即原始数据得中得自变量。从图1可见儿=15、2,代入上式,得

y,=2.3564+1.8129x,=2.3564+1.8129*15.2=29.91284其余依此类推。残差勺得计算公式为©=儿-从图1可见,yi=28.6,代入上式,得到el=y,-y{=28.6-29.91284=-1.31284其余依此类推。标准残差即残差得数据标准化结果,借助均值命令average与标准差命令stdev容易验证,残差得算术平均值为0,标准差为1、337力4。利用求平均值命令standardize(残差得/元格范隠均值.标准差)立即算出表4中得结果。当然,也可以利用数据标准化公式*Z:-zZi-I石二一='Jvar(zj6逐一计算。将残差平方再求与,便得到残差平方与即剩余平方与,即有==茹_以)2=16.10676Z-lr-1利用Excel得求平方与命令sumsq容易验证上述结果。以最大积雪深度兀为自变量,以残差竹为因变量,作散点图,可得残差图(图3)。残差点列得分布越就是没有趋势(没有规则,即越就是随机),回归得结果就越就是可靠。用最大积雪深度兀为自变量,用灌溉面积幵及英预测值曰为因变屋,作散点图,可得线性拟合图(图4)。最大积雪深度x(米)ResidualPlot图3残差图最大积雪深度x(米)LineFitPlot•灌溉面积y(千亩)■预测灌溉面积y(千亩)102030最大积雪深度x(米)图4线性拟合图第五部分,概率输出结果在选项输岀中,还有一个概率输出(ProbabilityOutput)八(表5)。第一列就是按等差数列设讣得百分比排位,第二列则就是原始数据因变量得自下而上排序(即从小到大)一一选中图1中得第三列(C列)数据,用鼠标点击自下而上排序按钮令■立即得到表5中得第二列数值。当然,也可以沿着主菜单得“数据(D)-z^排序(勺”路径,打开数据排序选项框,进行数据排序。用表5中得数拯作散点图,可以得到Excel所谓得正态概率图(图5)0表5概率输出表百分比排位灌溉面积y(千亩)519.31528.62529.23534:^4535.6556540.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论