统计学应用软件实验报告.doc_第1页
统计学应用软件实验报告.doc_第2页
统计学应用软件实验报告.doc_第3页
统计学应用软件实验报告.doc_第4页
统计学应用软件实验报告.doc_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学应用软件实验报告实验目的:本次实验的目的在于通过练习了解统计软件的功能并熟练掌握统计软件的使用方法,利用软件对枯燥的统计数据进行相应的分析,使得到的统计数据具有较强的可读性和可利用性。第六章 方差分析第一题该实验的步骤如下:1. 点击data6-4.sav数据文件;2. 左键单击Analyze,在下拉列表中单击Compares Means中的One- Way ANOVA;3. 从弹出的菜单中,把左边框中的产量点入右边框的Dependent List,把品种点入Factor;4. 选中One Way ANOVA:Options,单击Homogeneity of variance test,单击One -Way ANOVA:Post Hoc Multiple Comparisons,把其中的Significance level的该为0.05(0.01);5. 单击OK实验结果如下:1.当显著水平为0.05时ANOVA产量Sum of SquaresdfMean SquareFSig.Between Groups2263.4823754.49412.158.001Within Groups744.7151262.060Total3008.19715方差齐性检验的原假设是:方差相等。由上表可知,组间平方和为2263.482,自由度为3,均方为754.494;组内平方和为744.715,自由度为12,均方为62.060;F统计量为12.158.由于Sig.=0.0010.05,故拒绝原假设,说明四种品种的小麦的生产量由显著性差异。2.当显著水平为0.01时ANOVA产量Sum of SquaresdfMean SquareFSig.Between Groups2263.4823754.49412.158.001Within Groups744.7151262.060Total3008.19715由上表可知,组间平方和为2263.482,自由度为3,均方为754.494;组内平方和为744.715,自由度为12,均方为62.060;F统计量为12.158.由于Sig.=0.0010.05,故接受原假设,说明四种轮胎的性能一样好。第三题该实验的步骤如下:1.点击data6-7.sav数据文件;2.左键单击Analyze,在下拉列表中单击General Linear Model,再点击Univariate,并将销量移入Dependent Variable,将包装和摆放位置移入Fixed Factor;3.单击Options.按钮,选中Homogeneity tests,显著水平设为0.05;4.再选中 Post Hoc Multiple Comparisons for Observed Means对话框,再其中选出需要进行比较分析的控制变量,即包装,再选中LSD和Tamhanes T2;5.打开Model对话框,选中Full factorial;6.再单击Plots按钮,将包装和摆放位置分别移入Horizontal Axis和Separate Lines,点击Add;7.选择contrasts对话框,选择Simple,再单击Change按钮;8.单击OK按钮。实验结果显示如下:Between-Subjects FactorsValue LabelN包装1A192A293A39摆放位置1B192B293B39Levenes Test of Equality of Error VariancesaDependent Variable:销量Fdf1df2Sig.754818.646由于相伴概率Sig.=0.6460.05,故认为各个组总体方差是相等的。Tests of Between-Subjects EffectsDependent Variable:销量SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model65.407a88.1767.612.000Intercept822.2591822.259765.552.000casing.9632.481.448.646place3.18521.5931.483.253casing * place61.259415.31514.259.000Error19.333181.074Total907.00027Corrected Total84.74126a. R Squared = .772 (Adjusted R Squared = .670)由上表可知:不同包装的贡献离差平方和为0.963,均方为0.481,不同摆放位置的贡献离差平方和为3.185,均方为1.593,这说明摆放位置比包装的影响大。从相伴概率来看,均大于0.05,说明包装和摆放位置对销量没有影响。Contrast Results (K Matrix)包装 Simple ContrastaDependent Variable销量Level 1 vs. Level 3Contrast Estimate-.111Hypothesized Value0Difference (Estimate - Hypothesized)-.111Std. Error.489Sig.82395% Confidence Interval for DifferenceLower Bound-1.138Upper Bound.915Level 2 vs. Level 3Contrast Estimate.333Hypothesized Value0Difference (Estimate - Hypothesized).333Std. Error.489Sig.50495% Confidence Interval for DifferenceLower Bound-.693Upper Bound1.360a. Reference category = 3由于不同包装之间的均值比较结果,Sig.0.05,所以不同的包装之间没有显著性差异。Multiple ComparisonsDependent Variable:销量(I) 包装(J) 包装Mean Difference (I-J)Std. ErrorSig.95% Confidence IntervalLower BoundUpper BoundLSDA1A2-.44.489.375-1.47.58A3-.11.489.823-1.14.92A2A1.44.489.375-.581.47A3.33.489.504-.691.36A3A1.11.489.823-.921.14A2-.33.489.504-1.36.69TamhaneA1A2-.44.778.924-2.521.63A3-.11.915.999-2.582.36A2A1.44.778.924-1.632.52A3.33.941.980-2.192.86A3A1.11.915.999-2.362.58A2-.33.941.980-2.862.19Based on observed means. The error term is Mean Square(Error) = 1.074.由表可知,相伴概率均大于0.05,即没有显著性差异。且均值A2A3A1.。第四题该实验的步骤如下:1.点击data6-7.sav数据文件;2.左键单击Analyze,在下拉列表中单击General Linear Model,再点击Univariate,并将销量移入Dependent Variable,将包装和摆放位置移入Fixed Factor;3.单击Options.按钮,选中Homogeneity tests,显著水平设为0.05;4.再选中 Post Hoc Multiple Comparisons for Observed Means对话框,再其中选出需要进行比较分析的控制变量,即包装,再选中LSD和Tamhanes T2;5.打开Model对话框,选中Full factorial;6.再单击Plots按钮,将包装和摆放位置分别移入Horizontal Axis和Separate Lines,点击Add;7.选择contrasts对话框,选择Simple,再单击Change按钮实验结果如下:Tests of Between-Subjects EffectsDependent Variable:生长量SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model.410a5.0825.464.008Intercept77.211177.2115147.401.000N.0531.0533.557.084K.3072.15410.240.003N * K.0492.0251.640.235Error.18012.015Total77.80118Corrected Total.59017a. R Squared = .695 (Adjusted R Squared = .568)不同量的氮肥贡献离差平方和为0.053,均方为0.053;不同量的钾肥的贡献离差平方和为0.307,均方为0.154,所以钾肥队树苗的生长影响比氮肥大。又氮肥的相伴概率Sig.=0.0840.05,说明氮肥对树苗的生长没有影响;钾肥的相伴概率Sig.=0.00312.50。第八章 相关分析第三题实验步骤如下:1.打开data8-5.sav数据文件;2.运行AnalyzeCorrelateBivariate,将花瓣长、花枝长和花萼长移入Variable框中,选择Person相关系数,在Test of signifinance中选择双尾检验,再单击Options按钮,在打开的对话框中选择Mean and standard deviations;3.点击OK。实验结果如下:Descriptive StatisticsMeanStd. DeviationN花瓣长40.445.97318花枝长19.675.02918花萼长16.173.29418上表可知:花瓣长的均值为40.44,标准差为5.973,花枝长的均值为19.67,标准差为5.029,花萼长的均值为16.17,标准差为3.294,记录数为18条。Correlations花瓣长花枝长花萼长花瓣长Pearson Correlation1.955*.797*Sig. (2-tailed).000.000Sum of Squares and Cross-products606.444487.667266.667Covariance35.67328.68615.686N181818花枝长Pearson Correlation.955*1.678*Sig. (2-tailed).000.002Sum of Squares and Cross-products487.667430.000191.000Covariance28.68625.29411.235N181818花萼长Pearson Correlation.797*.678*1Sig. (2-tailed).000.002Sum of Squares and Cross-products266.667191.000184.500Covariance15.68611.23510.853N181818*. Correlation is significant at the 0.01 level (2-tailed).从上表中看出,三种的相关系数均大于0,故都成正相关,而相关概率小于0.05,因此拒绝零假设,即说明花瓣长、花枝长和花萼长彼此显著性是正影响的。第四题实验步骤如下:1.打开data8-6.sav数据文件;2.运行AnalyzeCorrelateBivariate,将国民收入和存款余额移入Variable框中,选择Person相关系数,在Test of signifinance中选择双尾检验,再单击Options按钮,在打开的对话框中选择Mean and standard deviations;3.点击OK。实验结果如下:Descriptive StatisticsMeanStd. DeviationN国民收入128.5452106.1875327存款余额14.121923.7969327上表可知:国民收入的均值为128.5452,标准差为106.18753,存款的均值为14.1219,标准差为23.79693,记录数为27条。Correlations国民收入存款余额国民收入Pearson Correlation1.976*Sig. (2-tailed).000Sum of Squares and Cross-products293170.56764137.265Covariance11275.7912466.818N2727存款余额Pearson Correlation.976*1Sig. (2-tailed).000Sum of Squares and Cross-products64137.26514723.639Covariance2466.818566.294N2727*. Correlation is significant at the 0.01 level (2-tailed).从上表中看出,两种的相关系数均大于0,故都成正相关,而相关概率小于0.05,因此拒绝零假设,即说明存款余额是受国民收入显著性是正影响的。第五题实验步骤如下:1.打开data8-7.sav数据文件;2.运行AnalyzeCorrelateBivariate,将百米名次和跳高名次移入Variable框中,选择Person相关系数,在Test of signifinance中选择双尾检验,再单击Options按钮,在打开的对话框中选择Mean and standard deviations;3.点击OK。实验结果如下:Descriptive StatisticsMeanStd. DeviationN百米名次5.503.02810跳高名次5.503.02810上表可知:百米名次的均值为5.50,标准差为3.028,跳高名次的均值为5.50,标准差为3. 028,记录数为10条。Correlations百米名次跳高名次百米名次Pearson Correlation1.697*Sig. (2-tailed).025Sum of Squares and Cross-products82.50057.500Covariance9.1676.389N1010跳高名次Pearson Correlation.697*1Sig. (2-tailed).025Sum of Squares and Cross-products57.50082.500Covariance6.3899.167N1010*. Correlation is significant at the 0.05 level (2-tailed).从上表中看出,两种的相关系数均大于0,故都成正相关,而相关概率小于0.05,因此拒绝零假设,即说明跳高名次是受跳高名次显著性是正影响的。第六题实验步骤如下:1.打开data8-8.sav数据文件;2.运行AnalyzeCorrelatePartial,把销量和价格移入Variables框中;3.把广告费用和照明时间移入Controlling for,点击Tests of Signicance中的Twotailed;4.点击OK。5重复以上过程,(在第二步依次用广告费用和照明时间替换),得出它们的结果。实验结果如下:CorrelationsControl Variables销量价格月份 & 广告费用 & 日照时间销量Correlation1.000-.660Significance (2-tailed).053df07价格Correlation-.6601.000Significance (2-tailed).053.df70可以看出销量和价格关系成负相关,偏相关系数为-0.660,而相比概率大于0.05,所以接受零假设,它们之间不存在显著性差异。CorrelationsControl Variables销量广告费用月份 & 价格 & 日照时间销量Correlation1.000.683Significance (2-tailed).043df07广告费用Correlation.6831.000Significance (2-tailed).043.df70可以看出销量和广告费用关系比较密切,偏相关系数为0.683,而相比概率小于0.05,所以拒绝零假设,它们之间存在显著性差异。CorrelationsControl Variables销量日照时间月份 & 价格 & 广告费用销量Correlation1.000.775Significance (2-tailed).014df07日照时间Correlation.7751.000Significance (2-tailed).014.df70可以看出销量和照明时间关系比较密切,偏相关系数为0.775,而相比概率小于0.05,所以拒绝零假设,它们之间存在显著性差异。第七题实验步骤如下:1.打开data8-9.sav数据文件;2. 2.运行AnalyzeCorrelateDistances,顺序启动距离分析的主对话框,把序号移入Label Case by中,将其余四个变量移入Variables中进行相似性测度计算;3.在Computer Distances中Between Variables单选框,在Measure单选框中Dissmilarities;4.在Measures按钮在Interval下拉列表中选择Eulidean Distance5点击OK.。实验结果如下:Case Processing SummaryCasesValidMissingTotalNPercentNPercentNPercent3100.0%0.0%3100.0%Proximity Matrix Euclidean Distance 1: 12: 23: 31: 1.00011.26913.1912: 211.269.0002.2363: 313.1912.236.000This is a dissimilarity matrix上表是一个对称矩阵,当两变量的欧式距离越大时,说明其差别越大,反之越小。从表中可看出第2只幼仔和第3只幼仔最相近,而第3只幼仔和第1只幼仔相差比较大。第九章 回归分析第三题本题要求对合金钢的强度和钢材中碳的含量两个变量进行一元线性回归分析,一元线性回归模型是指只有一个解释变量的线性回归模型,用于表达被解释变量与另一个解释变量之间的线性关系,其中钢材中的碳含量作为自变量x,合金钢的强度作为因变量y。其一元线性回归的数学模型为:y=0+1x+,其中0+1x表示x的变化引起y的线性变化部分,表示其他随机因素引起的y的变化部分。步骤:(1)打开数据文件data9-5.sav,对数据进行分析,考虑用一元线性回归解决。(2)一元线性回归分析设置 :按Analyze-regresion-linear的顺序打开对应的对话框,将y选入Dependent列表框,x选入Idependent列表框,单击Plots并选择Histogram和Normal probability plot复选框,单击Save并选择Predicted Values和Residuals中的Standardized以及Distances中的Cooks和Leverage Values,最后运行并得到如下结果:Variables Entered/RemovedbModelVariables EnteredVariables RemovedMethod1xa.Entera. All requested variables entered.b. Dependent Variable: Y从中可以看出碳含量为自变量xModel SummarybModelRR SquareAdjusted R SquareStd. Error of the Estimate1.983a.966.96277.3073a. Predictors: (Constant), xb. Dependent Variable: Y可看出R=0.983,说明自变量与因变量之间的相关性很强,R2=0.966,说明自变量可以解释因变量的96.6%的差异性。ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression1517083.63711517083.637253.845.000aResidual53787.77295976.419Total1570871.40910a. Predictors: (Constant), xb. Dependent Variable: Y可知显著性概率为0.000,即检验假设回归系数B=0成立的概率为0.000,从而应拒绝零假设,说明自变量和因变量的线性关系非常显著,可以建立线性模型。从图中可以看出散点密集的分布在这条斜线的附近,说明随机变量残差服从正态分布,证明样本确实来自正态总体。第四题本题同样要求进行线性回归分析,但是因变量的个数一个增加为三个。步骤:(1)打开数据文件data8-8.sav,对数据进行分析,考虑用多元线性回归解决。(2)多元线性回归分析设置 :按Analyze-regresion-linear的顺序打开对应的对话框,将y选入Dependent列表框,x1、x2、x3选入Idependent列表,在Statistics里选择Estimate、Model fit 、Discriptives、Durbin-Watson,单击Plots选用DEPENDENT为Y轴,ZRESID为X轴,并选择Histogram和Normal probability plot复选框,单击Save并选择未标准预测值、未标准预测值残值、标准预测值、标准预测残值,最后运行并得到如下结果:Correlations销量价格广告费用日照时间Pearson Correlation销量1.000-.922.964.973价格-.9221.000-.885-.851广告费用.964-.8851.000.923日照时间.973-.851.9231.000Sig. (1-tailed)销量.000.000.000价格.000.000.000广告费用.000.000.000日照时间.000.000.000.N销量12121212价格12121212广告费用12121212日照时间12121212因变量与自变量的相关系数分别-0.922、0.964、0.973且单尾检验的显著性概率较小,说明这三个自变量与因变量的关系均较密切。Model SummarybModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.994a.988.98310.7232.967a. Predictors: (Constant), 日照时间, 价格, 广告费用b. Dependent Variable: 销量其中R=0.994,R2=0.988,说明因变量与三个自变量有很强的线性关系。ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression75331.021325110.340218.376.000aResidual919.8968114.987Total76250.91711a. Predictors: (Constant), 日照时间, 价格, 广告费用b. Dependent Variable: 销量显著性概率为0.000,明显小于0.05,说明该模型存在显著性。从图中可以看出散点密集的分布在这条斜线的附近,说明随机变量残差服从正态分布,证明样本确实来自正态总体。第五题本题将要求年对年龄和远视率进行曲线估计,曲线估计是研究两变量间非线性关系的一种方法,选定一种用方程表达的曲线,使得实际数据与理论数据之间的差异尽可能小。此方法的关键在于选择一种拟合度尽可能高地数学模型。步骤:(1)打开数据文件,作散点图初步判定变量的分布趋势。按Graph-Legacy Dialogs-Scatter/Dot顺序打开相应的对话框,选择Simple Scatter,点击Define并作相应的设置,运行并得如下结果:可以看出远视率随年龄的增加而降低,但年龄较小时减幅更明显,因此用线性回归模型表示x和y的关系是不恰当的。(2)进行曲线估计。按顺序选择Analyze-Regression-Curve Estimation,将Models下的模型全选上,运行得如下结果:Model Summary and Parameter Est

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论