统计学实验分析-SPSS_第1页
统计学实验分析-SPSS_第2页
统计学实验分析-SPSS_第3页
统计学实验分析-SPSS_第4页
统计学实验分析-SPSS_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重庆工商大学数学与统计学院《统计应用软件》课程实验报告

实验项目利用SPSS统计软件,对数据进行分析。实验日期周一,3-5节实验地点80608实验目的运用SPSS软件对居民储蓄调查数据进行基本统计分析,T检验,单因素分析,多因素方差分析,相关分析,偏相关分析,以及曲线估计。二项logistic回归分析。实验内容:第一步用统计软件SPSS打开居民储蓄调查数据。第二步进行分析。一.根据提供数据,对居民调查数据进行基本统计分析。1.选择菜单Analyze-Descriptivestatistics-Frequencies,出现下图所示2.得出结论FrequencyTable职业FrequencyPercentValidPercentCumulativePercentValid国家机关248.58.58.5商业服务业5419.119.127.7文教卫生186.46.434.0公交建筑业155.35.339.4经营性公司186.46.445.7学校155.35.351.1一般农户3512.412.463.5种粮棉专业户41.41.464.9种果菜专业户103.53.568.4工商运专业户3412.112.180.5退役人员176.06.086.5金融机构3512.412.498.9现役军人31.11.1100.0Total282100.0100.0年龄FrequencyPercentValidPercentCumulativePercentValid20岁以下41.41.41.420~35岁14651.851.853.235~50岁9132.332.385.550岁以上4114.514.5100.0Total282100.0100.0BarChart得出结论:1按职业进行分类。例如,职业为国家机关的人数为24人,占总人数的8.5%;一般农户的人数为35人,占总人数的2.4%。按年龄划分,20岁以下的人共有4人,占总人数的1.4%;20~35岁共有146人,占总人数的51.8%。因为职业和年龄在变量中,无去ishishuju,因为百分比与有效百分比总是相同的。2根据柱形图,本次被调查者的年龄分布情况是:20-35岁最多,其次是35-50岁,50岁以上,最少的人数是20岁以下。当选择PIECHART时,得出结论如下图。PieChart2.选择菜单Analyze-Descriptivestatistics-Frequencies,出现下图所示得出结论:Descriptives上图表明,二.对数据进行T检验分析。1.选择Analyze-comparemeans-one-samplesTtest如下图。选择Option2得出结论:T-TestOne-SampleStatisticsNMeanStd.DeviationStd.ErrorMean存(取)款金额2824738.0910945.569651.799One-SampleTestTestValue=2000tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpper存(取)款金额4.201281.0002738.0891455.064021.12该问题应采用双尾检验,因此比较a/2和p/2。由于p小于a,因此拒绝零假设。认为出乎总体一次平均村会计呢与2000元有显著差异。95%的置信区间告之,有95%的把握认为储户总体平均一次在3455.06–6021.12元之间。2000元不包含在置信区间内,也证实了上述推断。三.对数据进行多因素方差检验。1选择菜单Analyze-generallinearmodel-univariate于是出现窗口均值比较。控制变量交互作用图形分析2.得出结论UnivariateAnalysisofVarianceBetween-SubjectsFactorsValueLabelN收入水平1300元以下502300~800元1643800~1500元5041500元以上18物价水平1过高452偏高1793正常58TestsofBetween-SubjectsEffectsDependentVariable:什么合算SourceTypeIIISumofSquaresdfMeanSquareFSig.CorrectedModel3.787a10.3791.621.100Intercept160.1291160.129685.487.000a41.1563.3851.650.178a8.0862.043.184.832a4*a82.1555.4311.845.104Error63.305271.234Total612.000282CorrectedTotal67.092281a.RSquared=.056(AdjustedRSquared=.022)上图表明,第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果。第三列表明自由度;第四列是均方;第五列是F检验统计量的观测值;第六列是检验统计量的概率P值。可以看出,观测变量的总变差为67.092。它由4部分组成,分别是收入水平a4=1.156,物价水平a8=.086,由收入水平和物价水平交互作用引起的变差a4*a8=2.155,由随机因素引起的变差error=63.305。这些变差除以各自的自由度后,得到各自的均方,并可计算出各F检验统计量的观测值和在一定自由度下的概率P值(即第六列)。若显著性水平α=0.05,由于Fa4,Fa8的概率p值小于显著性水平α,则应拒绝零假设。可以认为收入水平和物价水平总体均值存在显著差异,对什么合算的效应不同时为0,各自不同的水平给什么合算带来了显著影响。同时由于Fa4,Fa8的概率p值小于显著性水平α,则应拒绝零假设,可以认为不同的收入水平和物价水平对什么合算带来了交互作用,不同的收入水平与物价水平会影响到购买什么合算。CustomHypothesisTestsContrastResults(KMatrix)收入水平DeviationContrastaDependentVariable什么合算Level1vs.MeanContrastEstimate.008HypothesizedValue0Difference(Estimate-Hypothesized).008Std.Error.084Sig..92195%ConfidenceIntervalforDifferenceLowerBound-.156UpperBound.173Level2vs.MeanContrastEstimate-.020HypothesizedValue0Difference(Estimate-Hypothesized)-.020Std.Error.065Sig..75895%ConfidenceIntervalforDifferenceLowerBound-.149UpperBound.108Level3vs.MeanContrastEstimate-.036HypothesizedValue0Difference(Estimate-Hypothesized)-.036Std.Error.080Sig..65195%ConfidenceIntervalforDifferenceLowerBound-.193UpperBound.121a.Omittedcategory=4上图分别表明收入水平前三个水平下买什么合算的均值检验结果,省略了第四水平的检验结果,检验值是总体均值。可以看出,第一种收入水平下的什么合算的均值与检验值差0.008,标准误差为0.084,检验统计量的概率p值为0.0921,差值的95%置信区间的下限和上限分别是-0.156和0.173。分析结论是,第一种收入水平下的合算均值与检验值不存在显著差异。同理,第二种和第三种也不存在显著差异。所以可得出,在三种情况下,都不存在显著差异。TestResultsDependentVariable:什么合算SourceSumofSquaresdfMeanSquareFSig.Contrast.0633.021.090.966Error63.305271.234ProfilePlots上图表明从收入水平过高,偏高,正常的渐变期间,对购买力有很大程度上的影响。即可以同上述存在明显交互作用达成一致结论。四.对数据进行偏相关数据分析。1.选择菜单Analyze-correlate-partial2.选择参与分析的变量到variable3.选择一个或多个控制变量到controllingfor框中选择OptionZero-ordercorrelation表示输出零阶偏相关系数。2.得出结论PartialCorrCorrelationsControlVariables存(取)款金额收入水平物价趋势-none-a存(取)款金额Correlation1.000.184.014Significance(2-tailed)..002.821df0280280收入水平Correlation.1841.000-.001Significance(2-tailed).002..983df2800280物价趋势Correlation.014-.0011.000Significance(2-tailed).821.983.df2802800物价趋势存(取)款金额Correlation1.000.184Significance(2-tailed)..002df0279收入水平Correlation.1841.000Significance(2-tailed).002.df2790a.Cellscontainzero-order(Pearson)correlations.五.对数据计算相关系数1选择菜单analyze-correlate-bivariate2选择options—cross—productdeviationsandcovariances表示输出各变量的离差平方和,样本方差,两变量的叉积离差和协方差3得出结论CorrelationsCorrelations收入情况存(取)款金额物价水平收入情况PearsonCorrelation1-.090.046Sig.(2-tailed).131.439SumofSquaresandCross-products101.872-167118.5324.723Covariance.363-594.728.017N282282282存(取)款金额PearsonCorrelation-.0901-.008Sig.(2-tailed).131.898SumofSquaresandCross-products-167118.5323.367E10-14216.152Covariance-594.7281.198E8-50.591N282282282物价水平PearsonCorrelation.046-.0081Sig.(2-tailed).439.898SumofSquaresandCross-products4.723-14216.152102.401Covariance.017-50.591.364N282282282上图表明,收入情况与存取款金额的简单相关系数为-0.090,与物价水平的简单相关系数为0.439。它们的相关系数检验的概率p分别为0.131和0.439。当显著性水平α为0.05或0.01时,都接受相关系数检验的零假设,认为两总体不存在线性关系。六.对数据进行曲线估计选择菜单Analyze-regression-curveestimation。2得出结论CurveFitModelDescriptionModelNameMOD_1DependentVariable1收入情况Equation1Quadratic2CubicIndependentVariable存(取)款金额ConstantIncludedVariableWhoseValuesLabelObservationsinPlots存(取)款种类ToleranceforEnteringTermsinEquationsCaseProcessingSummaryNTotalCases282ExcludedCasesa0ForecastedCases0NewlyCreatedCases0a.Caseswithamissingvalueinanyvariableareexcludedfromtheanalysis.VariableProcessingSummaryVariablesDependentIndependent收入情况存(取)款金额NumberofPositiveValues282282NumberofZeros00NumberofNegativeValues00NumberofMissingValuesUser-Missing00System-Missing00收入情况ModelSummaryRRSquareAdjustedRSquareStd.ErroroftheEstimate.146.021.014.598Theindependentvariableis存(取)款金额.ANOVASumofSquaresdfMeanSquareFSig.Regression2.16621.0833.031.050Residual99.706279.357Total101.872281Theindependentvariableis存(取)款金额.CoefficientsUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta存(取)款金额-1.855E-5.000-.337-2.396.017存(取)款金额**22.048E-10.000.272..(Constant)2.080.04348.500.000CubicModelSummaryRRSquareAdjustedRSquareStd.ErroroftheEstimate.165.027.017.597Theindependentvariableis存(取)款金额.ANOVASumofSquaresdfMeanSquareFSig.Regression2.7843.9282.603.052Residual99.089278.356Total101.872281Theindependentvariableis存(取)款金额.CoefficientsUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta存(取)款金额-3.277E-5.000-.596-2.467.014存(取)款金额**28.193E-10.0001.090..存(取)款金额**3-5.130E-15.000-.598..(Constant)2.104.04745.121.000七.二项Logistic回归分析1选择菜单Analyze-Regression-Binarylogistic。添加变量。2单击categorical按钮指定如何生成虚拟变量,选择变量3选择Options和save4得出结论LogisticRegressionCaseProcessingSummaryUnweightedCasesaNPercentSelectedCasesIncludedinAnalysis28199.6MissingCases1.4Total282100.0UnselectedCases0.0Total282100.0a.Ifweightisineffect,seeclassificationtableforthetotalnumberofcases.DependentVariableEncodingOriginalValueInternalValue城镇户口0农村户口1CategoricalVariablesCodingsFrequencyParametercoding(1)(2)(3)(4)(5)存(取)款种类三年以上定期501.000.000.000.000.000三年以下定期59.0001.000.000.000.000活期135.000.0001.000.000.000定活两便3.000.000.0001.000.000活期工资帐户22.000.000.000.0001.000各类信用卡12.000.000.000.000.000现金不存的原因日常生活用钱156.000.000.000生意周转金341.000.000.000岁制购买中意商品57.0001.000.000购买国库券34.000.0001.000Block0:BeginningBlockClassificationTablea,bObservedPredicted户口PercentageCorrect城镇户口农村户口Step0户口城镇户口1990100.0农村户口820.0OverallPercentage70.8a.Constantisincludedinthemodel.b.Thecutvalueis.500VariablesintheEquationBS.E.WalddfSig.Exp(B)Step0Constant-.887.13145.6461.000.412VariablesnotintheEquationScoredfSig.Step0Variablesa415.6481.000a620.4645.001a6(1)3.4451.063a6(2)12.0701.001a6(3)10.5991.001a6(4)1.2501.264a6(5).4811.488a1232.3893.000a12(1)23.6201.000a12(2).2841.594a12(3)12.8881.000OverallStatistics68.3149.000Block1:Method=EnterOmnibusTestsofModelCoefficientsChi-squaredfSig.Step1Step79.1119.000Block79.1119.000Model79.1119.000ModelSummaryStep-2LoglikelihoodCox&SnellRSquareNagelkerkeRSquare1260.207a.245.350a.Estimationterminatedatiterationnumber20becausemaximumiterationshasbeenreached.Finalsolutioncannotbefound.HosmerandLemeshowTestStepChi-squaredfSig.14.0007.780ContingencyTableforHosmerandLemeshowTest户口=城镇户口户口=农村户口TotalObservedExpectedObservedExpectedStep112625.6590.3412622827.63511.3652932624.34623.6542844441.71668.2845052022.21696.7842961515.68498.3162471517.3651310.6352881615.3511414.64930999.0282827.97237ClassificationTableaObservedPredicted户口PercentageCorrect城镇户口农村户口Step1户口城镇户口1891095.0农村户口513137.8OverallPercentage78.3a.Thecutvalueis.500VariablesintheEquationBS.E.WalddfSig.Exp(B)Step1aa4-1.085.25418.1761.000.338a618.3475.003a6(1)1.286.9671.7711.1833.619a6(2)1.843.9573.7081.0546.312a6(3).304.932.1061.7441.355a6(4)-18.11120993.578.0001.999.000a6(5).4721.076.1931.6611.604a1228.3803.000a12(1)2.330.51420.5111.00010.274a12(2)-.083.384.0471.829.920a12(3)-2.2841.0564.6751.031.102Constant.2491.035.0581.8101.283a.Variable(s)enteredonstep1:a4,a6,a12.Stepnumber:1ObservedGroupsandPredictedProbabilities80++||||F||R60++E||Q|2|U|1|E40+1+N|1|C|1|Y|1|20+122+|111222||1121111111212||111111111121211211112221222|Predicted---------+---------+---------+---------+---------+---------+---------+---------+---------+----------Prob:0.1.2.3.4.5.6.7.8.91Group:1111111111111111111111111111111111111111111111111122222222222222222222222222222222222222222222222222PredictedProbabilityisofMembershipfor农村户口TheCutValueis.50Symbols:1-城镇户口2-农村户口EachSymbolRepresents5Cases.八.单因素分析1选择analyse-comparemeans-oneway-anova得出结论OnewayANOVASumofSquaresdfMeanSquareFSig.收入水平BetweenGroups(Combined)1.7983.5991.006.390LinearTermUnweighted1.20311.2032.019.156Weighted.0011.001.002.965Deviation1.7972.8991.508.223WithinGroups165.606278.596Total167.404281存(取)款金额BetweenGroups(Combined)5.657E831.886E81.584.193LinearTermUnweighted3.753E813.753E83.152.077Weighted1.282E811.282E81.077.300Deviation4.375E822.188E81.837.161WithinGroups3.310E102781.191E8Total3.367E10281ContrastCoefficientsContrast年龄20岁以下20~35岁35~50岁50岁以上11-.50-.5ContrastTestsContrastValueofContrastStd.ErrortdfSig.(2-tailed)收入水平Assumeequalvariances1-.61.392-1.553278.122Doesnotassumeequalvariances1-.61.297-2.0473.370.123存(取)款金额Assumeequalvariances19426.495540.3701.701278.090Doesnotassumeequalvariances19426.4912365.123.7623.009.501PostHocTestsMultipleComparisonsDependentVariable(I)年龄(J)年龄MeanDifference(I-J)Std.ErrorSig.95%ConfidenceIntervalLowerBoundUpperBound收入水平Scheffe20岁以下20~35岁-.644.391.440-1.74.4635~50岁-.654.394.433-1.76.4650岁以上-.573.404.571-1.71.5620~35岁20岁以下.644.391.440-.461.7435~50岁-.010.1031.000-.30.2850岁以上.071.136.966-.31.4535~50岁20岁以下.654.394.433-.461.7620~35岁.010.1031.000-.28.3050岁以上.081.145.958-.33.4950岁以上20岁以下.573.404.571-.561.7120~35岁-.071.136.966-.45.3135~50岁-.081.145.958-.49.33LSD20岁以下20~35岁-.644.391.101-1.41.1335~50岁-.654.394.098-1.43.1250岁以上-.573.404.157-1.37.2220~35岁20岁以下.644.391.101-.131.4135~50岁-.010.103.923-.21.1950岁以上.071.136.605-.20.3435~50岁20岁以下.654.394.098-.121.4320~35岁.010.103.923-.19.2150岁以上.081.145.579-.21.3750岁以上20岁以下.573.404.157-.221.3720~35岁-.071.136.605-.34.2035~50岁-.081.145.579-.37.21存(取)款金额Scheffe20岁以下20~35岁8327.8155530.039.520-7226.4723882.1035~50岁7305.9515574.425.633-8373.1822985.0850岁以上10525.1595715.751.337-5551.4826601.8020~35岁20岁以下-8327.8155530.039.520-23882.107226.4735~50岁-1021.8651457.357.921-5120.963077.2350岁以上2197.3431928.597.730-3227.207621.8935~50岁20岁以下-7305.9515574.425.633-22985.088373.1820~35岁1021.8651457.357.921-3077.235120.9650岁以上3219.20820

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论