spss的数据分析报告范例1_第1页
spss的数据分析报告范例1_第2页
spss的数据分析报告范例1_第3页
spss的数据分析报告范例1_第4页
spss的数据分析报告范例1_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于某地区361个人旅游情况统计分析报告本次分析的数据为某地区 361 个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0 代表女,1 代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0 代表没走通道,1 代表走通道);旅游的积极性,为三类变量(0 代表积极性差,1 代表积极性一股,2 代表积极性比较好,3 代表积极性好 4 代表积极性非常好);额外收入,一类变量。通过运用 spss 统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。1、频数分析。基本的统

2、计分析往往从频数分析开始。通过频数分地区 359 个人旅游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。统计量积极性性别N 功效缺失35903590首先,对该地区的男女性别分布进行频数分析,结果如下性别频率百分比后效日分比 累积百分比功效女19855.255.255.2男16144.844.8100.0合计359100.0100.0表说明,在该地区被调查的 359 个人中,有 198 名女性,161 名男性,男女比例分数据介绍:数据分析别为 44.8%和 55.2%,该公司职工男女数量差距不大,女性略多于男性。其次对原

3、有数据中的旅游的积极性进行频数分析,结果如下表积极性频率百分比后效日分比累积百分比后效差17147.647.647.67922.022.069.6比较好7922.022.091.6好246.76.798.3非常好61.71.7100.0合计359100.0100.0其次对原有数据中的积极性进行频数分析,结果如下表枳极性积极性均值=0加标准偏差.=1,055N=359其次对原有数据中的是否进通道进行频数分析,结果如下表Statistics通道NValid359Missing0通道FrequencyPercentValidPercentCumulativePercentValid 没走通道2938

4、1.681.681.6通道6618.418.4100.0Total359100.0100.0这说明,在该地区被调查的 359 个人中,有没走通道的占 81.6%,占绝大多数。上表及其直方图说明, 被调查的 359 个人中, 对与旅游积极性差的组频数最高的, 为 171人数的 47.6%,其次为积极性一般和比较好的, 占比例都为 22.0%,积性为好的和非常好的比例比较低,分别为 24 人和 6 人,占总体的比例为 6.7%?口 1.7%。2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基

5、本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。描述统计量N极小值极大值均值标准差方差偏度峰度统计量 统计量统计量统计量统计量统计量统计量 标准误统计量标准误收入359 7.4266250.000 1032.93021 762.523942581442.7621.790.1296.869.257旅游花费359211006116.41130.716 17086.7043.145.12913.401.257有效的 N(列表359状态)如表所示,以起始工资为例读取分析结果,359 个人中收入最小值为 7.426,

6、最大值为 6250.00000,平均 1032.9302,标准差为 762.5239偏度系数和峰度系数分别为 1.790 和 6.869。其他数据依此读取,则该表表明该地区旅游花费的详细分布状况。3、探索性数据分析(1)交叉分析。通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。现以现工资与职务等级的列联表分析为例,读取数据(下面数据分析表为截取

7、的一部分):Count性别*积极性交叉制表计数积极性合计差比较好好非常好性别女男合计9675171473279413879121224246198161359条形图上联表及 BarChart 涉及两个变量,即性别与积极性的二维交叉,反映了在不同的性别对于旅游积极性分布情况。上表中,性别成为行向量,积极性列向量。(2)性别与收入的探索性分析性别CaseProcessingSummary性别CasesValidMissingTotalNPercentNPercentNPercent收入女男198161100.0%100.0%00.0%.0%198161100.0%100.0%Descriptive

8、s性别StatisticStd.Error收入女 Mean95%ConfidenceIntervalLowerBoundf0rMeanUpperBound1005.28562907.638531102.9327249.514796差一比好警5%TrimmedMean957.92011Median937.50000Variance485439.577Std.Deviation696.734940Minimum7.426Maximum3125.000Range3117.574InterquartileRange937.563Skewness.896.173Kurtosis.310.344男 Mea

9、n1066.9279165.99321995%ConfidenceIntervalLowerBound936.59779forMeanUpperBound1197.258025%TrimmedMean986.95497Median937.50000Variance701171.907Std.Deviation837.360082Minimum58.630Maximum6250.000Range6191.370InterquartileRange718.750Skewness2.370.191Kurtosis10.166.380收入Stem-and-LeafPlots收入 Stem-and-Le

10、afPlotfor性别=女FrequencyStem&Leaf18.000.00111111111111111126.000.2222222222222333333333333317.000.4444444444455555533.000.66666666666666666666677777777777722.000.888999999999999999999913.001.000000000111118.001.22222222222222222318.001.4444555555555555554.001.77775.001.8888814.002.00000111111111.002.4

11、.002.55551.002.62.002.883.00Extremes(=3000)Stemwidth:1000.000Eachleaf:1case(s)收入 Stem-and-LeafPlotfor性别=男FrequencyStem&Leaf15.000.00111111111111117.000.2222223333333333313.000.444444555555526.000.6666666666666777777777777719.000.888889999999999999913.001.000000000001119.001.222222222222222222313.001

12、.44445555555552.001.776.001.8888896.002.00011112.00Extremes(=2351)Stemwidth:1000.000Eachleaf:1case(s)结果分析如下收入女男平均数1005.285621066.92791均数的 95%引信区间(907.63853,1102.93272)(936.59779,1197.25802)5%的调整均数957.92011986.95497中位数937.50000937.50000标准差696.734940837.360082标准差485439.577701171.907最小值7.42658.630最大值31

13、25.0006250.000极差3117.5746191.370四分位数间距937.563718.750偏度系数2.3702.370峰度系数.31010.166(3)p-p 图分析结果分析年龄在正态 p-p 图的散点近似成一条直线,无趋势正态 p-p 图的散点均匀分布在直线 y=0 的上下,故可认为本资料服从正态分布4、相关分析。相关分析是分析客观事物之间关系的数量分析法,明确客观事之间有怎样的关系对理解和运用相关分析是极其重要的。函数关系是指两事物之间的一种一一对应的关系,即当一个变量 X 取一定值时,另一个变量函数 Y 可以根据确定的函数取一定的值。另一种普遍存在的关系是统计关系。统计关系

14、是指两事物之间的一种非一一对应的关系,即当一个变量 X取一定值时,另一个变量 Y 无法根据确定的函数取一定的值。统计关系可分为线性关系和非线性关系。事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却不像函0.Q&AgeAge的正态P-P图Agg 的越降正态 P-P 图Qr-口U4-00。-002-004-081.0O80B观涮的累积概率-0.06-0.0数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异如何测度事物之间的统计关系的强弱是人们关注的问题。相关分析正是一种简单易行的测度事物之间统计关系的有效工具Correlations收入旅游花费额外收入收入 Pear

15、sonCorrelation1*.140*.853Sig.(2-tailed).008.000N359359359旅游花费 PearsonCorrelation*.1401*.183Sig.(2-tailed).008.000N359359359额外收入 PearsonCorrelation*.853*.1831Sig.(2-tailed).000.000N359359359*.Correlationissignificantatthe0.01level(2-tailed).上表是对本次分析数据中,旅游花费、收入、额外收入的相关分析,表中相关系数旁边有两个星号(*)的,表示显著性水平为 0.0

16、1 时,仍拒绝原假设。一个星号(*)表示显著性水平为 0.05 是仍拒绝原假设。 先以现旅游花费这一变量与其他变量的相关性为例分析,由上表可知,旅游花费与额外收入的相关性最大,5.回归分析有相关性分析可得收入,旅游花费呈线性相关,因此作回归分析VariablesEntered/RemovedModelVariablesEnteredVariablesRemovedMethod1收入a.Entera. Allrequestedvariablesentered.b. DependentVariable:旅游花费ModelSummarybModelRRSquareAdjustedRSquareStd

17、.ErroroftheEstimate1.140a.020.017129.604a. Predictors:(Constant),收入b. DependentVariable:旅游花费ANOVAModelSumofSquaresdfMeanSquareFSig.1Regression120443.8091120443.8097.170.008aResidual5996596.23935716797.188Total6117040.048358a. Predictors:(Constant),收入b. DependentVariable:旅游花费CoefficientsModelUnstanda

18、rdizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)91.56311.5287.943.000收入.024.009.1402.678.008a.DependentVariable:旅游花费ResidualsStatisticsaMinimumMaximumMeanStd.DeviationNPredictedValue91.74241.90116.4118.342359Std.PredictedValue-1.3456.842.0001.000359StandardErrorofPredicted6.8

19、4047.3629.0483.426359ValueAdjustedPredictedValue92.09271.79116.5319.018359Residual-193.904891.785.000129.423359Std.Residual-1.4966.881.000.999359Stud.Residual-1.6076.891.0001.002359DeletedResidual-223.789894.316-.117130.229359Stud.DeletedResidual-1.6117.390.0041.025359Mahal.Distance.00046.811.9972.9

20、55359CooksDistance.000.199.003.015359CenteredLeverageValue.000.131.003.008359a.DependentVariable:旅游花费ChartsScatterplotDependentVariable:旅游花;赏200-立方图均缜=1032.93标注南盘-7S2524NF5g由上图可知,现工资的分布可近似看作符合正态分布,现推断现工资变量的平均值是否为$3,000,0,因此可采取单样本 t 检验来进行分析。分析如下:One-SampleStatistics单个样本统计量N均值标准差均值的标准误收入3591032.93021762.52394240.244474单个样本检验检验值=0tdfSig.(双侧)均值差值差分的 95%置信区间下限上限收入25.666358.0001032.930214953.784931112.07550由 One-SampleStatistics 可知,359 个被调查的人中收入平均值 1032.93021,标准差为762.523942,均值标准误差为 40.244474。图表 One-SampleTest 中,第二列是 t 统计量的观测值为 25.666;第三列是自由度为 358(n-1);第四列是 t 统计量观测值的双

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论