spss基本分析教学提纲_第1页
spss基本分析教学提纲_第2页
spss基本分析教学提纲_第3页
spss基本分析教学提纲_第4页
spss基本分析教学提纲_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Good is good, but better carries it.精益求精,善益求善。spss基本分析-统计分析往往是从了解数据的基本特征开始的。描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。两者相互补充,共同反映数据的全貌。这些内容可以通过SPSS中的“DescriptiveStatistics”菜单中的过程来完成。1频数分析(DescriptiveStatistics-Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。下面我们通过例子来学习单变量频数分

2、析操作。1)输入分析数据在数据编辑器窗口打开“HYPERLINK/epcl/spss/data/DATA1-2.SAVdata1-2.sav”数据文件。2)调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“DescriptiveStatistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。图3-4“Frequencies”对话框3)设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。在这里我们选“三化螟蚁螟虫口数”变量进入“Variable(s):”框。4)输出频数分布表Displayfre

3、quencytables,选中显示。5)设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:图3-5“Statistics”对话框选择百分位显示“PercentilesValues”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。Cutpointsfor10equalgroups:将数据平分为输入的10个等份。Percentile(s)::用户自定义百分位数,输入值0100之间。选中此项后,可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。选择变异程度的统计量“Dispersion”:(离散趋势)

4、Std.deviation标准差Minimum最小值Variance方差Maximum最大值Range极差S.E.mean均值标准误选择表示数据中心位置的统计量“CentralTendency”:(集中趋势)Mean均值Median中位数Mode众数Sum算术和选择分布指标“Distribution”:Skewness偏度Kurtosis峰度6)统计图形输出设置单击“Charts”按钮,将弹出如图3-6所示的对话框:图3-6“Charts”对话框ChartType图形选择栏:None:不输出图形;Barcharts:输出条形图;Piecharts:输出饼图;Histograms:输出柱状图。若

5、选中“Withnormalcurve”项,则在绘制柱状图中加绘一条正态分布曲线。当用户选中条形图或饼图时,在“ChartValues”框的选项中可选择:Frequencies:绘制频数图。Percentages:绘制频率图。7)设置频数表格式在图3-4对话框中,单击“Format”按钮,打开如图3-7所示的对话框:图3-7“Format”对话框设置排序的方法“Orderby”:Ascendingvalues:按变量值的升序排列。Descendingvalus:按变量值的降序排列。Ascendingcounts:按频数的升序排列。Descendingcounts:按频数的降序排列。选择多变量输出

6、设置“MultipleVariables”:Comparevariables选项,所有变量在一个图形中输出,以便进行比较。Organizeoutputbyvariables选项,为每一个变量单独输出一个图。设置在频数表中显示的组数选中此项,输入分组数,系统缺省为10组。设置完成后,点击“Continue”按钮回到上一级对话框。8)提交执行在图3-4对话框里单击“OK”按钮,SPSS在输出窗口的输出结果如表1、表2和图1结果。9)分析结果表1统计量表Statistics三化螟蚁螟NValid120Missing0Mean(平均数)75.14Std.Deviation(标准差)7.024Skewn

7、ess(偏度系数)-.031Std.ErrorofSkewness(偏度系数误差).221Kurtosis(峰度系数)-.582Std.ErrorofKurtosis(峰度系数误差).438Percentiles1065.002068.203071.004073.405075.006077.007079.008081.809084.90在表1中列出的信息有:有效观测值有124个,缺失值0个,平均数75.14,标准差7.024。偏度系数(Skewness)及误差:-0.031和0.221,峰度系数(Kurtosis)及误差:-0.582和0.438。表2频数表三化螟蚁螟Frequency(频数)

8、Percent(百分比)ValidPercent(有效观测值的百分比)CumulativePercent(累积百分比)Valid?581.8.8.86232.52.53.3631.8.84.26443.33.37.56543.33.310.8661.8.811.76754.24.215.86854.24.220.06943.33.323.37043.33.326.77154.24.230.87275.85.836.77343.33.340.07443.33.343.37597.57.550.87697.57.558.37754.24.262.57865.05.067.57965.05.072.

9、58065.05.077.58132.52.580.08243.33.383.38332.52.585.88454.24.290.08521.71.791.78643.33.395.08732.52.597.5881.8.898.3901.8.899.2911.8.8100.0Total120100.0100.0?在表2中列出的信息有:Frequency频数;Percent百分比;ValidPercent有效观测值的百分比;CumulativePercent累积百分比。图3-8频数分布的条形图表示2列联表分析(Crosstabs)列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。

10、SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。其中卡方检验是分析列联表资料常用的假设检验方法。例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1()分为3级(1级为16.5以下,2级为16.6-17.8,3级为17.8以上),6月上旬平均气温x2()分为3级(1级为20以下,2级为20.1-21.5,3级为21.5以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量

11、x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。数据如下表。山东烟台历年观测数据分级表()年份596061626364656667697071727374757677y131131121321223221x1322313233123111221x2123112211112311112x3311312132212123231x4311111111131121111注:摘自农业病虫统计测报131页。1)输入分析数据在数据编辑器窗口打开“HYPERLINK/epcl/spss/data/DATA1-3.SAVdata1-3.sav”数据文件。数据文件中变量格

12、式如下:2)调用分析过程在菜单选中“Analyze-Descriptive-Crosstabs”命令,弹出列联表分析对话框,如下图3)设置分析变量选择行变量:将“五月气温x1,六月上气温x2,六月上降雨x3,六月中降雨x4”变量选入“Rows:”行变量框中。选择列变量:将“玉米螟卵高峰发生期y”变量选入“Columns:”列变量框中。4)输出条形图和频数分布表Displayclusteredbarcharts:选中显示复式条形图。Suppresstable:选中则不输出多维频数分布表。5)统计量输出点击“Statistics”按钮,弹出统计分析对话框(如下图)。Chi-Square:卡方检验。

13、选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验(ContinuityCorrection)及Fisher精确概率检验(FishersExacttest)的结果。Correlations:选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。Nominal:两分类变量的关联度(Association)测量ContingencyCoefficient:列联系数,其值越大关联性越强。PhiandCramersV:Cramer列联系数,其值越大关联性越强。Lambda:减少预测误差率,1表示预

14、测效果最好,0表示预测效果最差。UncertaintyCoefficient:不定系数Ordinal:两有序分类变量(等级变量)的关联度测量Gamma:关联度,+1表示完全正关联,-1表示负关联,0表示无联。Somersd:列联度,其取值范围和意义同上。Kendallstau-b:NominalbyInterval:一个定性变量和一个定量变量的关联度Eta:关联度统计量。Kappa:吻合度系数,其取值-1至+1,其值越大吻合程度越高。Risk:危险度分析。McNemar:配对计数资料的卡方检验。CochransandMantel-Haenszelstatistics:检验在协变量存在下,两个二

15、分类变量是否独立。6)设置列联表的显示单击“Cells”按钮,弹出列联表显示内容对话框(如下图)。Counts:频数Observed:观测频数。Expected:期望频数。Percentages:百分比Row:占本行的百分比。Column:占本列的百分比。Total:占全部的百分比。Residuals:残差分析Unstandardized:非标准化残差分析。Standardized:标准化残差分析。Adj.Standardized:调整的标准化残差分析。NonintegerWeights:Roundcellcounts:临近列计算。Truncatecellcounts:。RoundcaseWe

16、ights临近记录度量TruncatecaseWeightsNoadjustments:不调整。7)设置输出格式单击Format按钮,弹出列联表输出格式对话框(如下图)。RowOrder:频数Ascending:行变量从小到大升序排列。Descending:行变量从大到小降序排列。8)设置检验单击“Exact”按钮,弹出精确检验对话框(如下图)。Asymptoticonly近似的,系统设置。MonteCarloConfidencelevel:99%置信度,系统默认99%。Numberofsamples:10000样本数量,系统默认10000。ExactTimelimitpertest:5min

17、utes限时检验时间,系统默认值5分钟。9)提交执行设置完成后,在列联表分析对话框中,点击OK按钮,计算结果输出在结果窗口中。10)结果与分析在结果窗口中查看计算结果,主要输出内容如下。五月气温*玉米螟卵高峰发生期Crosstab玉米螟卵高峰发生期Total6月20日前6月21-25日6月25日以后五月气温16.5以下Count(频数)ExpectedCount(期望值)12.722.031.366.016.6-17.8Count(频数)ExpectedCount(期望值)22.732.011.366.017.8以上Count(频数)ExpectedCount(期望值)52.712.001.366.0TotalCount(频数)ExpectedCount88.066.044.01818.0Chi-SquareTestsValuedfAsymp.Sig.(2-sided)PearsonChi-Square皮尔森卡方检验7.750(a)4.101LikelihoodRatio似然比卡方检验8.5104.075Linear-by-LinearAssociation6.2481.012NofVal

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论