spss教程-常用的数据描述统计:频数分布表等--统计学_第1页
spss教程-常用的数据描述统计:频数分布表等--统计学_第2页
spss教程-常用的数据描述统计:频数分布表等--统计学_第3页
spss教程-常用的数据描述统计:频数分布表等--统计学_第4页
spss教程-常用的数据描述统计:频数分布表等--统计学_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.第二节 常用的数据描述统计本节拟讲述如何通过spss菜单或命令获得常用的统计量、频数分布表等。1数据这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图22),将数据保存到名为 “2-6-1.sav” 的文件中。 图22:数据输入格式示例1frequencies语句(1)操作打开数据文件“2-6-1.sav”,单击主菜单analyze /descriptive statistics / frequencies,出现频数分布表对话框如图2-3所示。 图23: frequencies定义窗口把score变量从左边变

2、量表列中选到右边,并请注意选中下方的display frequency table复选框(要求显示频数分布表)。如果您只要求得到一个频数分布表,那么就可以点ok按钮了。如果您想同时获得一些统计量,及统计图表,还需要进一步设置。精品. statistics选项单击statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下:()在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,spss提供的选项有:l quartiles四分位数,即显示25%、50%、75%的百分位数。l cut points equal 把数据平均分为几份。如本例中要求平均分为

3、3份。l percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。() 在定义输出集中趋势(central tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有:l mean 算术平均数l median 中数l mode 众数l sum 算术和()在定义输出离散统计量(dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有:l std. deviation 标准差l variance 方差l range 全距l minimum 最小值l maximum 最大值l s.e. mean 平均数的标准误()描述数据分布

4、(distribution)的统计量l skewness 偏度,非对称分布指数。l kurtosis 峰度,case围绕中心点的扩展程度。另外,频数过程(frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。精品. 图2-4:次数分布统计量定义窗口 图2-5:次数分布图形定义窗口在本例中,我们选择输出:四分位点的值,平均分为3等分的分位点的值和15,50,85的分位点的值;对于集中趋势的度量,选择输出算术平均数、中数、

5、众数和总和,对于离散程度的度量选择输出标准差和方差。charts选项为了获得统计图表,单击主对话框中的charts铵钮,打开它的对话框,如图2-5所示。用户可以在图形类型(chart type)选择框中定义输出的图形类型,频数(frequence)过程可以提供的输出选项有:l none 不显示图表l bar charts 条形图l pie charts 圆形图 l histograms 直方图另外,对于图形中纵坐标值的表示,可以有两种方式:l frequencies 纵座标为变量值的频数l percentages 纵座标为变量值的百分比在本例中,由于学生成绩可以看成是连续性的数据,所以这里选择

6、输出直方图,并拟合正态曲线。点击continue返回主对话框。 format选项单击format,打开format对话框,如图2-6所示。在该对话框,可以选择数据输出显示的顺序(order by),frequencies提供的选项有:l ascending values 在输出频数分布表时按变量值升序排列l descending values 在输出频数分布表时按变量值降序排列l ascending counts 输出频数分布表时按变量值频数的升序排列精品.l descending counts 输出频数表时按变量值频数的降序排列 图2-6:定义输出显示格式对话框 在format中我们一律使用

7、默认选项。点击continue返回主对话框,在主对话框中点击ok,可以得到次数分布的输出结果。(2)结果及解释学生成绩变量的frequences输出描述统计结果: 输出说明:l n 后面的valid和missing分别用来描述有效值样本容量和缺失值的样本个数,在本例所用数据中,有100个有效数字,缺失值的个数为0。l mean、median、mode 和sum分别用来描述算术平均数、中数、众数和数据的总和,本例所用数据的算术平均数为79.680,中数为79.75,众数为80,数据总和为7968.0。l std. deviation和variance分别用来描述数据的标准差和方差,这里数据的标准

8、差为7.026,方差为49.371。精品.l percentiles后给出不同的百分位数对应的值,如15后面的数字72.075表示,15的分位点的值为72.075,即小于72.075分的人数占总人数的15。(表中有两个无穷循环小数,是我们自定义的三等分的百分位数) 学生成绩的频数分布表: scorefrequencypercentvalid percentcumulative percentvalid62.011.01.01.065.011.01.02.066.011.01.03.067.011.01.04.068.011.01.05.068.511.01.06.069.011.01.07.0

9、70.011.01.08.070.511.01.09.071.033.03.012.071.511.01.013.072.022.02.015.072.511.01.016.073.022.02.018.073.522.02.020.074.022.02.022.074.522.02.024.075.033.03.027.075.522.02.029.076.033.03.032.076.522.02.034.077.022.02.036.077.522.02.038.078.033.03.041.078.522.02.043.0精品.79.044.04.047.079.533.03.050.

10、080.055.05.055.080.533.03.058.081.033.03.061.081.522.02.063.082.033.03.066.082.522.02.068.083.044.04.072.083.522.02.074.084.033.03.077.084.511.01.078.085.011.01.079.085.511.01.080.086.033.03.083.086.511.01.084.087.022.02.086.087.511.01.087.088.011.01.088.088.511.01.089.089.022.02.091.089.511.01.092.

11、090.011.01.093.090.511.01.094.091.011.01.095.092.511.01.096.093.011.01.097.094.011.01.098.096.011.01.099.098.011.01.0100.0total100100.0100.0在输出的频数分布表中,第一列给出数据中出现的不同数值;第二列给出该数值对应的频数(精品.frequency);第三列给出对应数据在总数据中所占的百分比(percent);第四列给出有效百分比(valid percent)即去除缺失值后的百分比,由于在此例中不含有缺失值所以该列数据与第三列相同;最后一列给出累加百分比(c

12、umulative percent)。如数据70,对应的频数为1,表示在这组数据中70出现了1次,所占比例和有效百分比都是1,累计百分比8表示小于等于70的人数占总人数的8。2.descriptives仍以上面所用数据为例,简单说明另外一种常用的输出描述统计量的过程descriptive。打开数据文件“2-6-1.sav”,(1)操作单击主菜单analyze /descriptive statistics / descriptives,打开主对话框如图2-7所示:图27:descriptives定义窗口 将左边变量表列中的class、sex和scores变量选到右边的变量表列(variable

13、(s))中。注意选中下方save standardized values as variables复选框,即要求把该变量值的标准分存为一变量,并在数据窗口中显示(请注意在执行完操作后自行查看结果,新生成的变量名称分别为zclass、zsex和zscore)。精品. 图28:descriptives的options窗口options选项单击options按钮,打开描述统计过程的选择输出对话框(descriptives:options),设置如图2-8所示: 请注意,这里所给出的一些统计量,与在frequencies 中所给的相差无几。所以,当我们需要用到这些描述统计量的时候,可以不受一种特殊方法

14、的限制。在此不再对这些统计量作过多说明,如有不解之处,请参阅frequencies部分。 在图28的下方,提供了有关输出显示顺序(display order)的定义框:l variable list 变量表列中变量的排列顺序为数据窗口中的顺序l alphabetic 按字母顺序l ascending means 按平均数的升序排列l descending means 按平均数的降序排列定义完成后,点击continue,返回主对话框,点击ok,可以得到的输出结果。(2)结果及解释 descriptive statisticsnrangeminimummaximumsummeanstd. devi

15、ationvariancestatisticstatisticstatisticstatisticstatisticstatisticstd. errorstatisticstatisticclass1002.001.003.00205.002.05008.087e-02.8087.654精品.sex10010148.485.02e-02.50.252score10036.062.098.07968.079.680.7037.02649.371valid n (listwise)100结果解释:上表分别给出三个变量(class,sex和score)的样本容量、全距、最小值、最大值、和、均值、标

16、准误、标准差和方差。如对于学生分数(score)对应一行的输出结果显示:该组数据所含样本容量为100(n=100),最高分与最低分的差为36,即全距为36(range=36)、最低分数为62分,即最小值为62(minimum62);最高分数为98分,即最大值为98(maximum98);100个学生分数总和为7968(sum=7968);平均分79.68分(mean=79.68),标准误为0.703(std. error0.703)、标准差为7.026(std. deviation7.026)和方差为49.371(variance=49.371)。 再返回数据编辑(data editor)窗口

17、,数据中多了三列数据分别命名为zclass,zsex和zscore,对应于三个变量的标准分数。3.求分组平均数(means命令)有时我们常常需要求不同组的平均数和标准差,如对于上面所描述的资料,研究者往往预了解三个班级每个班学生的平均学习成绩等信息。spss提供了用于描述分组数据描述统计量的过程-means,下面仍用上面的数据介绍这一过程的具体应用。(1)操作打开数据文件“2-6-1.sav”,单击主菜单analyze / compare means / means,打开means对话框,将score选入右边的dependent list对话框,将class选入右边的independent l

18、ist对话框。如下图2-9所示: 精品. 图2-9 :means语句主对话框 图2-10 :means的options窗口我们的目的在于计算不同班级学生的平均成绩和标准差。options选项在主对话框单击options按钮,打开选择(options)输出对话框如图2-10所示: 左面是统计量表列,包含一些常用的统计量,我们在frequencies 与descriptives中做过说明,在此从略。右边三项:l mean 平均数l number of cases 样本容量l standard deviation 标准差是默认的统计量,如果需要计算其他的统计量,可以将左侧统计量选入右侧。这里我们采用默认的选项。点击continue返回主对话框,然后点击ok,得到最后的统计结果。 (2)结果及解释 所用case 的情况 包括有效值与缺失值的实际数目及所占百分比。 case processing summarycasesincludedexcludedtotalnpercentnpercentnpercentscore * class100100.0%0.0%100100.0%上面输出结果表明,在分析的100个数据中,有效数据100个,排除在分析之外的数据个数为零,说明在分析的这一组数据中不含有缺失数据。精品. 结果报告表:各班的平均数、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论