利用SPSS进行统计描述_第1页
利用SPSS进行统计描述_第2页
利用SPSS进行统计描述_第3页
利用SPSS进行统计描述_第4页
利用SPSS进行统计描述_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三节利用SPSS进行统计描述二匚一、统计描述方法在教育技术研究过程中收集到大量的资料数据,但从这些杂乱无章的资料中,很难对其总 体水平与分布状况做出评价判断。因此,必须采用一些适当的方法对这些资料进行处理,使之 简约化、分类化、系统化,从中发现它们的分布规律,掌握总体的特征,以便对其水平做岀客 观的评价。统计描述方法,是研究简缩数据并描述这些数据的统计方法。将搜集来的大量数据资料, 加以整理、归纳和分组,简缩成易于处理和便于理解的形式,并计算所得数据的各种统计量, 如平均数、标准差、以及描述有关事物或现象的分布情况、波动范围和相关程度等,以揭示其 特点和规律。(一)数据资料的整理和表示在教育

2、技术研究中,我们用各种方法搜集来的资料,一般是零散的,它只反映个别现象的 个别特征,必须经过整理加工,使之系统化,才能计算统计指标,进行统计分析,为进一步研 究提供有用的信息,首先要进行的是统计整理,它包含以下几部分内容:1 数据检查主要检查数据的完整性与正确性。统计资料完整性的检查,就是要根据调查项目检查是否 填写齐全,避免遗漏,删去重复。正确性检查,就是检查搜集的资料是否真实可靠。特别是统 计数字的真实性是统计工作的生命,统计资料的检查整理必须抓紧这一环。数据检查可分为逻辑检查和计算检查两种方法。逻辑检查,是从理论和一般常识上来检查 资料内容是否合理,指标之间是否矛盾。计算检查是检查统计数

3、字在计算方法和计算结果上有 否错误。2数据分类数据分类就是把搜集来的数据进行分组归类。数据分类要做到既不重复、不遗漏,又不混 淆,一般又可分为品质分类和数量分类。品质分类:是按事物性质划分为不同的组别、种类。如以性别为标志可分为男与女;按 解能力”、学习态度”等为标志,又可分为好、较好、一般、差等几种水平,每种水平可看成类, 每一类可给以相当的数量。可以通过各类所包含的数据再进行数量化的比较和分析。数量分类:是按数量的属性分类。有顺序排列法、等级排列法和次数分布法等。3.数据的排序数据排序:将各数据从大到小或从小到大进行排列。这样就可以看岀最高分和最低分是多 少,各分数岀现的次数和位于中间的是

4、什么数等。包括等级排列和次数排序。等级排列:即根据顺序排列划分等级。但与顺序排列不同,它是按数值所含的意义确定的。 若是学习成绩,应以数值大的排为第一等级;若是反映时间,则将最小的数值排为第一等级。次数排序:即根据在指定的数值范围内,数据岀现的频数大小排序。4. 数据统计表就是把所研究的教育技术现象和过程的数字资料,以简明的表格形式表现岀来。它可以避 免文字的冗长叙述,便于比较各项目之间的相互关系,便于总计、平均和其他统计值的计算, 便于检查计算错误和项目遗漏。5. 数据的图示法数据的图示法是利用几何图形或其他图形等的描绘,把所研究对象的特征、内部结构、相 互关系和对比情况等方面的数据资料,绘

5、制成整齐简明的图形。它是用以说明研究对象和过程 的量与量之间对比关系的一种方法。它能准确地表现统计资料,有助于对统计资料进行比较、 对照、分析和研究。图示法,具有直观、形象,便于记忆和思考以及表达语言难以说清的内容 之优点。在教育技术研究中常用的有条形图、曲线图、直方图和圆形图等,其绘制方法是大家所熟 知的,这里不作介绍。(二)特征参数的计算为了分析研究对象总体的特征,不必对总体中每一个单位都进行研究。而是通过抽样方法, 按照随机性原则,从全部对象中,只抽取部分单位(样本组)加以研究,对于每组样本,首先 应对其基本特征参数进行计算,以给岀整体特征的统计描述。并根据统计数据,对总体对象作 岀具有

6、一定可靠程度的估计和推测。常用的特征参数包括:1.集中量数(1)算术平均数,用:表示,设,;-'- 二为各次观察的结果,则有:H龙 4- ZI +Xp ? XlMdn(2) 中数,是指一组按大小顺序排列起来的量数中的中间点的数,又称中位数,用 来表示。(3) 众数,是指一列数中出现次数最多的数值,常用M表示。2差异量数差异量数是表示量数之间的差异程度的一些统计量的总称,它是用以表示一群量数的离散情况或离中趋势。集中量数在量尺上是一个点,表示各量数所在的位置。差异量数在量尺上是一段距离,表 示一个量数与另一个量数或中心点之间的距离。只有知道了差异量数的大小,才能了解集中量 数的代表性如何

7、。差异量数愈大,集中量数的代表性愈小;差异量数愈小,则集中量数的代表 性愈大。在统计分析中经常应用的是标准差, 它是与平均数的差数的平方和的平均数的算术平方根。上式中,S为标准差1一*=,为每个学生的得分与平均分的离差,上述公式计算步骤如下:(1 )先求岀各数据与平均分的离差|:"(2) 求各个离差的平方和 一 ;(3) 将二;除以n再开方,即得标准差。3.标准分数标准分数,又称Z分数。是以标准差为单位表示一个分数在团体分数中所处的位置。标准分数的计算公式:公式中x 原始分数,:平均分数,S 标准差(三) 次数分布次数分布又称次数分配。是指总体或样本按随机变量(数据)大小次序在岀现频

8、率上的排列。一般采用次数分布表、次数分布直方图或次数分布曲线来表示。【例6-1】 现有50名学生的成绩,原始数据如表6-1所示:(n=50)1炉11弘21炉3137-'412金1257"2292.'32伽4254 卍39313妙238施33妙4393*4妙14弧M松剤*447舁57扣15妙25(5 头356'459(k'6炉16册26血耶如4fi阶7E1775*2773-'3784斗 777"89818伽贺现43鸟,、珈也7和曲施3994*'4?10772DC7P3074407升5Q妙1 次数分布表为了显示该组样本在不同分数段

9、中的次数分布情况,我们对该数组进行次数分布统计,编 制岀该数组的次数分布表。方法如下:(1) 求全距:最大数最小数 =98 51=47(2) 定组数,一般10 20组为宜。(3) 定组距,组距=(全距+1) /组数=(47+1) /10=4.7(取5)(4) 定组限,95-100,90-95,85-90 等(5) 求组中值:组中值=(上限+下限)/2,女口 95-100 一组,其组中值=(100+95) /2=97.5(6)归类 把原始数据,分别归到相关组中,得岀次数分布表如表6-2所示:1组别卫绸中 1BC¥c)-积富百分比M)05-100*97.55MP "2如卿S&g

10、t;1皿185-50875畑4Vso42 58J3却75-80|77.5昏利笳门72知3錚并和1和血帥如佩加4#&5$ 6057 53p1250-5552眉244计w5血2W6 2孜毅勇新衷*2.次数分布曲线根据这个次数分布表,可绘岀对应的次数分布直方图、次数分布曲线和积累次数曲线,分 别如图6-8、图6-9和图6-10所示。为了分析次数分布曲线的特征,我们可以把它与正态分布曲 线相比较来进行研究。图6-8次数分布直方图*3.正态分布曲线正态分布是一种理论分布,在次数分布中,中间的次数多,由中间往两边的次数逐渐减少, 且两边的次数多少是相等的。根据正态分布绘成的曲线称为正态分布曲线,正

11、态分布曲线形状 如钟形,它的特点是中间成一高峰,由高峰向两侧逐渐下降,先向内弯,后向外弯,降低的速 度是先慢后快,以后又再次减慢,最后达到接近底线,但永远不与底线相接,形成一个单峰的 对称的钟形形态,如图 6-11所示。正态分布曲线的形状和位置由平均分1-和标准差S所决定。平均分:对应于单峰位置,元越大,曲线越往右移动。标准差S越大,曲线的单峰高度越低,宽度越大,显得越 胖” S越小,曲线的高度越高,宽度越小,显得越瘦”如图6-5所示。5= 1 节=LL 3939(C)圖录11不同形式的正态曲掛,在正态分布曲线图上,正态曲线以下,以S为距离单位所包括的面积是按一定比例分配的,若将正态曲线底边从

12、-3S到3S分成四等分,每等分距离为1.5S,则每距离间隔之间所包括的面积比例如表6-3和图6-12所示。区闾换区阖面祝比例J】4埠413*昭一1.5的6佻p利用正态分布曲线这些性质,我们可以得到划分不同学习水平等级的界限和学生人数比例的理论数值。例如对于常态! =75,S=10的情况,其优、良、中、差各等级的分数范围和人数比例应如表6-4所示(N = 30)按照上述方法,对于一个给定的样本组6-4當态(7=75. 10, J30)时各等级分费范圉导人魏比例.区间范卧分魏范围-人数比例< y+i w以上卩«0分以上“押X6族2,7590分之頂kZM3.3-13中/1(牙叫之间存

13、6070分之间AM 33滋1弘(PT,以下"60分以下Q耕6,6滋加0,得知其平均分'=83,标准差S=7.78,我们便可以得到学习水平等级的划分界线,并将人数 比例的理论数和实际数相比较,如表6-5所示。豪丘,当疋=8头炉7誥*30聘各等级分贵范囤与人数出例理论人数比例,买际人厮优(T+1.M 以上a翼.7分以上"2卩乔(瓷H対之阖»葩分之间1%中厂(XT.5G-J?之间,71 3M3分之丽知差(片叫旳以G7】.3以下卫2"根据图6-12和表6-4,我们便可以得到如下结论:(1)样本组的峰值位置位于二d的右侧,属于正偏态的情况。(2) 样本组的

14、水平等级标准较高,分数要在94.7以上才能达到优等,而在71.3以下便认为是差等。(3)样本组中优、良等级的实际人数(1+17)要比理论数(15人)所占的比例为多。因此可以认为该总体属于平均水平较高的整体。二、-S 平面特征数据分析模型为了综合地、直观地考察样本组的整体统计特征,我们给岀一个1 -S平面分析模型,如图6-13。模型中的横坐标表示平均分的大小(丄丄),而纵坐标则表示标准差(S)的大小,坐标原点以常态作参考标准('=75, S= 10)。用:、S两个参数,可以确定样本组落在平面的某一个象限,而不同的象限,将代表样本组具有不同的统计特征。为了说明各象限所代表的意义,表6-6给

15、出了四组不同特征的数组,它们将分别位于不同的象限, 具有不同的特点。利用平均分1-和标准差S所在的位置,我们可以直观地看到样本组成绩的统计特征。6-13无$平面分析模型心四粗舄有不同特证的敦数醉X"统HWp对应Hi在57, PO, 95, 50.拇-呼規水平高,旦分葛匿嘉一鞋鬼门45,45, 35,勿用257*平均水平低.且分禹屢 大*存往高分生/第二繚盼52平均水平底.且毎中.舷當状态护100, 90魁策外1平均水平高.且第中. 恳就良狀态*-莉3掠限'【例6-2】某班语文平均考试成绩为 74分,标准差8分。甲学生得90分,乙学生为72分 通过标准分数的计算可以得知他们在全

16、体同学中所岀的位置。9D - 74V=-0.5(1)平均分32+82+34302490w(2)标准差按照求S步骤进行计算,可得到= 1819,代入公式(10-2)便可得到标准差 S对于这一组数据,由于:=83>75,S=7.78v 10,它处于第四象限,属于平均水平较高,且相对集中的水平三、利用SPSS进行统计特征分析【例6-3】 现有学生24人,分成两小组,在某一次期中测验中,某学科测验成绩如表6-7所示。试利用SPSS对该班学生成绩进行等级排序,并计算总平均分、总标准差,再分别计算两组学生的平均分和标准差。根据处理结果,分析两组学生成绩的统计特征。1 】ST*1322 1142311

17、52狈,4i叫t2514打172 1LB27i缚2s20 29i312炉ioi忆22 282u】23283*12i4知.'184 <震I EPSS表的敢知操作步骤:1. 录入数据录入数据的过程分为两个步骤,一是定义变量,二是录入变量值。(1)定义变量: 学号” 组别”与 成绩”(2)录入变量值:在数据编辑窗口中,按照表 1的内容,将各变量值一一录入。录入后的 部分界面如图6-14所示。学号姐别|成锁|11.001.0087.0022 001 0082 0033.00i.ao79.0044.00tm90.0055.001.0042.0066.001.0078.0077.001.00

18、80.008B.OO1.00ei roo99 00tool04.001010 00too90 001111.00rooas. ao1212.00L0045.001313 000092 001414.00zooao.oo1515.00zoo89.0016E.OO2.0o18E.001717.002 0081.001818.002.0090.0016-14录入数据后的界面2. 数据的等级排序(1)选择“DataTSort Cases命令,弹出“Sort Cases对话框,把 成绩"变量选入“Sort by中, 并在Sort Order中选择“Descending(降序)"选项,

19、将学生成绩按降序排列,如图 6-15所示,单 击“0K按钮。空515 Sort Cum 冇话IS(2 )排序结果排序结果在数据编辑窗口可以即时浏览,如图6-16所示,并可以通过选择“File -Print命令,将结果打印输出。学号组別成绩15.001.0042.0021W-15.0036.001.0078.00420.002 0078.0053.001.0079.00B19.002.0079.0077 .CO1.0080.00314.002 0080.00922.002.0080.00108.001 00si no 1117.002.0081.00| 122.001 0082.QD1323.0

20、02.D083.00149.001 0064.001524.002.0084.001621 .CO2.0085.001716.002 0086.00131 001 0087.004图6-16排序箱果的浏览3. 平均分与标准差的计算(1 )计算总平均分与标准差 选择 “AnalyzeDescripitive StatisticDescripitiv命令,弾出 “Descripitive 对话框,从左侧将 成绩"变量选入"Variables栏中,如图6-17所示。E 6-1T对话框,单击“OK按钮,提交运行,输出结果如表6-8所示。袤A3錮出结果DescriptiveNMirw

21、numMaxmumMeanStd. DeviationValid N (listwiseJ242442.0092,0080,583312,2197 '(2 )分别计算两组学生的平均分和标准差由于录入数据时两组数据是混合一列,所以在统计之前要将两组学生的数据拆分,在进行 统计处理数据拆分选择“DataSplit File 命令,弹出“Split File对话框,激活 “Organize by group选项,从左 侧选择 性另变量进入 “Groups Based on栏目,最后激活 “Sort the file by grouping variables选项, 如图6-18所示。单击“O

22、K按钮。国阳对话框=与计算总平均分与标准差相同,选择“Analyze Descripitive StatisticDescripitive命令,弹出“Descriptive对话框,从左侧将成绩"变量选入“Variables栏中。如图6-17所示。单击“OK按钮,提交运行,输出结果如表6-9所示。Descriptive Statistics*tJMriirnumMakirnurriMeanSTH. DeviationVidN (fctwise)121242.0090.0077.2SOO16.532Sa-組别三l.ODDe script ive Statistics3MriilTMTiM

23、ixrnMeanStd. DeviationVM N (Bitwise)12127S,00立0。S3r91674,6015乳组别 ZOO4. 统计特征分析根据SPSS的统计处理所得结果如表 6-10所示6-10统计特征分析4组别卫S对在Q 平面象陆全体同学Q80.583312 2187心平均水平高,但分离度 大,存在低分生枳第一象限*第一组卫77.2500163325平均水平高,但分离度 大.存在低分生心第一象限*第二组卩83.91(574.601却平均水平高,且集中, 属优良状态心第四象限J四、次数分布表的形成【例6-4】根据表6-1中给出的50名学生的学习成绩,计算60分以下,60-70,

24、70-80,80-90,90分以上的次数分布表。操作步骤:1 录入数据定义变量学号”和成绩”并按表3内容输入数据2转换数据,生成新变量(1) 选择 “Transform TRecodAlnto Different Varibles 命令,弹出“Recode into DifferentVariables对话框,将 成绩"选入“ Numeric Variable框中,并在“ Output Variable中输入新变量的名字 分组”单击框后的“Change按钮,如图6-19所示019鹑拥想循*(2) 单击 “Old and New Values 按钮,弹出 “Recode into Di

25、fferent Variables:Old and New Values对话框。在对话框中左侧第二个“Range框中输入60,然后在“New Value'框中的“Value后输入1,单击“Add'按钮,右侧的文本框中显示“Lowest thru 60宀1"表示用1代表60以下的分数。在第一个“Range框中输入“60" though “70然后在“Value后输入2,单击“Add按钮加入, 即用2代表60到70之间的分数。同样,用 3代表70到80之间的分数,用4代表80到90之 间的分数。在第三个“Range框中输入“90;然后在“New Value&qu

26、ot;框中的“Value后输入5,单击“Add'按 钮加入,即用5代表90以上的分数。设置完成后如图6-20所示。E6-20 1A1 “炖"妞屮(3) 单击“Continue按钮,回到图11的对话框中,单击 “0K按钮,生成新的变量 分组” 界面如图6-21所示。|学号成绩I分组11.0082.004.0022.0058 001.0033.0093.005.0044 0089.004.0055.0072.003.006B.0065.004.0017.0097.005.0088.0098.005.0099.005B.001.001010.0077.003.001111.007B.D03.D01212.0057.001 001313.0080.003.00)6-21生咸新的费量“分组"心3.统计分析(1)选择 “AnalyzeDescriptive StatisticTFrequen命令,"弹出 “Frequencies对话框,从左侧选择 分组”,使其进入“Variable(s)框中,如图6-22所示。图&-22理啊

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论