版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲研究资料分析的SPSS基础一、心理与教育统计学的基本概念二、SPSS软件简介及数据文件的建立与编辑事物的运动、变化都是多因素作用的结果,这些因素中的有些变化是有确定性的,其对事物的影响也具有确定性,使事物运动表现出必然趋势;有些变化是有随机性的,其对事物的影响具有随机性,使事物运动变化出现不确定性,让人“琢磨不透”。一定条件下,对事物作观察时会出现多种可能的结果,这种现象叫随机现象或随机事件。所有事物的运动变化都是必然性与偶然性的统一,其中的必然性叫“规律”,偶然性则恰恰要掩盖这个“规律”。如果对事物影响的不确定性因素及其作用增大,事物的运动变化就会具有更大的偶然性,必须对其进行较长期、较多次的观察和统计,才能从其随机变化中发现“规律”,这样发现的规律故叫“统计规律”。(一)统计规律与统计方法一、心理与教育统计学的基本概念当事物变化的偶然性达到一定程度,个案研究就变得不可靠了,必须对事物进行多次观察和统计,或对一类事物中的“大量”个案进行观察和统计,这样做的目的就是让人们看到事物运动变化中各种状态发生的相对次数,这些相对次数反映了事物各种状态出现的可能性大小,叫概率。从这些概率中我们就可以发现事物运动的规律,即“统计规律”。根据事物运动的概率(probability)描述或推断事物运动规律的方法就叫概率论(probabilitytheory),也叫统计学(statistics)。概率论或统计学属于数学,将其应用到某一具体研究领域时,就形成了应用统计学。“心理统计学”就属于应用统计学,它可以帮助我们从能观察和测量得到的人们的心理(mind)或行为(behavior)推断出人的心理活动规律。发现“统计规律”需要“统计方法”数据的统计分析方法,是教育科学工作者常用的基本技能心理学研究中经常出现理论与实证研究之争、定性与定量研究之争、大样本与个案研究之争,其实争论的双方都略显偏颇!只要承认人的心理现象是具有必然性和随机性的,一切问题就容易理解,一切问题就迎刃而解了:1.人受“信念”和“欲望”双重系统的驱动,受“理论”指导,心理学家的行为能离开理论吗?但理论也不能自说自话,必须“言之有物”;2.人的心理具有不确定性,需要借助“统计学”来发现规律;3.人的心理具有确定性吗?如果有,心理学家就应该学习“自然科学家”的严谨;如果没有,心理学和心理学家还要存在吗?!明智的心理学家最好不要去否定其他心理学家的方法和贡献,而应更多地在他自己擅长的领域中尽力劳作而有所贡献足矣!悦纳而不是敬畏“统计学”(二)统计学分析的对象统计学分析的对象是数字化资料,而这些数字化资料是采用某些手段测量得到的事物的属性值或特征值。因为事物所受影响因素的复杂性和随机性,事物的属性值和特征值在测量中常常存在偏差。要想认清事物的特征及其规律,必须首先认清误差及其规律,从某种意义上说,统计学是分析误差规律的科学,而且主要是分析随机误差规律的科学。所以,在统计学中,对测量对象的特征、规律进行任何描述和推断的过程中,几乎都是依赖于对测量误差的估计与分析——即依赖于方差、标准差的估计与分析。显然,统计学研究的是事物可变的属性,可变的事物的属性叫做变量,变量的本质与变化方式不同,测量得到的数据性质也不同,统计学也就以不同的方式对这些数据进行分析。
变量(variable):在数量上或性质上可以发生改变的事物的属性。根据数据的来源来分,数据有“计数的”和“测量的”两大类。
根据量化水平和测量变量本身变化的属性来分,主要包括:类别变量(只对事物作定性区分)、顺序变量、等距变量、比例变量。四类变量在反映事物变化的信息量上是不同的,即对事物属性的量化水平不同。1.类别变量也叫称名变量。使用这种变量只能反映事物属性的性质变化,所以观测这类变量得到的数据只能用来区分事物的类别,不能用于算术运算,与t检验、F检验、积差相关和等级相关等相联系的分析都不适应于此类资料。如性别、籍贯、专业、学校等变量都是类别变量。2.顺序变量
也叫等级变量。使用这种变量能反映事物属性变化的某种顺序或所处等级的高低,但由于观测中没有使用相等的单位和零点,这类变量得到的数据只能用来确定事物的顺序关系或等级关系,一般不用于算术运算,与t检验、F检验、积差相关等相联系的分析都不适用于此类资料。如成绩等级、年级、家长文化程度等变量都是顺序变量。3.等距变量
由于制定或规定了相等的单位,在对事物属性的变化测量时,不仅能反映它们的顺序或等级,还能反映它们之间的距离,这类变量就叫做等距变量。等距变量没有绝对零点,所以不能计算变量的绝对大小、不能计算变量值的比例关系,但可以作加减运算。如智商、气温等。4.等比变量
也叫比率变量。由于使用了相等单位和绝对零点,这类变量能反映事物属性绝对大小的变化,测量得到的数据不仅能反映等级、顺序,也能反映事物之间的某种比例关系。如体重、反应时间、饮食量等。变量还可以划分为两大类:离散变量与连续变量。一般,类别变量、顺序变量的测量得到的是离散数据,等距变量、比例变量测量得到的是连续数据。离散变量:其取值是孤立、间断的,它可能的取值数目是有限的;连续变量:其可能的取值是可以连续变化的,即在任何两个取值之间都还包含有无穷多种可能的取值。(三)教育统计学的基本内容如果依据其功能,统计学包括三大方面的内容:(1)描述性统计:研究如何整理、简缩数据,包括使用统计图表或统计量数概括数据的分布特征;(2)推断统计:研究如何由对局部的观察结果去把握或估计总体的真实情况,包括参数估计和假设检验两方面;(3)实验设计:研究如何抽取被试和配置被试、如何控制实验条件、如何获取和分析数据等(这方面内容其实是统计学的应用,即利用事物的统计规律来考虑研究方案)。(四)总体和样本1.总体、个案和样本2.总体参数与样本统计量
不管是总体,还是样本,都有对其进行描述的一系列特征。如果对总体中每一个体的这些特征进行测量,就可得到一个或多个特征值,这些值可真实反映总体特征,故叫总体参数(parameter);如果对样本中每一个体进行测量,也会得到一个或多个特征值,这些特征值并不是总体的真实值,只是从部分个体中得到的统计值,故叫统计量(statistic)。
总体(population):某一观测目标包括的所有对象;个体、个案(case):总体中每一独立的观测对象或观测值;
样本(sample):来自总体的拟作为总体代表的部分观测对象。
直接对总体的参数进行测量,在许多时候是不可能的,而常常能做的就是测量样本的统计量,然后由样本统计量来了解总体。但是,抽样过程存在许多偶然性的影响因素,这些偶然因素却必然会带来样本与总体之间出现偏差,即抽样误差。
研究对象的总体包括大量个体,个体数用N表示;用来作为总体代表的样本包含较少的个体,个体数用n表示。从总体中抽取少数个体组成样本的过程叫做抽样(sampling)。
统计量与参数的差异量叫抽样误差(samplingerror)。
可是实际研究中,总体参数是难以获得的,我们常常能够在测量中得到的是样本统计量,这一统计量究竟与总体参数有多大的差异也就难以得到。我们只能从随机事件中去进行估计,如何估计呢?可以想象,如果每一次抽样都得到相同的统计量,说明抽样中并不存在偏差;如果每一次抽样得到的统计量起伏变化很大,说明抽样偏差很大。很明显,用统计量的变异量可以估计抽样偏差的大小,如使用标准误SE。标准误又由何而来呢?
再想象,如果总体中个体同质性高,标准误会比较小,反之标准误就会大。所以标准误的估计可从个体间的同质性来完成,而个体同质性又如何估计呢?抽取来的样本测量值的标准差担负这一责任,即标准误的估计值等于样本标准差除以样本容量的平方根。3.实用的随机抽样方法简单随机抽样:就是直接从总体N个单位中抽取n个单位构成一个样本。操作方法有抽签或随机数表法。其优点是简单易行,缺点是需要对各个单位进行编号,比较费时,而且在抽取的样本比较小时抽样误差比较大。举例:现要从100名大学生中抽取20名被试参加实验。请使用随机数表完成此抽样。先将100名学生编成00~99号,然后从随机数表中随意划出一块,再从该部分的开始按顺序往后找,以后两位数为准,遇到有对应的号码就选为被试,直到选够为止。我们按此方法抽到下列编号的被试:1242610640188159785539166829707223918751
返回目录系统随机抽样:是先将总体各单位按某一标志顺序排列编上序号,然后用总体单位数除以样本单位数求得取样间隔,最后根据取样间隔作等距取样。这种抽样更简单易行和准确,但是如果总体存在周期性变化或波动则不能使用此法。分层随机抽样:是将总体各单位按某一标准分为若干类型(即层),然后根据类型单位数与总体单位数之比率,确定从各类型中抽取样本单位的数量,最后按随机原则从各类型中抽取样本。比如研究大学生的学习风格类型及其分布,就需进行分层随机抽样,可以按不同类型的学校、不同专业、不同年级等作为标准进行分层。返回目录整群随机抽样:是先将总体各单位按某一标准分成若干群,然后按随机原则从这些群中随机抽取若干群作为样本。也就是说,这种随机取样每次抽取的不是一个个体,而是一个群体,群体间的差异性可能是一个重要的误差源。便利抽样(conveniencesampling):是一种非概率性的抽样方法,也是心理学研究中最常用的抽样方法。在便利抽样中,研究者只使用那些容易得到的个体作被试,被选的必须是那些找得到的、乐于参加研究的。便利抽样被看作是一种比较弱的抽样方法,因为研究者不试图去了解总体,在选择被试时也不使用随机过程,对样本的代表性很少控制,所以得到有偏样本的可能性很大。
返回目录
SPSS是StatisticsPackageforSocialScience的英文缩写,为国际上最著名和使用最广泛的统计分析软件,也是教育学、心理学研究中最有效的资料分析工具。SPSS的统计分析功能十分强大,能完成许多种简单与复杂的资料分析过程。我们在教学中把握这样的指导思想:总体上了解SPSS的结构框架和基本过程;熟练地掌握心理学研究中最为常用的一些描述性统计分析过程(包括常用统计图表的制作)、平均数差异检验、相关分析和因子分析、常用非参数检验等;适当了解其他一些更为复杂的SPSS分析过程;介绍一些技巧性的使用SPSS进行有关资料分析的方法。教学中,更多的是从心理学研究实例及设计模式出发,介绍切实可用的资料分析方法和步骤。二、SPSS软件简介及数据文件的建立与编辑
SPSS最初是由斯坦福大学的三名大学生于1968年开发的统计软件分析系统,并基于该系统于1975年在芝加哥合作成立了SPSS公司。该公司不断地对统计分析软件进行改进,先后出现至少8个版本,最新版本大概是SPSSV12.5。
SPSS公司在90年代连续收购了多家同类公司后由原来单一统计产品的开发与销售向企业、教育科研及政府机构提供全面信息统计决策支持服务,成为走在了最新流行的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司,公司最近决定将其英文全称更改为StatisticsProductandServiceSolutions,意为“统计产品与服务解决方案”。返回SPSS软件操作的三个基本窗口数据文件是SPSS分析过程的基本对象,它要根据具体研究的性质和模式、统计分析的目标和手段,将研究过程中的被试因素、控制的或操纵的变量、记录的关于被试的心理或行为的观察资料即因变量三方面的信息按照特定的格式录制成数据文件,变量的记录方式尽可能数字化。数据文件都是由列变量(准自变量或机体变量、控制变量、观测变量)与个案行组成的数据矩阵,就是说,数据表中每一列反映一个变量(variable)的值,每一行反映一个案(case)的特征或各种观测值。变量排列中,一般将控制或分组变量排在左(层次越高越靠左),它反映个案的固有特征或接受观测、实验处理的条件。(一)
数据录入方式自由(free)格式句法(syntax)方式固定(fixed)格式句法(syntax)方式数据表格操作方式其他系统数据转入方式数据文件形成后还可根据需要进行多种编辑和变换自由格式句法方式输入数据举例为了考察简单反应时间的通道效应,某心理学工作者抽取男大学生20名,再随机分成相等的两组参加,分别参加光刺激、声刺激反应时间的测试,得到表1-1所示的结果。首先分析这一研究模式中,有多少不同的变量参与分析:一个刺激变量,包括两个水平,可以用S表示;一个反应变量,包括20个被试的观测值,可以用RT表示。然后调用SPSS的句法文件窗口,编写可运行语句。DATALISTFREE/SRT.BEGINDATA.11801165117812001203118911901186117012002165214221502180218521532190213721622130ENDDATA.在SPSS句法文件窗口中写入如左边所示的语句并运行即可得到该研究统计分析所需要的数据文件。程序及其运行演示返回固定格式句法方式输入数据举例还使用刚才的实例,我们改用固定格式的句法文件完成数据录入:打开句法文件窗口、书写固定格式数据输入程序。DATALISTFIXED/S1RT2-4.BEGINDATA.11801165117812001203118911901186117012002165214221502180218521532190213721622130ENDDATA.在SPSS句法文件窗口中写入如左边所示的语句并运行即可得到该研究统计分析所需要的数据文件。程序及其运行演示返回固定格式输入数据的便利之处在大样本、多变量问卷调查中,采用固定格式建立数据文件要比其他方式更便利,它可以节省很多次的击键操作。
举例:某研究者想探明江苏省不同地区、不同学校层次等不同生活境遇下中小学教师的心理健康状况,以及影响这些教师心理健康的主要因素,于是对548名中小学教师进行了问卷调查。剔除无效问卷后,其调查涉及到538个人的198个变量,如果采用固定格式建立数据文件要比采用自由格式建立数据文件时少击打105,986次空格键。过程演示返回直接在SPSS的数据文件窗口中键入变量和数据打开SPSS的数据文件窗口点击VariableView设置变量点击DataView键入数据保存文件程序运行演示返回(二)数据文件的编辑与变换示例1:将一被试选择反应时数据(红:415;绿:430;蓝:438;黄:462)加到数据文件中,并排在第8位置,将原第10位被试的数据删除。
演示数据文件的扩展与减缩:增加或减少个案(case)数(增加或减少行数)、增加或减少变量数(增加或减少列数)、合并两个或两个以上的文件、选择个案子集、进行分类汇总等。示例2:将上述操作后的数据文件分别分解成下列四个文件(1)第1到第10名被试测试的数据文件1;(2)第11到第20名被试测试的数据文件2;(3)由红光和绿光反应时组成的文件3;(4)由蓝光和黄光反应时组成的文件4。
演示示例3:将示例2形成的文件1和文件2合并、文件3和文件4合并,就形成原来的完整的数据文件。
演示2.选取个案子集:根据分析需要选择部分个案进行分析:点击DATA菜单选择SelectCases命令,弹出SelectCases对话框并选择适当的方式。
演示3.数据分类汇总:可根据指定变量的数值对测量数据进行归类汇总。如一大样本调查研究的数据文件中包括来自不同地区、不同学校、不同年级、不同性别的学生的一系列测量值。要把不同学校的测量情况分别进行统计分析,则需要进行分类汇总处理,即得到各类别下个案观测值的平均值。
演示DataAggregateBreakVariableAggregateVariable
演示菜单操作法(三)变量的操作选列操作法增加变量变量标签法1.增加和删除变量删除变量2.根据已有变量产生新变量
在数据统计中,有时需要通过数据转换来体现变量间的真实关系,这就要对已有变量进行算术的、函数的、逻辑的处理以生成新变量,这一般可以通过“Transform”菜单的Compute项打开的对话框完成,或者通过句法文件窗口直接编写compute语句来完成。实例分析:某公司为招聘中层干部,聘请心理测量专家帮助其组织了对应聘人员的综合测评。专家设计的测评项目包括:记忆力X1、注意力X2、思维力X3、决策力X4、组织协调力X5、专业知识和技能X6、计算机操作技能X7、一般性文化知识X8、道德品质X9、心理健康水平X10。各项目均以百分制记分,然后前5项分别按1、1、2、3、3的权重整合得到能力分数(百分制记分);6、7、8三项分别按5、2、3的权重整合得知识技能分数(百分制记分)。最后以能力、知识技能、道德品质、心理健康水平四个方面的得分决定哪些人进入复试。这样的资料如何处理?3.产生计数变量在统计工作中,有时需要进行一些计数工作,比如在学生期末考试结束后,想要统计哪些学生各门功课均为80分以上的、哪些学生是只有一门功课低于80分的,哪些学生是两门功课低于80分的,等等。我们以前述的招聘测试数据表为例,形成一个计数变量,以统计出哪些应聘者是决策力、组织协调力、道德品质、心理健康水平得分均在70分以上的。(演示)4.产生分组变量方法是:点击“Transform”菜单的CategorizeVariables命令弹出对话框,在原变量表列中选定一个需分组的变量,将其移到右边的CreateCat
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 八十大寿贺词
- 人教版小学语文教学随笔
- 石蜡切片的制作过程
- 深圳科技业务管理系统
- 科室工作总结
- 秋季大班教师个人计划表
- 2024-2025学年八年级地理上册 1.1 位置和疆域教学实录 (新版)粤教版
- 2024年校园教育培训机构合作合同3篇
- 我的家乡小学作文
- 三年级英语上册 Unit 4 Family Lesson 22 How Old Are You教学实录 冀教版(三起)
- 商丘工学院《物联网工程》2023-2024学年第一学期期末试卷
- 2024年标准设备安装分包合作合同版B版
- 幼儿艺术疗愈课程设计
- 2024年化学检验员(中级工)技能鉴定考试题库(附答案)
- 【MOOC】中学化学教学设计与实践-北京师范大学 中国大学慕课MOOC答案
- GB 15930-2024建筑通风和排烟系统用防火阀门
- 2023-2024学年广东省深圳市宝安区五年级(上)期末英语试卷
- 2022-2023学年北京市通州区高二(上)期末地理试卷
- 2024潞安化工集团有限公司第二批煤矿井下一线生产操作岗位招聘2820人笔试核心备考题库及答案解析
- 2024年度VR虚拟现实内容创作合同
- 第五单元有趣的立体图形 (单元测试)-2024-2025学年一年级上册数学 北师大版
评论
0/150
提交评论