lecture 5 实验设计及数据统计分析.ppt_第1页
lecture 5 实验设计及数据统计分析.ppt_第2页
lecture 5 实验设计及数据统计分析.ppt_第3页
lecture 5 实验设计及数据统计分析.ppt_第4页
lecture 5 实验设计及数据统计分析.ppt_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Lecture 5Experimental Design and Data Analysis,实验设计的概念 什么是实验设计 实验范式 实验设计中的变量及其控制 实验设计类型 实验设计的信度和效度,实验设计的概念,什么是实验设计 研究者针对需要验证的实验假设,为有计划地收 集观察资料而预先建立和依据的设计模式(朱滢 教材)。 广义:包括形成假设,制定计划,收集和分析资料,对假设做出统计推断。 狭义:就是控制实验条件和安排实验程序的方式。 实验设计的目的:最大限度地减少额外的或未控制的变异,因而增加实验结果的可靠性。,实验范式(experimental paradigms) : 范式是指按照某一

2、比较公认的路线或观点所采取的研究方向或研究步骤。 “按既定的用法,范式就是一种公认的模型或模式。” (库恩,1962)科学家集团所共同接受的一组假说、理论、准则和方法的总和 。 范式还为科学研究提供了可模仿的成功的先例。,实验方法在各种心理过程以及各个心理学分支的研究中,具体表现为各种不同的实验范式。 如:习惯化和去习惯化;STROOP effect 某种实验范式实际上就是相对固定的实验程序,它的设计一般有两种用途或目的。 1)为了使某种心理现象得到更清晰准确的描述和表达。2)为了检验某种假设、新提出来的概念,24,习惯化范式:习惯化是指婴儿对多次呈现的同一刺激的反应强度逐渐减弱,乃至最后形成

3、习惯而不再反应。去习惯化是指在习惯化形成之后,如果换一个新的不同刺激,反应又会增强。 用来探讨新生儿和婴幼儿的注意记忆和知觉。,Stroop effect: Stoop(1935)发现red green blue gray yellow,这些单词分别用这五种颜色写出来,但单词的意义和颜色相矛盾,比如,用红色写的“green”。让被试逐个将这些单词的颜色读出来,这叫唱色;让被试将单词读出来,这叫念字。发现唱色明显较慢。80年代以后,传统的Stroop效应与启动效应等范式结合而形成了新的实验范式:Stoop范式。,实验设计中的变量及其控制,实验者和实验对象 主试(experimenter):实验者

4、,即主持实验的人。他发出刺激给被试,通过实验收集资料。 被试(subjects):就是实验对象,接受主试发出的刺激并做出反应。(包括人类和动物),变量(variables),自变量、因变量和额外变量 变量(Variable):指性质或数量上可以变化的事物的特征或属性。 自变量(independent variable) 即刺激变量,它是由主试选择、操纵和控制的变 量,它决定着行为或心理的变化。,操作定义:(operational definition):心理学研究中,对于一种现象根据测定的程序下定义,这叫操作定义。采用统一的明确的可以量化的术语对自变量进行定义。 对于所要陈述的概念予以清楚的具

5、体的界定,对概念的内涵没有争议,可以重复。 自变量的不同水平:自变量的不同强度引起的反应有差异时,则自变量处于不同的水平。当自变量水平的变化导致了行为的改变时,就说自变量的操纵是有效的。,自变量的种类 作业变量(刺激特点自变量):刺激的不同特性引起被试的不同反应。如音高,声强等 环境特点自变量:进行实验时环境的各种特点:如温度、噪音、观众多少等。 被试特点自变量:一个人的各种特点,如年龄、性别、左右利手等。对于此种自变量被试只能选择,不能改变。,自变量操作的无效 所谓操作的无效,指自变量的操纵没有引起因变量的变化 实验者错误地认为自变量很重要,但实际上它不重要,结果自变量不能造成行为的变化。

6、自变量的水平设置不当 实验者没有能够真正操纵自变量,”零结果”。,因变量(dependent variable) 即被试的反应变量,它是自变量造成的结果,是主试测量和观察的行为变量。如反应时间。 直接记录的因变量是一种对行为的测量,而实验结论是根据对因变量的测量结果间接推论得到的,因此要得出可靠的结论,应该更多进行问题的理论思考。,因变量的特征: 稳定性:相同被试在相同实验条件下表现结果的一致性。 有效性:当确实是自变量而不是其他因素引起了因变量的变化时,我们认为因变量有效。 敏感性:自变量变化时,因变量会产生相应的变化。因变量范围限制,如天花板效应和地板效应(即ceiling effect

7、和 floor effect)会阻碍因变量对自变量效果的准确反应。,因变量的量化: 包括质的量化(有无反应)和量的量化(反应的程度) 例如: 解题时间作为因变量,但如果一个被试总是无法完成某个题目时怎么办? 我们测定大白鼠跑迷宫从起点到食物出口所需的时间,但如果大白鼠不往前走怎么办? 如果被试在回忆中把“不干净”写成了“肮脏”怎么办?,选择因变量的标准: a、在一项实验中,如果两种量值之间存在着高度相关,那么两者都可以使用。 b、如果其中一个量值对自变量的变化并不敏感,则应该选用另一个反应敏感的量值。 c、如果两个因变量对自变量都有高敏感性,但两者间没有相关,说明也许是自变量中有额外因素在起作

8、用,或者自变量不是以同样的方式影响两种反应测量。,额外变量 研究者不拟研究的,但可能与自变量发生混淆或对因变量产生作用的变量。 概念的辨析: 有关变量,无关变量 ,额外变量,控制变量,举例: 研究者通过观察发现,晚饭前在图书馆里学习的学生专心程度没有晚饭后学习的学生专心程度高。我们是否可以认为:饥饿是导致这种差异的原因? 可能的混淆因素: 下午是否学习;下午和晚上的注意力;学习内容,研究被试在自由回忆学习中,学习的英文单词音节数越多,则越难学。研究中所用的音节数有1音节,2音节和3音节。我们是否可以确认音节数是导致难学的因素? 可能的混淆因素: 单词的频率是一个非常重要的易混淆变量,因为音节越

9、短的单词使用的频率越高。,变量命名: 练习1:汽车制造者想知道刹车灯多亮可最大程度地减少后面司机意识到前方正在停车的时间。实验就是回答这一问题。对变量命名。 自变量: 刹车灯的明度 因变量: 刹车灯亮到尾随车司机踩刹车踏 板间的时间 额外变量: 刹车灯颜色、刹车板的形状、刹 车所需力气、额外照明度等。,练习2:训练鸽子绿灯亮时啄键、红灯亮时停止。对作出正确反应的鸽子给予玉米的奖励。对变量命名。 自变量 灯的颜色(红或绿) 因变量 啄键次数 额外变量 食物剥夺时间、键的大小、红灯绿灯的强度等,自变量混淆来源,被试偏差 被试反应性。 霍桑效应:被试由于知道自己正在被研究而引起的效应。 要求者特征:

10、被试猜测实验目的和假设或实验者期望的一些线索,从而改变行为方式。,1924年美国心理学家梅奥在霍桑工厂的一个实验。工人由于受到关注,其生产效率大幅度提高。不是改善照明条件和工资待遇的作用。,观察者效应:观察者的存在所引起的效应。可能是正性也可能是负性。 社会赞许性:人们希望表现出符合社会期望的公众形象。 安慰剂效应:实验组接受处理会容易产生这种效应。 取悦研究者与评价忧虑 默许反应倾向:对一个陌生人,默许要比不同意产生更小的心理压力。,实验者偏差 皮格马利翁效应:研究者的期待对被试的影响。 对比效应:观察者可能倾向于把自己作为评价他人个性的参考框架,从而导致把与自己不同的人评价得更加不同,把与

11、自己相似的人评价得比实际更为相似。,控制额外变量的方法,控制某些被试变量的方法 严格的指导语 指导语是实验中主试给被试交代任务时说的话。 控制被试的反应。要求,内容确定,完全,简单明确。 主试的态度一致 单盲和双盲实验,控制额外变量的具体方法,消除法 最好的办法就是简单地把它们从实验环境中消除。此法多适用于一些物理刺激因素的控制,例如,噪音(隔音室),光线(遮蔽)等。 但有些变量,如实验时间、仪器,主试,被试的年龄,性别,教育程度等,不能简单地加以消除,就要靠其他方法加以控制。,恒定法 对于不能消除的变量,可以使它在整个实验中保持恒定,即所有的被试受到的影响都是相同的,这种控制方法称为恒常法。

12、对于一些被试变量,实验条件,可以采用此种方法。 如,实验在上午和下午对结果会有影响,实验的时 间安排在上午,可能会比下午的实验有更好的结 果,那么都安排在上午做实验。,平衡法或匹配法 这种控制方法是让那些无关变量产生的作用在 所有的实验组及控制组的效果都保持平衡。 例1:平衡各组“性别”变量的作用。 20被试,12个男性,8个女性。分成两组进行实验。假设被试的性别可能会对因变量产生作用,所以每组的男女人数相等。,例,设计控制组: 实验者对实验组以及控制组,除了自变量的处理不同之外,对其他都一律同等地处理。如此,实验组和控制组在因变量上产生的差异都可以归诸于自变量不同所产生的作用。,例如:研究接

13、受持枪稳定性训练对射击准确性的作用。 实验组被试在接受训练之前先射击50发,之后进行训练,再测验50发。结果如下表:是否可以认为训练导致了成绩的提高?,考虑时间和练习的作用,抵消平衡法和随机化: 如果被试需要在各种不同的实验条件下接受重复测验,则会受到重复测量所产生的影响。这些混淆因素产生在重复测量的过程中。对此可以采用抵消平衡(counter-balancing)或交叉平衡的手段来控制。,例如:研究对红绿两种色光的反应时是否一致的问题。 未抵消的设计:让一组被试先接受10次红光刺激,再接受10次绿光刺激。得到对红光反应快,能否得出结论认为被试对红光反应快? 设计问题:实验刺激的先后顺序是一个

14、潜在的无关变量。,抵消的设计:一半被试先接受红,再接受绿; 而另一半被试相反,先接受绿,再接受红。,统计控制法 实验完成后,通过一定的统计技术来事后避免实验中额外变量的影响。如协方差分析。 不能代替实验前严格的控制。,在心理学实验中,研究者或主试本身也是额外变量,能够对实验的结果产生影响。主试的种族、性别、年龄、身份、地位、态度和情绪等都可能对被试的反应产生影响。这种影响不仅仅局限于对人类被试。,例如:罗森塔尔曾指派研究助理进行白鼠学习迷津的研究。他事先告诉研究助理,一组白鼠是聪明白鼠的后代(g1),另一组是愚笨白鼠的后代(g2),而第三组则没有祖先是否聪明或愚笨的信息(g3)。实验的结果发现

15、,g1要比g3成绩好,g2最差。而实际上,这三组白鼠都是从同一总体中随机抽取的样本,因此这种差异是由于主试主观期待的影响。,单盲和双盲实验 被试不知道实验目的,为单盲实验,主试和 被试都不知道实验目的,则为双盲实验。 多主试控制 采用多名主试,进行同一实验研究,是一种控制主试期待影响的办法。 “电脑主试”: 电脑自动化控制,可以避免人类被试带来的很多问题。呈现实验程序,说明刺激变量,记录被试的反应。,控制被试的方法,无论是人还是动物,被试间差异都是客观存在的。从面貌、体格、年龄、性别、教育水平、家庭情况、社会地位、文化背景,到心理特征、智力水平、兴趣、动机、性格等都各不相同。这些个别差异是造成

16、实验组内以及组间差异的重要因素。,实验设计类型,不同分类: 根据对实验控制的严密程度分为:真实验设计,准实验设计和前实验设计 根据被试如何分配到各种实验条件下分为:被试者间设计、被试者内设计和混合设计 根据实验中要操纵变量的多少:分为单因素实验设计和多因素实验设计,被试间设计 又叫独立组设计,或组间设计。把被试分配到自变量的不同水平上或者不同的自变量上。每个被试在实验中只接受其中的一种处理。 优点:一种处理(或实验条件)不会影响另一 种处理或实验条件,因为每个被试只对一种处 理做反应。,缺点:个体间的差异可能会影响到结果的有效 性。所以必须处理个体间的差异。 两种克服办法: 随机组设计(ran

17、dom groups design) 匹配组设计(matched groups design),随机组设计: 将被试随机分配在不同的组内接受不同的自变量处理。建立随机组的要点在于分派被试到不同组时,不能有偏差存在。如果有某些被试特征或与被试变量相关的因素左右了被试的分派,就是存在“偏差”。 随机化原则: 随机化方法:随机点名,掷骰子或奇偶分,先来后到,随机数字表。,实验设计中很重要的原则,匹配组设计 所有的被试都要先经过一个和实验作业同类、相似或表现出高相关的预试,然后根据预试的成绩来将被试配对分组。把被试分组后,再随机分配到不同的实验处理条件下。 但在匹配所有特征上有困难,而且增加实验工作量

18、。常用随机化方法。,独立组设计混淆主要来自被试变量:随机组设计中混淆发生的概率比较小,但是一旦发生我们就无从得知混淆来自哪里; 配对组设计主要是为了减少被试变量混淆机率,但由于配对组设计本身的缺点,所以使用较少。,被试内设计(Within-subjects design) 每个或每组被试接受所有的实验处理,然后比较在不同实验处理条件下的行为变化。又叫组内设计,有时候叫重复测量设计。 优点 节省被试。方便有效。 消除了被试的个别差异对实验的影响。 缺点 一种实验条件下的操作将会影响另一种实验条件下的操作,即实验顺序造成了麻烦。,实验效率比较高,实验效果比较好,由被试变异性而导致误差的可能性比被试

19、间设计小,容易达到统计显著水平。,练习效应 疲劳效应 :随机化方式进行平衡处理,此方法不能用来研究某些被试特点自变量之间的差异。 如果实验中每一种实验条件需要较长时间的恢复期,则不宜使用组内设计。 当自变量的不同水平代表一种连续事件的延续结果时,不宜使用组内设计。几种刺激在本质上应该是相对独立的。 例如,在复述实验中,被试重复一次和重复5次,两个自变量水平。但被试可能自己私自重复。破坏了自变量两个水平之间的差异。,处理办法:通过平衡技术可以减小,但不能完全消除。如果确实会产生,可以在两种处理方式之间保持足够长的时间间隔。或采用被试间设计。 对某些实验研究不适用。如用两种不同学习方法学习同一个实

20、验材料。,被试内设计的几种形式: 完全的被试内设计 a、随机区组设计; b、ABBA平衡法 不完全的被试内设计 c、所有可能的顺序; d、选择的顺序 拉丁方设计(Latin Square) 不管采用什么方法,都是为了平衡实验条件间的顺序效应,同时考虑控制其他额外变量的影响。只是适应的情况不同而已。,完全被试内设计 随机区组设计(Block Randomization) : 把被试分出不同的区组(block),每个区组内被试“同质”。每个区组接受全部实验处理,每种实验处理重复的次数也要相同。最后统计中可以剔除区组效应,获得纯粹的自变量效应。 一个区组内可以是一个被试或者多个被试(实验处理数目的正

21、倍数)。 当被试的某些特征可能影响到实验效果时,可以采用这种方法。,每一区组内被试的人数分配有三种情况: 一名被试作为一个区组。每名被试(区组)均接受全部处理,在接受处理的顺序上要采用随机化的方法。 每个区组内被试的人数是实验处理数目的整倍数。 区组内的基本单元不是一名被试或几名被试,而是以一个团体为单元。,例如:研究不同声音刺激对学生解答数学问题的影响。 自变量:声音刺激(四个水平);因变量:解答数学问题成绩 实验设计: 实验处理几种?:X1、 X2 、X3 、X4。将学生按照平时成绩分成3类:优良,中等和较差。那么就获得了三个区组。在每个分类中随机抽取12名被试,三个区组共有36名被试。将

22、每个区组内的学生随机分成4个小组,每组3人。实验时一个区组内的每个小组,随机接受一种实验处理。,ABBA平衡法( ABBA Counterbalancing ): 是指每一种实验条件都以正反两种顺序呈现给被试。虽然ABBA表示的是两种实验条件,但它并不仅仅限于两种实验条件。 可以应用到多种实验条件并可以被多次重复,但这种方法一般应用于较少的实验条件和重复次数较少的实验中。,ABBA平衡法存在的问题: 如果练习效果不是呈线性增长的,这种平衡就 是无效的。 预期作用。是指被试对后面实验条件的预期。 如果这个循环被重复几次,那么,被试肯定会 了解并预期以上的时间间隔的呈现模式。,所有可能的顺序: 采

23、用所有可能的实验条件顺序组合(适用于三种以下实验条件的实验设计)。 列出所有实验条件组合,并随机分派被试到各种实验组合中。 当条件很少时,可以实现,但当条件很多时,没有可行性。,拉丁方设计: 对实验处理的顺序和实验时间的顺序采用轮换的方法安排。 采用拉丁方设计安排实验条件的顺序,然后将被 试随机平均分派到各种实验顺序中去。适用于六种以 下实验条件的实验设计。,顺 序 一 二 三 四,1 2 3 4 被 试 数 目,传统的44拉丁方设计,平衡式拉丁方设计: 安排拉丁方的方法: 1,2,n,3,n-1, 4, n-2, 5, n-3 n=4, 顺序是 1,2,4,3 2,3,1,4, 3,4,2,

24、1 4,1,3,2,在实验条件为偶数时,平衡式拉丁方设计较容易,当实验条件为奇数时,每个被试必须在每种条件下测两次才能获得平衡式拉丁方。所以有两个方格。,实验条件为偶数(6)时:,实验条件为奇数时拉丁方设计,方格1,方格2,第一行安排实验顺序的公式: 对于偶数个子变量水平,建立平衡的拉丁方的第一行公式为1、2、n、3、n-1、4、n-2.,以六个自变量水平为例,第一行为1、2、6、3、5、4.对于奇数个自变量水平,必须有两个方阵,第二个方阵与第一个方阵正好相反,以5个自变量为例,第一行为1、2、5、3、4 / 4、3、5、2、1。,但是,如果不同实验条件在顺序上不是独立的,而是有相互作用,应该

25、选择别的设计方法,如随机区组设计。,实验设计的例子及详细的统计,请参阅: 舒华:心理与教育研究中的多因素实验设计 。,被试者间设计和被试内设计的比较:,混合设计: 在同一个研究中有些自变量按被试间设计处理,而另一些自变量则按被试内设计处理。一般地,如果一种自变量很可能会影响另一种自变量,那么这些变量按组间设计安排,其余的自变量则按组内设计安排。 优点:保留了被试间和被试内设计的优点,克服了各自的缺点。适用于多变量的实验设计。虽然不如被试内设计有效和经济,但很安全。,实验设计举例: Johnson等人(1983)用混合设计的方法比较抑郁者和非抑郁者的记忆成绩。他们假设,抑郁者比非抑郁者对于未完成

26、的记忆任务的记忆效果更好。实验中,要求抑郁组和非抑郁组完成20项记忆任务,其中,10项记忆任务在完成之前被打断。在全部任务完成后,要求被试回忆记忆任务的名称或尽可能多地描述记忆任务。 被试变量是组间设计(抑郁 :非抑郁),任务类型是组内设计(完成:未完成)。,多因素实验设计,什么是多因素实验设计: 在一个实验中包括两个或两个以上因素或自变量,而且每个因素有两个或两个以上水平。这样的实验设计常常叫多因素实验设计。与单因素实验设计相对而言。 心理学很多研究都是多因素实验设计。优点是实验效率高;实验控制很好;容易建立结果的普遍性;有利于观察变量之间的交互作用和主效应。能考察多个因素之间的关系。实用价

27、值高。,几个概念: 水平:指自变量的单个的处理方式或条件。 如自变量是学习中的作业反馈,两种处理方式分别 是积极反馈和无反馈。那么就说自变量作业反馈有 两个处理水平。 处理(treatment)与处理水平的结合:特定的实验条件,交互作用:指一个自变量对因变量的影响,因为另一个自变量水平的不同而不同时,就说这两个自变量产生了交互作用。这时不能独立讨论各个自变量的主效应。 主效应(main effects):一个自变量的各个水平对因变量的影响。 简单效应(simple effects):一个因素的水平在另一个因素的某个水平上的变异。,误差变异(error variance):不能由自变量或明显的额

28、外变量解释的那部分变异。 形式举例: 一个实验有两个自变量,A和B,A有两个水平A1和A2,B有2个水平B1和B2,那么这个实验设计就叫2 x 2 的二因素实验设计。如此类推,自变量数和水平数可以增加。则如 2 x 3; 2 x 2 x2; 2 x 3 x4; 但是,一般因素数超过4个就太复杂,对结果进行解释也很困难。,实验举例: A 2(diet) x 2(exercise) design will produce 4 groups (experimental conditions)。,练 习,研究8岁和10岁儿童阅读用10号字和12号字打印的段落材料的时间差异。 请提出:自变量,因变量,实

29、验处理。设计类型,推测结果:主效应和交互作用。,b1,b2,a1,a2,1,2,3,4,准实验设计(Quasi-experimental designs),概念: 与真实验设计相对而言。在实验中不能对变量进行严格的控制(这些变量常常是被试变量特征),或者使用自然发生的组,而不能把被试随机分配到各种实验条件下。但是仍然观察到因变量作为自变量变化的函数。 优点:因问题和条件限制而无法使用严格的控制实验时,可以采用准实验设计。适用自然发生的自变量,解决实际问题,常用于一些应用研究。,如典型的被试变量(年龄,性别,种族,种群),社会引起的被试属性(社会阶层,宗教等),疾病以及与疾病有关的被试因素(智力

30、低下,脑损伤等),只能选择而不能改变。研究很有实际的应用价值。 缺点:付出控制的代价。本质来讲,准实验设计只能是一种相关设计,评价因果关系及其推广到其他情境,必须非常谨慎。,准实验设计类型:,时间序列设计(time-series design) 对一组被试或个体进行周期性测量,并在这一时间序列的测量过程中引进实验处理,然后观察引进实验处理后测量结果的变化趋势,如果发现实施处理后测量结果出现不连续性,从而就可以推测实验处理的效果。 模式:O1 、 O2 、O3 、O4 X O5、 O6 、O7 、O8 (O代表测量,X代表实验处理),优缺点: 可以较好的控制成熟以及测验因素的影响。但是没有控制组

31、,不能排除与自变量同时发生的偶发事件的影响,测验敏感性容易受到影响。也不能排除测验与实验处理之间的交叉作用。收集数据不容易,实施统计复杂。 变式:另外增加一个不接受实验处理的控 制组,可以增加时间序列设计的效能。,非相等控制组实验组前测后测设计 (Nonequivalent control group design with pretest and posttest) 设计模式:一个不相等的控制组,不接受实验处理。对实验组和控制组都进行前测和后测。然后比较实验组和控制组的差异。 O1 X O2 O1 O2,优缺点:基本上控制了成熟、历史和测验等因素对实验处理的干扰。有前测,可以了解实验处理前的

32、状态,有了比较的基线水平。但没有随机分配被试接受实验处理,实验组和控制组不对等,降低了实验的效度。,交叉滞后组相关设计 要求在时间点1对两个变量(A、B)的关系作出测定和相关分析,然后在时间点2作相似测定和分析。通过交叉滞后相关系数的比较,找出交叉滞后相关差异的方向,然后根据差异的方向,确定变量之间的关系。即当交叉滞后相关之间有显著差异时,具有一定因果意义。在同步相关稳定情况下,如果Ra1b2b1a2,那么A引起B,否则,B引起A。如图所示。,三个基本假设: 所表示的因果关系不随时间推移而变化。 同步相关与稳定性尽可能一致。 交叉滞后组相关中包含了主要的变量,并已作出相应的测量。 由于上述假设

33、不易满足。对于这种设计中的因果关系,要作谨慎的解释。不能完全证明因果关系,需要其他研究补充和验证。,单被试实验设计(single-subject experiments) 针对一个被试,看实验处理是否对因变量有作用。 几种设计形式: 反转或撤消设计(reversal designs) 多基线设计(multiple baseline designs)。在引入干涉变量前,有多个基线,可以是多个被试的多个基线,也可以是一个被试的多个行为的不同基线。 有专门的实验统计方法。,反转/撤消设计,前实验设计,单组后测设计 单组前测后测设计 固定组比较设计 事后回溯设计,单组后测设计,在单组后测设计中,只有一

34、个实验组,对实验组只给予一次实验处理,然后通过测量得到一个后测成绩。 设计的基本模式: X O X是研究者操纵或某种未知因素(研究者经过分析而推断的自变量)的处理,O是研究者操纵自变量引出的结果(后测成绩)或研究者观察到的结果。,单组前测后测设计,单组前测后测设计是对单组后测设计的一种改进,它增加了在实验处理前的测验,但还是只有一个实验组。 设计的基本模式: O1 X O2 O1表示在接受处理X以前对被试进行前测,取得一项作为基线的观测值,X表示引入的实验处理,O2表示处理X后的测验。,固定组比较设计,固定组比较设计又称静态组或整组比较设计。 采用实验组和控制组两组被试,但因这两组被试在实验处

35、理前就已经形成,故它不能使用随机化原则选择被试。 基本设计模式: X O1 O2 O1为实验组接受实验处理后的反应效果;O2为不接受实验处理的控制组的反应效果。,事后回溯设计,事后回溯设计是指所研究的对象是已发生过的事件。 在研究过程中,研究者不需要设计实验处理或操纵自变量,只需通过观察存在的条件或事实,将这种已自然发生的处理或自变量与某种结果或因变量联系起来加以分析,以便从中发现某种可能的简单关系。 基本设计模式: X O X是自变量或实验处理,是研究者不能操纵或改变的;O是研究者观察到的结果。,SUMMARY,不同的实验设计类型: 单因素和多因素 真实验设计、准实验设计 前实验设计 不同的

36、实验设计种类有不同的效率,有不同的数据统计方法。选取恰当的实验设计,必须考虑到其他许多因素。,实验设计的信度和效度,什么是信度 如何测量信度 影响信度的因素 什么是效度 如何测量效度 影响效度的因素有哪些,评价一个实验设计: 是否达到了实验的目的 是否很好的控制了额外变量 信度和效度的衡量,什么是信度(reliability): 在测定人的心理和行为特点时,一个研究设计或测试工具在测定结果上所能达到的精确性和可靠性程度,也就是说在相同的实验条件下,被试的测定结果都应该是一致的。 常用测量主要有: 重测信度 分半信度,重测信度 即使用同样的研究方法,对同一样本被试,相隔一段时间重复进行相同的两次

37、测验,求得两次测验结果的相关系数,作为重测信度的指标。这样求得的相关系数又叫稳定性系数。 容易实现,但工作量大,两次实验的被试很环境因素不易控制。还容易受到练习效应的影响。,分半信度 研究者将同一份测试内容,按照题号的奇数和偶数,分成各半的两个测试,分别在同一批被试中施测,再分别计算出每个被试在两个测试中的总分,并进行相关计算。这样求的信度称分半信度。,评分者信度 在心理学研究中,如果由评分者对某些测试中被试的特定反应,作出一种评价性的主观判断,可能会因为评分者不同而产生误差,这时需要检验评分者的一致性和可靠性。这种计算信度的方法,叫评分者信度。这种效度检验也叫评分者一致性检验。,如果有两名评

38、分者,可用他们各自评定的分数计算两者的相关系数来作为评分者信度。如果评分时连续变量,可以用积距相关系数表示,如果属于非连续变量,即等级类别时,需要等级相关系数。 如果超过多人,考虑使用肯德尔和谐系数作为对多个评分者间信度的估计值。 但评分者的一致性是否显著,需要进行统计检验。,研究信度的实验检验方法 直接验证,就是在尽可能使用原实验方法和相同情境下,通过直接重复实验过程,通过对有关实验结果的比较,从而验证某个实验研究可靠性的方法。 系统验证,即如果原有结果可靠,那么在系统变化那些与实验结果不相关的因素时,实验研究仍然会出现同样的结果。,实验的效度,概念: 实验的效度指一项测验测到所要测量的东西

39、或者达到某种目的的程度。 坎贝尔(Campbell,D.T)(1957)第一次明确提出研究效度的问题。 Campbell and Cook (1979),准实验研究:现场背景的设计和分析,全面系统讨论和分析了研究效度及其在实验设计中的意义。,有关研究效度的理论和方法,已为心理学家普 遍接受,成为研究与实验的关键。 涉及到效度的实验研究中的问题 所研究的两个或者多个变量之间是否有一定关 系? 如果存在一定关系,是否是因果关系? 如果可能存在因果关系,所包含的具体的因果 关系构思是什么? 假定变量之间因果关系构思明确,其普遍意义 如何。,内部效度,统计结论效度,构思效度,外部效度,实验的内部效度 定义:指实验变量能被精确估计的程度,也指实验中的自变量与因变量之间因果关系的明确程度。排除对实验结果产生干扰的无关因素,使研究者相信实验结果确实是由操纵的变量引起的,则实验具有较好的内部效度;反之如果对于实验无关的因素控制不好,造成了与实验变量的混淆,影响了实验结果,则实验缺乏内部效度。,影响实验内部效度的因素 历史:指在实验过程中与实验变量同时发生并对实验结果产生影响的特定事件。 成熟

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论