斯金纳操作学习理论_第1页
斯金纳操作学习理论_第2页
斯金纳操作学习理论_第3页
斯金纳操作学习理论_第4页
斯金纳操作学习理论_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、bilidtyantoceg, cooodmpproestuhree. nsively implem7斯金纳操作学习理论B F 斯金纳(Burrhus Frederick Skinner,19O41990 是操作学习理论的创 始人和行为矫正技术的开创者。 他是美国新行为主义的主要代表, 也是在所有新 行为主义者中, 在坚持行为主义基本立场方面最激进的一位, 同时, 也是对当今 心理学影响最大、 最重要的新行为主义者。 他最有影响的主张集中体现在他的操 作学习理论。、操作学习理论的提出:在斯金纳之前, 心理学家们就已经用刺激反应联结对学习作出解释, 如 华生认为学习就是“以一种刺激替代另一种刺激

2、建立条件反射的过程”;又如,桑代克提出的尝试错误学习(trial-error learning)理论,认为学习的实质是“通过尝试'在一定的情景与特定的反应之间建立某种联结” 斯金纳指出, 虽然,某些人类的行为正如之前的心理学家们说的那样, 是由 特定的刺激引起的, 但是,这些只能解释所有人类行为的一小部分, 于是他提出 了另外一类行为, 称之为操作性行为, 因为它们是在环境中缺乏明显的无条件刺 激物时操作的。 斯金纳的工作主要集中在行为与后果的关系上, 并由此提出了对 教育实践起巨大影响的学习理论操作学习理论。二、斯金纳操作学习理论的基本观点:(一)经典实验斯金纳箱( Skinner

3、box):2O 世纪 3O 年代后期,斯金纳改进了桑代克的迷笼,设计了“斯金纳箱” , 并用来研究各种动物(如白鼠与鸽子)的行为。此箱去掉了所有无关刺激,通常 内设一杠杆,杠杆与一食物仓相连,动物(如白鼠)偶然地一按杠杆,食物仓便 打开,落下一食物小丸于食物盘内, 箱外有一记录器, 可记录白鼠按压杠杆的速 度。实验中, 动物从初始的混乱动作中无意地碰到杠杆而得到食物, 从而学会了 按压杠杆与得到食物之间的联结。 通过更为复杂的设计, 动物还可以学会分化行为,如当灯亮时按杠杆可以得到食物,而灯灭时按杠杆得不到食物,于是,动物 学会了只在灯亮时按压杠杆。(二)两种类型的学习:从对动物的研究中,斯金

4、纳认为,行为分为两类:应答性行为和操作性行为。 应答性行为是由已知的刺激引起的;操作性行为则是由有机体自身发出的。 无条 件反应是一种应答性行为,因为它们是无条件刺激所引起,而在日常生活中操作 性行为是我们行为中的大部分。要强调的是,斯金纳并不是指操作性行为不依赖 于刺激作用而产生,而是说刺激引起这种行为是不知道的,而且去了解其原因也 是不重要的。操作性行为不是取决于其事先的刺激,而是由其结果所控制。与两类行为相应,斯金纳把条件反射也分作两类:一类是由刺激情景引发的 反应,是一种不随意的行为,称应答性条件反射(respondentS与经典性条件反 射相应,又称刺激性条件反射;另一类是操作性条件

5、反应(opera ntS,又称工具 性条件反射,它不是由刺激情景引发的,而是有机体的自发行为,是随意或有目 的的。两种反射的区别见表1:表1经典性条件反射操作性条件反射反应特征应答行为自发行为形成条件条件刺激与无条件刺激相匹配及时强化刺激对特定刺激才能产生反应不需要特定的刺激消退条件刺激多次单独出现将强化物去掉经典条件作用只能用来解释基于应答性行为的学习, 斯金纳把这类学习称为“S (刺激)类条件作用”或叫“反射学习”。另一种学习模式,即操作性或工具 性条件作用的模式,则可用来解释基于操作性行为的学习,他称为“R (强化)类条件作用”或叫“操作学习”。操作学习模式认为,如果一种反应之后伴随一

6、种强化物,那么,在类似环境里发生这种反应的概率就增加。而且,强化物与实施强化的环境一起, 都是一种刺激, 我们可以以此来控制反应。 斯金纳认为操作 学习与反射学习是不同的。反射学习是 SR 的过程,而操作学习则是( S)R S 的过程,重要的是跟随反应之后的刺激(强化物) ,而不是反应之前的刺激。三)操作性条件作用的主要规律:1、强化:1.1 基本概念:1.1.1 强化的含义:强化的概念在桑代克效果律中已有阐述。但是,在斯金 纳的强化理论中, 强化所扮演的角色发生了重大的变化。 斯金纳将强化作为一个 中性词使用(而不是指奖励) ,可简单定义为“能增强反应率的效果” 。1.1.2 强化物的含义:

7、强化是指“使反应发生概率增加、或维持某种反应水平的任何刺激”。这也就是说,斯金纳认为凡是强化,其结果都是行为概率的增加。反之,提 高反应概率的任何事件都可以起强化作用, 强化物也就不一定是一种令人愉快的 刺激。而且,在一种情境中起强化作用的刺激, 在另一种情境中并不一定起强化 作用。同样,对某一对象起强化作用的刺激,对另一对象并不一定起强化作用。 由此可见,是刺激对反应的结果, 而不是刺激本身的性质决定某种刺激是否为一 种强化物。1.2 强化的类型:斯金纳区分了两种强化类型:正强化(positive reinforcement,又译积极强化) 和负强化(negative reinforceme

8、n,又译消极强化)。当在环境中增加某种刺激, 有机体反应概率增加,这种刺激就是正强化物。比如,白鼠按开关时给食物,食 物就是正强化。 当某种刺激在有机体环境中消失时, 反应概率增加, 这种刺激就 是负强化物。也就是说,负强化物是厌恶刺激,是有机体力图避开的那种刺激。 比如,当处于电击状态下的白鼠按开关时停止电击,停止电击就是负强化物。1.3强化的作用:塑造行为。1.4强化安排:1.4.1强化的方式:斯金纳认为,在行为实验分析中,最容易控制的、最有效的变量是给予强化 的方式。在精确控制的实验情景中,实验者可以精确地决定使用什么类型的强化, 怎样给予强化和何时给予强化。强化的方式多种多样,包括连续

9、强化和间隔强化、 固定比例强化和变化比例强化、固定时间强化和变化时间强化等。具体见表2:表2bilidtayntoceg, cooodmpproestuhree. nsively impleme Busi表2是我修改施良方的学习论中的一个表格得到的。其中,连续强化、 间歇强化这两种强化方式应该比较好理解,对于其内涵学者们也基本没什么异 议。但是,对于比例强化和间隔强化,学者们的表述就有不一致的地方,对于其 内涵也有不同的解释。修改后的表 2 是我比较认同的理解。在彭聃龄主编的普通心理学(修订版) 中,将间隔强化与连续强化相对 应,放在第一个层次。这与施良方在学习论中的理解只是语言表达上的 差异

10、,不存在本质的不同。然后, 普心又将间隔强化细分为比率式和时间式 两种方式。 在这里,就不仅仅是表达上的差异, 同时隐含着对两种方式的内涵的 理解上的差异。先说比率式与比例强化。其中,比率式认为,比例是强化与“反 应次数”之间呈一定比例(包括可变的比例与固定的比例) ;而学习论中的 比例强化是强化与“正确反应次数”之间呈一定比例。既然,强化的作用是塑造 行为,那么,如果将强化以“反应次数” 为度,效果肯定没有以 “正确反应次数” 为度来得好,因为前者是只要出现反应,无论对错,只要靠次数就给强化,就可 能出现反应者随便做出反应的结果。 因此,我更赞同将比例强化理解为强化与正 确反应次数之间呈比例

11、。 其次要说的是时间式与 学习论中的间隔强化的不同。 时间式显然是强化与“时间”之间的间隔。而学习论中的间隔强化是强化与 一定时间内的正确反应的间隔(例如,每隔 5 分钟正确反应给予一次强化) 。显 然,后者比较复杂,因为它将强化与两个条件相联系,一是时间( 5 分钟),一 是反应的性质(正确反应) ,乍看似乎比只考虑时间因素更能符合强化的塑造行 为的作用。 但是,细想之后发现这种理解有个致命的缺陷可操作性不强! 这 种理解是说在 5 分钟之内的反应都是正确的才给强化吗?还是说 5分钟之内只要 出现过正确反应就给强化?如果一直没出现正确反应, 但是 5分钟时间已到 (这 时时间条件满足,但反应

12、性质条件没满足),这种情况给不给强化?一系列 的问题都说明这种理解的可操作性不强。 而,斯金纳的强化理论, 甚至是整个操 作学习理论都是来自于他的实验的, 因此,他所采用的像强化这种概念应该会更 多地考虑可操作性。 因此, 我更赞同将间隔强化理解为只与时间之间的间隔。 这 也是我修改学习论中的表的原因。1.4.2不同强化安排的效果:强化的方式可以有种种不同的结合和顺序, 不同的强化安排对学习测试也会产生不同的影响。1.4.2.1对习得速度的影响:一般说来, 如果最初学习时给予连续强化, 学习速度就会比较快些。 如果最 初学习时使用间歇强化,学习就会困难些,速度也就慢一些。1.4.2.2对反应速

13、度的影响:首先,一般说来, 比例强化比间隔强化的反应速度要快些。 其次在两种固定 强化安排中(固定比例强化和固定间隔强化) ,在每次强化后,反应速度立即变 慢,其反应速度是从这一次强化后到下一次强化前有规则地逐渐加快。 由于这种 图解很像海里的扇贝,因此把它称为“扇贝型”(scallop ing)效应。最后,在两次强化之间反应速度的这些变式, 只表现在固定强化安排中, 在变化强化安排中 则没有呈现这种现象。1.4.2.3对消退速度的影响:首先,连续强化安排比间歇强化安排习得的速度要快些,但在不给强化后, 导致消退的速度也会更快些。 其次,固定强化安排比变化强化安排引起的习得速 度要快些,但在没

14、有强化时,它引起的消退速度也会更快些。最后,在比例强化 (不论是变化比例还是固定比例) 安排中,强化比例高的反应速度要比比例低的 快一些,但在不给强化后,消退速度相应地也要快一些。综上,最佳的训练组合也许是, 最初时使用连续强化, 然后是固定间隔强化, 最后是变化比例强化。此外,随着训练期的推移,比例也可以改变。总体说来, 减少强化的比例,会使消退速度放慢。2、消退:2.1 消退的含义:“有机体作出以前曾被强化过的反应, 如果在这一反应之后 不再有强化物相伴,那么这一反应在今后发生的概率便会降低,称为消退。 ”2.2消退的作用:在强化中,无论是正强化的奖赏还是负强化的回避, 其作用都在于增加某

15、种 反应在将来发生的概率, 以达到塑造行为的目的, 而消退则不然。 消退是一种无 强化的过程,其作用在于, 当有机体自发地做出某种反应以后, 不对其施与任何 强化,从而降低该反应在将来发生的概率,以达到消除某种行为的目的。在消退早期, 在不施与任何强化时, 行为频率会在短时间内忽然增加, 之后 频率减少,才是真正的消退。早期频率的增加很好理解。比如,白鼠之前按开关 就得到食物,后来,消退开始,按开关不给食物了,白鼠就会更用力更频繁地按 开关,为的是确认是否是因为自己按得不够大力或是其他什么偶然的原因使食物 不出现。等到它确信再怎么按也不会有食物的时候, 它的按开关的行为才开始真 正的减少,最后

16、消退。3、惩罚:3.1 惩罚的含义:“当有机体作出某种反应以后, 呈现一个厌恶刺激或不愉快 刺激,以消除或抑制此类反应的过程,称作惩罚。 ”3.2 惩罚的作用:惩罚与负强化和消退都有所不同, 负强化是要增加行为发生的概率, 消退是 不施与强化。但惩罚是通过厌恶刺激的呈现来使行为反应在将来发生的概率降 低。但是,动物实验表明, 惩罚对于消除行为来说并不一定十分有效, 厌恶刺激 停止作用以后,原先建立的反应仍会逐渐恢复。 (这点可以用班杜拉的观察学习 理论来解释。 班杜拉认为人们的大部分行为是通过观察学习习得的。 观察学习要 经过注意、保持、再现和动机四个阶段,这样,惩罚就只是阻止了动机阶段的发

17、生,而使行为没有表现出来,但是不能阻止前三个阶段的发生,因此,个体还是 将不良行为记在脑子里, 只是由于惩罚而暂时不做而已, 只要惩罚撤销, 个体还 有可能再做。)因此,惩罚的效果一般不好, 它并不能使行为发生永久性的改变, 12bilidtayntoceg, cooodmpproestuhree. nsively impleme Busi不能根除行为,而只能暂时抑制行为。与此同时,惩罚也可能会引起副效应,如 攻击性行为。因此,惩罚要慎用,消退才是减少不良行为、消除坏习惯的有效方 法。在非得给予惩罚时,一定要注意:第一,要注意使用惩罚后的反应抑制期。也就是说,惩罚一种不良行为应与强化一种良好行

18、为结合起来,不但要说什么不能做,也要说明什么能做和应该怎么做,这样才能取得预期的效果;第二,惩罚 一定要在不良反应发生后立即给予, 延迟的惩罚可能是无效的;第三,惩罚一旦 决定实施,一开始就要选择强度大的,越来越强的惩罚不可取,因为会产生适应; 第四,在可选择的情况下,与其给予厌恶刺激惩罚(2),还不如不给奖励刺激 惩罚(1)。(见下表4)最后,将正负强化、消退、惩罚的区别列成两表,见表3,表4:表3正强化负强化消退惩罚刺激增加奖励刺激减少厌恶刺激不施与呈现厌恶刺激目的增加反应概率增加反应概率减少反应概率减少反应概率应用塑造良好行为塑造良好行为消除不良行为消除不良行为表4反应后呈现反应后消除奖

19、励性刺激正强化惩罚(1)厌恶性刺激惩罚(2)负强化三、斯金纳操作学习理论的应用:斯金纳的操作学习理论在实际的教学和教育工作中有着非常广泛的应用,影响最大的是程序教学和行为矫正。(一)程序教学:1、程序教学概述:程序教学是 20 世纪第一个具有全球影响的教学改革运动,深刻地影响到当 时美国及世界其他国家的教学实践。 简单地说,程序教学是通过教学机器呈现程 序化教材而进行自学的一种方法。 它把一门课程学习的总目标分成几个单元, 再 把每个单元分成许多小步子。 学生在学完每一步骤的课程后, 就会马上知道自己 的学习结果, 即能得到及时强化, 然后按顺序进入下一步的学习, 直到学完一个 个单元。在学习

20、过程中,学生可按自己的学习能力和学习习惯,自定学习步调, 自主进行反应,逐步达到总目标。2、浅评程序教学:程序教学确实具有不少优点,不仅可以集中最优秀的教师来编制教学过程, 而且学生在每一步都能获得及时的强化, 学生甚至可以自定步调来学习, 克服了 全班上课的缺陷。但是,程序教学也有其致命的不足:首先,是忽视了主体的主动性,学生只 能按程序教材上规定的正确答案回答, 如果不同意机器呈现的答案, 或是有不明 白的地方,他不能跟机器争论,也不能要求机器做进一步的解释。最重要的是, 这种用机器的学习就排除了作为重要教学资源的老师和同伴。 机器教学无法取代 教师的人格教育活动, 也不能取代同伴关系在学生成长过程中的积极作用。 这些 也许就是现在基本不用纯粹的机器教学的原因吧。(二)行为矫正:1、行为矫正的原理:有机体自发做出的操作性行为与其随后出现的行为结 果之间的相倚关系, 控制着该行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论