斯金纳对强化、奖赏、惩罚等都做了精确的区分。斯金纳把强化作为他的学习理论的基石和核心。他认为任何学习(行为)的发生、变化都是强化的结果,要控制人的行为就要设法控制对行为的强化,他说: “要保持行为的强度就必须强化”。他以一种操作性很强的方式来界定强化,认为凡是可以提高反应概率的任何刺激都可以起强化作用。他将强化分为两类:正强化和负强化。在操作行为后给予奖励,以增加该行为再次出现的概率就是正强化。在操作行为后消除个体所厌恶的刺激,以增加该行为再次出现的概率就是负强化。行为主义心理学家以动物实验为基础,揭示了奖惩对行为的强化作用。斯金纳对强化的另一个方面的研究是强化的时间间隔和强化的比率模式的提出。“由于不可能做到强化每一个反应来控制行为,因此,在教育和工业方面,几乎都是以间歇强化为其特征的”。他详细地研究了两种主要的间歇强化:间隔安排和比例安排。每一种安排又以固定和可变两个纬度分成两种,即固定间隔、固定比例、可变间隔和可变比例四种强化模式。研究结果指出在固定间隔强化中强化之间的时间间隔越短,反应率越高;反之,则越低。固定比例强化比定时强化产生较高的反应率。但无论是桑代克还是斯金纳,对心理现象的研究都是基于外显行为,一种符合刺激———反应或反应———刺激模式的外显行为,因此对强化的研究也局限在外部强化上, 但一些心理学家发现仅用外部强化是不足以来解释所有的学习行为的,他们认为外部强化对行为产生的影响是暂时的,有条件的无法对行为产生深刻、长久的影响。因此,他们提出了与联结派完全不同的赏罚观。
惩罚被定义为给予负强化物或者去除正强化物。虽然斯金纳认为,强化和奖励有所不同,但在后来的使用中,强化与奖励(或奖赏)是可以互换使用的概念。由于一种行为受到奖赏后再次出现的可能性就增加,所以,奖赏是一种可以用来对人和动物的各种行为进行控制的有效手段。“如果你想增强某种反应或行为模式,就奖赏它”斯金纳不主张使用惩罚,他认为,处理非期望行为的正确方法是对该行为不予强化而不是惩罚。但后来的研究表明,惩罚在克服不良行为方面具有重要作用。如果在对错误的选择或行为进行惩罚的同时,指出应有的或正确的行为,那么惩罚在克服不良行为方面就能发挥很好的作用。
总之,行为主义心理学全面揭示了奖惩对个体行为的多方面的影响并对如何通过恰当的奖惩来促进知识技能的掌握,对个体行为进行塑造、矫正和控制,为教育教学实践中人们有效地运用奖与惩提供了可靠的依据。但由于行为主义心理学只重视对刺激与外显行为的考察而忽视了个体的主观因素,因此,它所提供的理论与方法、措施运用于学校情境中时仍有很大的局限性。
二、认知心理学家关于奖惩的基本观点
现代认知心理学家托尔曼则认为学习不是一个径直的、无意识的过程,而是有机体习得的关于周围环境、目标位置以及达到目标的手段和途径的过程,也就是形成“认知地图”的过程。并以小白鼠为试验对象设置了“期待”、 “位置学习”等试验验证了这一观点。因此,托尔曼是反对效果律的,他认为效果律无法充分解释复杂的学习。学习不是刺激———反应之间简单机械的联系,在刺激———反应中间有一个非常关键的起决定作用的认知过程。桑代克的效果律认为通过刺激(奖励和惩罚)会自动地加强或减弱反应。但在他的试验中却不时地使用各种奖励以促进动物的学习,这是否有矛盾呢?托尔曼认为这并不矛盾,刺激(奖励或惩罚)之所以影响学习不是因为它对学习有直接的促进和抑制作用,而是它成为了为行为报告信息的符号。例如,奖励就提醒个体应注意或强调什么刺激,它帮助个体选择特殊的刺激予以注意。这就是托尔曼的赏罚观。在他的赏罚观里还有一层含义,奖励可以使学习转化为操作,这在他和杭齐克设计的著名的“白鼠潜伏学习试验”中得到证实。没有奖励,学习仍然可以进行,只不过没有表现出外显的实际操作,当给予奖励时,操作成绩得到明显的提高。因此,在托尔曼看来,奖励只是促进,学习的手段而不是学习形成的必要条件。班杜拉对传统的效果律也是持批评意见的,他说“:假如行动全然由外在的报酬和惩罚所决定,那么人的行为将像墙头草,在不同的向度不断地改变,以顺应随时会侵犯到他们的影响力,他们将表现为没有原则个体的败坏举动或令人尊敬的正义者,以及大方地行动自由者或独断的权威者。”显然,在班杜拉看来,人类的行为除了受到由他人对行为者的强化(外部强化)影响外,更主要地受到行为者本身对自己的强化(自我强化)的影响。另外,认知派强调学习的内在动机,在具体到赏罚效果问题时,实质上成了赏罚对内在动机是否有影响,是如何影响的。勒温认为用奖惩作为促进学习动机的手段,这是只看到某种活动的物理特性,忽略了活动的心理环境方面巨大影响的表现。布鲁纳也认为,作为外部动机,对学生,特别是少年孩子,在某个特殊行动激发方面可能有促进作用,但它对于构成学生有用模式的长远的学习过程,并没有裨益。他认为,个人行为的控制,尤其是长久行为的控制主要是受其认知结构的控制,更多的是从内部到外部的控制。蒂西在1971年以大学生为被试也进行了一项经典性研究,结果发现进行一项本来很感兴趣的活动而得奖的大学生被试当失去了得奖机会后,从事该活动的动机水平显著降低,即是说外部的奖赏削弱了内部动机,蒂西对这一结果的解释是,外部的控制,产生了一种行为的他人决定感,因而降低自信感或称行为的自我决定感,这正是与内部动机相联的一种内部奖励,从而导致了内部动机的降低。
概括性的理解,认知心理学深刻揭示了奖励与惩罚在不同条件下对人类个体行为的不同影响。根据认知心理学的观点,奖惩对行为的影响首先取决它们给个体提供了什么样的信息,其次取决于接受者结合经验与情境两方面的因素所做的解释,并最终决定于后者。例如,在竞争性场合中,奖励具有肯定受奖者具有较强能力,指明他比别人强的信号作用;在合作性的情境中,奖励提供了受奖励者进步和努力的信息。在一个人完成了比较容易的任务而受到奖励时,实际上暗示出表扬者对他的能力的低估,但比较困难的任务中取得成功时,奖励则表明了对他付出的努力和对他所具有的才能的同时肯定。当一个人感到,对他进行奖赏是为了操纵或控制他时,受奖赏的行为不但得不到强化,其行为动机反而会被削弱;当一个人感到奖励是对他的行为的一种积极的反馈时,奖励就具有增强动机的作用。受外在动机驱动的行为奖赏可以增强其动机,但对由内在动机所驱动的行为来说,给予外在的奖赏可能会使这些活动的内在动机被外在动机所取代,如果在以后得不到进一步的外在的奖赏,那么,就会降低活动动机。
简言之,认知心理学强调了奖与惩的信息作用及接受者对信息的解释,因此,只有当学生从奖惩模式中获取了关于自己行为对与错、恰当与不恰当的信息,关于自己的能力与付出的努力的信息,关于自己所取得的进步的信息时,才能对学生的行为方式与积极性发生预期的、积极的影响。
§§§第三节 教育中奖惩功能观演变的特点与启示
两个流派对以上问题的观点不尽相同,各有侧重的方面。教育学派注重奖励与惩罚功能的研究,行为派注重外部奖励和惩罚的效果,认知派则关注内部奖励和惩罚的效果。通过对教育中奖惩观演变的考察,我们可以得出以下认识:
首先,从教育发展的历史来看,教育中对奖惩的理论探讨和实践应用深受教育的价值取向的影响。在人文主义教育兴起之前,教育无视个体人格的尊严及个体的创造性,所以,奖惩主要用于管理和维持纪律,并以严厉的惩罚、体罚为主。从人文主义教育思想兴起到今天,随着时代的演变,个性,主体精神和主体意识,创造性等的培养越来越受重视,所以,奖励与惩罚对个体的多方面的影响及影响方式都被逐步揭示出来,奖惩的使用目的也多样化,它们既可以用于管理及促进孩子社会规范的学习,也可以用于促进技能的形成和科学文化知识的学习。面对现实,当创新教育成为时代的主题时,奖惩在创新教育中的作用也将越来越突出出来。
其次,对于奖励与惩罚的理性探索深受科学发展水平的影响。在心理学兴起之前,奖与惩的探索主要在哲学范畴中进行,心理学兴起之后,奖与惩成为实验研究的内容;在心理学发展的早期,关于奖惩的结论主要以动物实验的结果为依据提出,随着心理学的发展,关于奖惩的结论越来越依据对人类个体的研究。
第三,教育中对奖惩功能认识演变的总体趋势是,从只重视奖励与惩罚对学生外在行为的影响,到全面揭示出对内在的心理的多方面影响。随着人们对奖惩功能认识的深化,惩罚在教育中的地位逐步降低,奖励的地位逐步提高。关于惩罚,几乎所有的教育家和心理学家都强调,其作用在于使学生懂得自己行为的错误,以便能够改正,而不是要使学生感受到痛苦。惩罚的威胁作用也受到许多理论家的重视。教育家如赫尔巴特就强调这一点,后来,一直到现代,心理学家奥苏伯尔也强调,惩罚的作用在于促进学生做出积极的努力以避免惩罚而不是要学生真正体验到惩罚。只有极少数教育家坚持学生要为自己的错误行为付出代价,如卢梭关于“自然后果”的论述实际上就是要学生体会到错误行为的后果。总体来看,奖赏(励)的诱因作用和惩罚的威胁作用越来越降低,它们分别具有的强化作用和信息作用越来越受到重视。