”实际上,得到食物这个结果是学习开门的一个奖赏。
开门的行为就像我的工作,食物就好比我的工资。
我们回到最开始的问题上:我的工资是否对我有影响——我不停地工作,就像桑代克的猫不断地开门去获取食物一样。
因此,我行为的结果事实上导致我不断地出现相同的行为。
强化刺激下奔跑的老鼠当行为或者事件的结果使得行为或者事件出现的可能性增加,我们就把这个结果叫做强化刺激。
它就像奖赏,我们知道,当我们做了事情受到奖赏时,我们通常还会再做这样的事情,希望再次得到奖赏。
操作性条件反射讲的就是强化刺激对行为的影响。
斯金纳,最著名的行为主义心理学家之一,跟随桑代克的脚步,继续使用动物来研究操作性条件反射。
他做了一个箱子,里面有一根杆,称为斯金纳箱。
当动物压杆时,喂食者会把食物粒放到箱子里。
斯金纳想看看箱中的老鼠为了获取食物,能不能学会去压杆。
这个任务比想象的要困难很多。
老鼠不习惯压杆来获取食物。
为了促成这个结果,斯金纳不得不增加一个步骤,叫做塑造,用来奖励那些成功接近目标的行为。
对那些接近目标,但还没有达到预期的反应行为,斯金纳都给予食物奖励。
塑造过程有序地进行,这样老鼠就能最终到达按压杠杆、获取食物作为强化刺激的那一步。
当老鼠渐渐熟练后,它们就掌握了按压杠杆来获取食物的方法,这与桑代克的猫学习开门所用的方法一样。
不管出现什么样的行为,说明的是一个道理:老鼠学会了压杆的动作,是因为食物的奖赏“教”会了它们怎么去压杆。
桑代克的猫和斯金纳的老鼠的学习过程,都是因为它们受到了食物的奖赏。
食物对于动物是十分有力的奖赏,但食物只是一类强化刺激,任何能够增加行为再次出现的可能性的东西,都可以用来作为奖赏或者强化刺激。
食物,钱,休息或者假期都可以用做强化刺激。
强化物的类型有两种基本的强化物:正强化是使用强化物增加行为出现的可能性。
负强化减少不良刺激,增加正确行为出现的可能性。
操作性条件反射的基本观点是,经过强化(无论是正强化还是负强化)后,行为更可能再次出现。
但是所有的强化物都是这样吗?所有的强化物效果都一样吗?如果老鼠每次按压杠杆斯金纳都给它5美元,老鼠还能学会同样的反应吗?很可能不会。
强化物不同,对反应的影响也不同。
不是所有的东西都能达到奖赏或者强化的效果。