(Stimulus.Control:.Cooperation.With.Coercion.–.p.68).
无胁迫性质的合作关系
刺激的种类 (p.114)
(Stimuli.–.p.68).
「刺激」是任何导致某种行为产生反应的东西,有些刺激可以引发反应,但并不会产生学习或训练效果,当我们听见大声响时会缩一下,光很亮时会眨眼,闻到厨房传出诱人香味时通常会走进去,动物也会有同样的反应,这些声响、亮光和气味就是所谓的「非制约刺激」 (unconditioned stimulus)或「初级刺激」(primary stimulus)。
另一种刺激是经由学习而得的,它们本身可能毫无意义,但在与受到增强的行为产生关连之后,便成为动物能够识别的行为讯号。每天我们都对许多习得讯号有所响应,看到交通号志会停下或前进,电话响了会赶快去接,在吵嚷街头听到自己名字会转头等等,这些都被称为「讯号」(cues或signals)。
我们之所以习得这些讯号是因为与它们相关的行为不断受到增强,例如接起电话铃声就会停止(铃声是负增强物),然后传来对方说话的声音(说话声是正增强物,或许该说这是大家所期望的),这些讯号(或称「区辨刺激」(discriminative stimuli))具有预告或通知的作用,让我们知道这时候可以出现过去曾获增强的行为。反之,当这些刺激没有出现时,表现出这些特定行为将不会获得增强,例如电话没响时,拿起话筒只会听到嘟嘟声。
多数正式训练都把大部份的心力及时间投资于建立区辨刺激,无论是操练新兵的军官或上训犬课的饲主都是如此,让训练对象听令行事的指令,其实就是区辨刺激。
让对方听令行事 (p.115)
(Establishing.a.Cue.–.p.70).
要狗坐下或要人停步并不足为奇,但如果在下令后训练对象即刻动作而且动作迅速标准,那名叫人印象深刻!这便是「服从」- 不只让对方表现行为,而且是在讯号下达时即刻执行行为;心理学家称这种现象为「行为受到刺激控制」,训练起来并不容易,需要遵循训练规则,值得我们好好研究。
即使你压根不想使唤狗儿做这做那,这辈子也没计划操兵,但了解刺激控制仍然会对你有所帮助。当小孩到处乱跑,怎么叫也叫不过来,这代表你的刺激控制很糟糕,而如果你是位上司,必须下达两三次指示下属才开始动作,那么你的刺激控制便出了问题。你听过从自己嘴里说出的话?「我已经告诉你千万遍了,不要再________!」(空格里可能是:用力摔门、把湿泳衣放在沙岭上或其它行为)如果讲了一次、甚至一百次都没有用,这个行为则并未受到刺激控制。
我们可能以为自己做到了刺激控制,但其实不然。当我们预期看到服从讯号或指令的行为却又不见反应时,一个常见的反应就是加强讯号;侍者听不懂你说的法文?那就再讲大声一点!这么做通常不管用,因为讯号接收的对象必须能够认得这个讯号才行,否则不管是大声喊叫或透过摇滚乐团的扩音喇叭喊,对方仍然只会不解地望着你。
动怒是另一个面对指令失效时的反应,这种反应可能管用的情况只有两个:当对方出现你不喜见的行为时,或熟知讯号却没有出现熟练反应时。这时暂时置之不理或表现动怒的样子,有时或许可能引发好的行为。
有时训练对象虽然出现正确反应,但反应却慢半拍或动作慢吞吞。对指令反应迟钝通常是因为没人教导训练对象必须迅速反应,当训练对象出现正确或迅速的反应却未获正增强,没有机会学习迅速服从讯号对牠(他)有利,这个行为便未受到真正的刺激控制。
生活中到处都是刺激控制不良的例子,当有人想伸张权威时,很可能会有人因为「不服从」而惹上麻烦,但真正的问题出于对方不明白或无法执行指令 – 沟通不良或刺激控制的训练技巧不佳。
建立讯号 (p.116)
传统训练师在训练之前便开始使用讯号,他们先说:「坐下!」然后再压下狗儿屁股,让牠做出坐下的动作,重复多次之后,狗儿为免继续被压而学会坐下,而且牠在这过程里学会的是「坐下」二字代表一个牠可以避免被链子抽的机会,只要出现坐下的动作就好,所以传统训练使用的讯号或口令其实就是制约负增强物。
相较于传统的训练法,我们在进行操作制约时会先塑形行为,毕竟,要狗儿去做一件牠不可能听懂的事情毫无道理。等到行为出现的频率稳定后,我们才会在某种特定刺激出现期间或之后塑形这个行为的出现,例如我们会利用响片和增强物塑形坐下的行为 - 使狗儿迅速坐下、动作不拖泥带水、坐得久而且经常坐下,有时在草地上坐,有时在地毽上坐,符合多项增强要求 - 直到牠为了获取增强物,极有自信的坐下。此时我们再加入一个具有绿灯意味的讯号,表示一个出现特定行为获取增强物的机会,这类讯号便成为制约正增强物:在它出现之后绝对有好无坏。
加入讯号有多种方式:第一个方法是,你可以在行为启始时加入讯号,当完成行为时予以增强,然后在不同的时间和不同地点重复这么做,渐渐越来越早下达讯号,直到讯号出现在行为启始之前,不久之后训练对象就会把该讯唬视为出现特定行为即会被增强的机会,当你说:「坐下!」必狗儿将会坐下。
第二个方法(也是我们用在海豚身上的方法),交替运用「给讯号」和「不给讯号」。当狗儿经常出现坐下行为时,对牠说:「坐下!」待牠坐下时即按响片。接着,让牠坐下一两次但不按响片也不给赏,然后再说一次:「坐下!」出现坐下动作时即予以增强;在同一段训练时间里,你同时增强了听讯号的坐下行为,也使缺乏讯号下的坐下行为消失。
一旦你的训练对象了解这例规则,新讯号几乎可以马上与新行为联结。然而,当毫无经验的动物第一次学习讯号时很可能会遇上困难,困难来自所谓「消弱」(extinction)的过程。消弱是指过去一直受到增强的行为不再获得增强,这是个不快的经验(请见第四章详述),而且可能引发情绪反应。我曾经被海豚溅水溅得全身湿透,因为牠很生气原本一直可以换取鱼吃的行为现在竟然不管用了。
第三个加入讯号的方法是塑形对讯号的反应。如同塑形行为本身一样,如果坐下是幼犬接受响片训练的第一个行为,你可能会发现牠的动作比你还快,不断坐下的动作几乎让你目不暇给,「这只狗一直」「对着『你』胡乱坐下」响片训练者通常会这么描述这种现象,这时便是加入讯号的最佳时机,牠已经准备好学习讯号,你必须告诉牠何时坐下才管用,避免牠在你双手拿着大包小包东西时自己跑到你脚边坐了下来。
拿出你的响片和零食,说:「坐下!」,只要牠的屁股稍梢往地面沉下一点儿就按下响片,不要等到完成坐下的动作才按。接着丢出零食让牠起身去捡食,再说一次「坐下!」然后在牠完全坐下之前就按下响片;这个「坐下」的讯号还可以加上手势或清楚的肢体动作,但按响片当下即必须停止所有辅助讯号。
以这种方式训练,通常只要经过几次按响片给赏的过程,即可出现依讯号出现的积极坐下行为。下一步,说出:「坐下!」但等牠屁股完全贴地坐着才按响片(牠才不会养成半蹲一下就起来的习惯),接着把其它一些熟知的行为(或许是唤牠过来摸摸牠等行为)穿插在加强坐下新讯号的练习之间。
最后一步则是塑形等候讯号出现的行为 -- 初时半秒,然后一秒、三秒,直到狗儿显然把注意力放在你的身上,但是未下达讯号前不会坐下。达到这个程度之后,你便可以慢慢不用那些辅助讯号,只使用口头讯号,这时讯号之下的反应已经受到操作制约,狗儿因为期望获得增强而表现行为。
据我观察,这是建立个别讯号最快的方法,也最快能够建立「讯号指示特定行为发生」的一般概念。在一次训犬讲座上,有名女子带来一只刚从收容所领养来的四个月拉不拉多幼犬,我利用星期六午餐时间协助她训练幼犬的第一个响片行为 -- 趴下,如果我说这只幼犬一无所知,完全没接受过任何训练,应该不会有人异议,单单只是让牠注意到自己的行为可以影响零食的到来就花了很长时间。
当天下午我们练习如何塑形出对讯号的反应,隔天午餐时间这位女子和幼犬来到我身边,猜猜看这个幼犬在二十四小时内学会了什么?坐下、趴下、翻滚、招来、超级厉害的「击掌」(牠把重心完全移到左半部身侬,直直地把右前脚举到最高处),以及拾回的初级版动作,所有动作完全按讯号行事,迅速确实而且正确无误,变换讯号出现顺序亦然。除此之外,这只幼大变得神采奕奕、专注、兴高采烈、全力以赴 -- 准备好不枉这一生。
刺激控制的规则 (p.120)
(The.Rules.of.Stimulus.Control.–.p.73).
刺激控制有四个层面。当狗儿学会听口令坐下(不管使用哪种方法)之后,训练就结束了?不对,这个任务只完成了一半,动物必须另外接受训练,而且这是一项不同的训练任务 -- 学习在没有口令时不要坐下。在制约刺激没出现时,动物不会出现该行为,否则该行为的刺激控制仍未完成训练。
当然,这并不表示除非对狗儿下令坐下,否则牠必须整天站着。训练对象在自己的其它时间里当然可以任意行为,但是在训练或工作的情境中将会用到区辨刺激(或讯号),这时若想要稳定的行为表现,就必须建立讯号的两个层面:「何时进行行为」以及「何时不进行行为」。
达到理想的刺激控制有四项要件,训练时必须把每一项当成个别目标,成为塑形过程中的独立部份:
1. 制
约刺激一出现,行为永远立刻发生(叫狗儿坐下,牠即坐下)。
2. 没
有制约刺激时不会发生行为(在训练或工作情况下狗儿从未自行坐下)。
3. 其
它刺激出现时从来不会姿生这个行为(如果你说:「趴下!」,狗儿不会坐下)。
4. 这
个刺激出现时不会引起其它行为反应(当你说:「坐下!」,狗儿不会出现趴下或跳起来舔你脸的反应)。
只有在四要件都达成之后,狗儿才算真正、完全地懂得「坐下!」的口令,现在你有了真正的刺激控制。
日常生活中,我们会在哪些地方使用或需要如此完全的刺激控制呢?以音乐为例,管弦乐团指挥家常使用极其复杂的刺激控制,因此在排演时他可能遇上各种错误的反应,例如他可能示意要求「Forte」(强音),加大音量 - 但却无响应,或许原因是他还没有明确建立起讯号的意义,或者他可能已经避免作出加大音量的讯号,但是音量依旧过大,古典管弦乐团的铜管乐器部以此称着,指挥家理查·史特劳斯(Richard Strauss)列出一些挖苦年轻指挥家的规则,他说过:「绝对不可用鼓励眼神看着铜管乐手。」而业余合唱团常出现这种情形,指挥家可能示意出现「Presto」(急板),但音乐速度没加快,音量却变大了,尤其是独唱男高音常出现这种状况。讯号引发的每一个错误反应都必须经由训练更正,直到指挥家对自己的刺激控制感到满意为止。
刺激控制在军队里也极为重要。新兵训练时以连珠炮口令不断要求动作,重复操练不但非常耗费体力也很耗时,在新兵看来这个做法似乎既困难又毫无意义,可是它有个重要功能,它不但能使新兵对口令迅速反应,让指挥官能够有效动员大批军人,同时也训练出「听令行事」的技能,毕竟它不只是一种心态,也是一种习得的能力,这对士兵而言极为重要,常有保命的作用。自从军队存在以来,连珠炮口令操练一直是用来训练这种能力的方法。
哪种讯号? (p.122)
(What.Kind.of.Signal?.–.p.75).
区辨刺激可以是训练对象有能力察觉的任何事物:旗帜、光线、话语、抚摸、振动或开香槟时的啵声,只要训练对象能够察觉这个讯号,它即可拿来引发习得行为。
海豚通常以手势训练,但是我知道有只眼盲的海豚学会以许多行为响应不同的碰触方式;牧羊大通常以手势和口令训练,不过纽西兰的乡间广阔,人们常用尖锐的哨音当作讯号,它传递的距离比口令远。而当纽西兰牧羊人把狗儿卖给别人时,新主人可能住在数哩之外,由于哨音无法以书写方式描述,旧主人会以电话教授新主人指令,或者给他哨音的录音带。
鱼类能够学会对声音或光线出现反应,我们都知道,敲打水族箱玻璃或开灯时水里的鱼会很快地游近水面。而人类几乎对任何束西都可以作为习得讯号。
在工作情境下,让所有训练对象学习相同的讯号是很有用的,这么做其它人才能引发相同的行为。动物训练师对于所使用的刺激通常相当传统,世界各地的马匹被人踢马肚时都会往前走,缰绳一拉紧就会停步,美国纽约布隆克斯动物园的骆驼听见「couche」(法文「趴下」的意思,音似「酷虚!」)口令时即会趴下,即使周遭的人包括训练师在内都不会讲北非腔法文也无妨,大家都知道这样才能让骆驼趴下,虽然那些纽约骆驼也能够学会以趴下响应「宝贝,装酷吧!」这句话,但这没人在乎。
传统训练师往往没领悟到自己的讯号只是种习惯 (conventions)。有次我在一家寄宿马厩训练一匹年轻马儿,用一条缰绳牵着牠教导「走!」的口令,马厩训马师带着嫌恶的神情观看,最后他终于开口:「妳不能这么教 --马儿不懂『走!』,妳必须说:『帖 - 提克!』」他一边从我手中拿走缰绳,一边说:「帖 - 提克!」并且以缰绳另一端抽了一下小公马屁股。这个动作当然使牠开始往前走,他说:「看吧!」但是他的行为正是习惯的实证。
从那时起我无论把我的马儿放在哪个马厩寄宿,我都训练牠们不只对我的口令有反应,也对马厩训马师所使用的「几地亚普!」(giddyaps)、「据!」(gees)、「喝!」(haws)和「喔欧!」(whoas)等口令有反应,这样可以避免麻烦,而且也让他们认为以业余训马师来说我算是相当有潜力,至少我没搞错这些讯号!
训练马儿遵从两套口令不仅有可能而且很容易,虽然你希望一个刺激只引起一个行为,不过由数个习得讯号引纵同一个行为绝对可行:例如,在挤满人的房间里,讲者要求大家安静时可以大喊「安静!」、站起来单手比出代表「嘘!」的姿态,或者当大家很吵时,拿汤匙敲敲水杯也管用,我们都已被制约成对至少三种以上的刺激响应出安静下来的同一个行为。
为习得行为建立的第二个讯号称为「转移刺激控制」:先呈出新刺激(或许是新口令),然后呈出旧刺激(例如手势),再对出现的反应予以增强,接着渐渐使旧刺激越来越不明显,而同时将新刺激表现得极其显眼,直到新刺激引起的反应和之前一样好,甚至可以完全不再给旧刺激。这种转栘通常比训练第一个讯号来得快,因为「出现这个行为」和「讯号出现时才出现这个行为」的概念已经先行建立了,于是学习「另一个讯号出现时才出现这个行为」的概念就会比较容易。
讯号强度和淡出 (p.124)
(Signal.Magnitude.and.Fading.–.p.77).
初级刺激(未制约刺激)视刺激强度而定,能引发不同强烈程度的反应;被针用力猛刺一下的反应会比被轻扎的反应剧烈;声响越大声,惊吓的效果越好。不过,一旦能辨认出习得讯号,便可以出现全然的反应,例如看到红灯时停车,并不会因为红灯的大小而快一点或慢点儿停。只要认出讯号,就知道该怎么做,因此当已习得一个刺激讯号之后,不但可以转移它,也可以让它变得越来越小、几乎无法察觉,却仍能引发相同表现的反应,最后你将能够以极微妙的讯号引发反应,让旁观者看不出端倪,这就是「淡出」刺激的技巧。
日常生活中我们常常用到淡出技巧,原本必须非常大的刺激,例如:「迪弟,不可以把沙子放进别的小朋友头发里。」一边把迪弟拖出游戏沙堆。随着时间过去,它可能转变为一个小讯号,只要挑起一边眉毛或摇摇食指便可以阻止迪弟这么做。
动物训练师有时能够利用淡出的刺激引发看来神乎其技的反应,我曾在美国圣地亚哥野生动物乐园(San Diego Wild Animal Park)看过一个很有趣的表演,一只鹦鹉只要看见训练师手部的微妙动作即会爆棱歇斯底里的大笑,你应该可以想象这有多么好运用:「帕特罗,你认为这名男士的帽子如何?」「哈哈哈…」由于观众没看到讯号,这只鹦鹉唯一的习得行为看来就像聪明地给了一个嘲讽苛刻的答案,牠其实只是对一个完全淡出的刺激出现及时反应。任何聪明嘲讽的成分,应该归功于训练者,或者设计对白的人。
我所看过最佳表现制约、淡出和转移刺激的例子并不是在动物训练的领域,而是在交响乐团的排练上。我以业余歌者的身份参与过多个歌剧和交响乐合唱团,它们常由客座指挥家领团,虽然指挥家给予乐手的许多讯号多多少少具有一致性,每位指挥家也有独特的个人讯号,而这些讯号的意义必须在极短期问建立,因为排练时问几乎不比演出时问长。有次排练古典音乐家马勒第二号交响曲【复活】时,我看见指挥家建立一个代表「轻声演奏」的无制约刺激,他作出听到警铃四起的神情,躲避爆炸似地蹲伏着以单手蔽脸,大家都意会到动作的意义,接下来几分钟内他已能够淡出刺激,只要他瞥一眼提示并稍弯下身子,或者很快用手势比一下即可降低任何一部合音的音量,最后只须稍微缩一下肩膀即可。
指挥家也常转移刺激,将已知姿势或大动作(例如手心向上栘动代表「大声一点!」)与未学过的姿势(例如偏头的个人特色或转身动作)作结合,我有次坐在位于指挥家左侧的女低音部,看见这位客座指挥家只花了一些时间即把控制女低音部音量的所有讯号全转移到他的左手肘。
建立起刺激控制的一个结果是,如果训练对象想以正确反应获得增强,尤其在刺激已淡出之下,它必须变得很专注,事实上它到后来或许将能察觉极细微的讯号,甚至连训练者也没意识到自己给了这些讯号。「聪明汉斯」就是一个典型例子,这匹二十世纪初的德国马儿被视为天才,牠能够以蹄抓地数数字、算术、拼字,甚至能开平方根,答对时当然都会获得一点食物奖赏。牠的饲主是位退休教师,他真心以为自己教会这匹马阅读、思考、做数学及沟通,但事实是即使饲主不在场这匹马仍会「回答」问题。
许多前往柏林研究聪明汉斯的学术人士皆确信牠是天才,不过后来终于有一位心理学家证实牠是受到某个讯号的提示,因为当全场无人知晓答案时,牠抓地的动作会一直持续下去。更进一步的研究证实(虽然坚信牠确为天才的人不断抗议),让马停止抓地的讯号是饲主或其它出题者在看见抓地次数到达正确答案时,会稍把头抬起一点儿,这个轻微的动作原本因为教师戴着宽帽而格外明显,而如今它已成为非常细微的动作,不但几乎看不出来(除了聪明汉斯以外),而且几乎无法以意志抑制,所以这匹马即便是看到非饲主的人仍能分辨何时该停止抓地。
(聪明汉斯『Clever Hans』现象)已经成为一个代名词,指某些行为(有关动物智商或通灵现象)看似不可思议,但其实是非意识讯号引岭的结果,因为测试者一些微不足道的动作或已淡出的行为已成为行为对象的区辨刺激。
有效又好用的目标物 (p.127)
(Targeting.–.p.79).
目标法是许多海洋哺乳动物训练师的最爱,几乎每个海洋世界都可以看到目标物的使用,训练师伸出拳头让海狮来碰,然后借着移动拳头让海狮跟随移动到表演台的不同位置;海豚学会从水中垂直跳起来去碰一颗吊在高处的球,有时两三名训练师会在池边各自站定,每个人拿着球或伸出棒状软垫标的物,让虎鲸进行目标碰触,于是连续从一处游到另一处。
对于刚开始学习增强训练的人而言,教导动物以鼻头碰触棒子末端是绝佳的入门练习,这个行为不但看得到也感觉得到,动物很容易即可获得增强,而且很容易让人明白如何一点一点地提高增强要求标准:棒子离鼻头两吋,离四吋,在左边,在右边,在上面,在下面,再往前,直到这只动物(或鸟儿,或鱼儿)能跟随这根标的棒移动。有家荷兰训犬学校的老板告诉我,某天早上她以响片训练家猫去碰咖啡匙,然后便能够让牠跟着绕了餐桌一圈,这个经验让她非常信服,马上把整个训犬学校的方汰改为响片训练。
动物园利用目标法(加上响片和食物)让老虎和北极熊移动到另一个栏舍,使懒猴和狐猴等小型动物停着不动让医护人员进行治疗或检查,也利用目标法来分散动物。圣地亚哥动物园行为馆馆长盖瑞·普莱斯特(Gary Priest)拍了一段录像带,三只长颈鹿在学会碰触三个不同的目标物后,训练者于是能够塑形牠们安静进入围栏并容许人员进行修蹄的动作。
狗儿饲主更是活用目标棒,你可以使用目标棒教会一只横冲直冲、无可控制的狗儿乖乖在脚侧随行,不必抽扯牠的牵绳,也不必费心劳力地训练,只要慢慢拉长「鼻子大约维持在此处即会得到响片给赏」的时间长度就好。你可以把目标棒插在地上,利用它教导狗儿一出现讯号便离开你身边,这是服从竞赛选手常觉得困难的项目。你可以利用目标棒带着狗儿穿越障碍或进入新的地方,警犬和搜救犬训练师常会利用雷射笔指示狗儿前往特定区城,猫咪也根容易学会追逐雷射笔投射出的小小红点,这是与足不出户猫咪玩耍或让牠运动的好方法。当你的猫在你一下达讯号时即刻跳到冰箱上头(利用雷射笔训练),你的客人们绝对会叹为观止。
对于有口语沟通障碍的人类,以标定讯号和零食达成的标的训练一样非常有效!一位特殊教育的老师告诉过我,她在看过海洋哺乳动物训练师使用目标物之后,立即把目标法应用在自己工作上;有天她被分派指导一名具有发展缺陷又极度活跃的小男生,他必须坐在桌前完成作业,但是他们平常使用的教室正有人使用,所以他们来到周围全是大球、摇椅和攀爬设施的体育室,小男孩当然为上跑去玩,她不能抓着他,强迫他坐在桌前,她也不想这么做,所以她伸出手心说:「碰碰!」男孩照做了,她立即回答:「很好!」接着利用「碰碰!」和「很好!」把他引导到椅子上坐好完成作业,中间不时穿插很短的嬉戏时问(当你明白自己能够利用目标物等讯号让训练对象回到身边时,你将会比较愿意利用自由作为增强物!)。
我也曾经目睹利用目标物(包括教师的手和雷射光点)协助严重低功能人士学习行走到教室、桌子或其它目的地,完全出于自愿且无需肢体引导 - 这对学习者或教师而言都是个获得解放的技巧。
以习得厌恶刺激作为讯号 (p.130)
(Conditioned.Aversive.Stimuli.as.the.Cue.–.p.81).
区辨讯号强度可能影响反应的唯一情况只发生于传统动物训练,传统动物训练中使用的讯号(轻拉马缰或牵绳、轻顶马腹)只是过去一些无制约刺激的减轻版(用力猛扯绳子或踢马腹,为的是激棱尚未训练过的反应),所以如果轻度刺激无效,加剧刺激似乎应该得到较大的反应。不过实际这么做却会遇上问题。
习得讯号和初级刺激是两类不同的个别事件,训练新手通常不明白这一点,例如当他们轻轻拉没有反应时,他们就会多用点儿力,然后再继续用力,这一切只是徒劳,因为马匹和狗儿同时也会增加往反方向拉的力道。
传统训练师常把讯号和暴力使用视为两码子事。他们先给讯号,当没有获得服从反应时,他们不会慢慢加重刺激,而是直接使用令动物极度不快的强烈刺激来引发行为 - 强烈到足以(让牠恢复记忆)(一位训马师如是说)。P字链(收缩链)的训犬方法就是如此,在人们学习正确用法之后,即使个头不大的人也可以利用快速抽紧放松的动作把高大的大丹犬吓得魂飞魄散。有了这个初级刺激在手上备用,很快便能发展出轻拉链子即出现良好反应的结果。英国著名训犬师芭芭拉·伍德豪斯(Barbara Woodhouse)指出,以长期来看,这个方法比一直使用中度力道、无效轻扯拖拉着可怜动物的脖子来得人道;不过,利用正增强塑形行为的方法当然更为人道,而且无论就长期或短期来看都较有效率,现代训练师都利用正增强和标定讯号(某些字句或响片)训练所有过去以暴力达成的传统训大行为。
当某个区辨刺激可用来当作避免不快事件的讯号时,它不但可以减少肢体控制或介入的必要性,而且即使训练者不在场也可以抑制行为。我的边境梗犬在幼犬时期很爱乱翻废纸篓,并且把纸篓里的垃圾散得四处都是,我并不想处罚牠,但是我也不想得时常倒废纸篓。
于是,我在喷水瓶里装了水,加入几滴气味浓郁却很怡人的香草精油,然后咬着牙勉为其难地朝牠的脸喷,牠很不高兴地跑走。之后我在废纸篓喷了香草精,牠便从此再没接近过废纸篓。牠并不讨厌这个气味,这个气味刺激完全是中性,牠真正讨厌的是这个气味引发的联想。为了维持牠不再接近废纸篓的行为,大约每三个月就必须补充刺激浓度,在废纸篓上喷几滴香草精,但我再也没有必要直接往狗儿脸上喷了。
让狗儿待在隐形围栏系统(Invisible Fence systems)内,就是应用相同的原则。你在希望围住狗儿的地域四周安置一条无线电线圈,让狗兄配戴装有接收器的项圈,当狗儿太接近线圈即遭项圈电击,不过在这之前,必须设定一个警告声,当牠接近距离电线几呎处时项圈即发出警告声,这个区辨刺激即代表「别再继续往前走!」。如果系统装设正确,它将可以有效围住受过训练的狗儿,狗儿永远不会真的遭受电击。
我和我的梗犬住在森林里时曾使用过这个系统,当时若使用真正的围篱,等同随时邀请牠设法在围篱下挖洞或趁门没关时逃脱,这种使用制约警告讯号和隐形围栏的方法安全稳当太多了。
限定反应时间 (p.132)
(Limited Holds – p.83)
想训练动物对区辨刺激出现迅速反应,「限定反应时间」(limited holds)是个非常有用的技巧。假设你的训练对象已学会依讯号出现行为,但总是需要一段反应时间,譬如喊大家吃晚饭,他们总是慢吞吞才来,或是你示意停下来,但是你的大象只慢慢减速,最后才完全停下来。如果你希望的话,其实可以利用「限定反应时间」的方法塑形出较短的反应时间,直到对方在能力可及范围内达到最短反应时间。
首先,算出一个过去反应时间的平均值,然后只增强在这个反应时间内出现的行为;由于动物行为具有变异度,有些行为会超过反应时间,这些行为将不再获得增强。举例来说,叫大家吃饭之后,等一段固定时间就上菜,晚到的人可能就必须吃冷菜或无从选择菜色。
当你设限反应时间,只增强时限内出现的行为时,你会发现所有反应将慢慢集中在时限内发生,不再有拖延的情形。全家人到齐来到餐桌的时间得花十五分钟?现在,你可以再缩减时限,在叫大家吃饭后十二分钟就上菜,共或十分钟。逐步减缩时限的步调完全依靠判断,如同塑形原则一样,你希望行为发生于设定的时限范围内。
动物和人类对时间都极为敏感,在反应时间受限时都将出现极其准确的反应。但是训练者若希望有效利用限定反应时间的技巧,则不应该依赖胡乱猜测,应该使用时钟或甚至秒表。假如行为反应时间比钟表可测的时间单位更短,你可以利用默数,例如使反应时问从一、二、三、四、五缩短至一、二。当然,训练对象若是人类,只要着手去做,静待它发挥成效就好。
60年代海洋生物世界最让人惊艳的表演秀高潮之一,是由六双小飞旋海豚(spinner dolphins)同步演出多种腾空花式动作,依照水底声音讯号的变化而做出各式跳跃旋转。训练初期,无论要牠们跳跃、翻转或做其它动作的讯号出现时,牠们各自在十五至二十秒之间此起彼落,动作很不整齐。于是我们利用秒表和限定反应时间的技巧把反应时间压缩到两秒半,让每只海豚都知道如果想吃鱼,牠必须在讯号出现之后两秒半内跃出水面,做出正确的跳跃或翻转动作。后来,每只海豚全都专心一意地待在水底喇叭附近,当讯号一出现,海豚立即从水中爆冲而出,跃入空中扭转翻滚,场面相当壮观。有一次,我在观众席上无意间听到一段很好笑的对话,一位看来像教授的人斩钉截铁地告诉同伴,要获得这种准确无误的反应,唯一的作法就是利用电击。
限定反应时间的日常应用,即在要求或指示下达后你愿意花多少时间等待响应,如果家长、上司或教师在限定反应时间之后从一而终,他们通常被认为很公平,而且说话算话,即使限定的反应时间(行为必须在时间内出现否则不予增强的机会窗口)相当短也无妨。
预期心理 (p.134)
(Anticipation – p.84)
「预期心理」是一个刺激控制常见的问题,训练对象学会了讯号的意义之后,将会迫切想提供行为,因而在讯号尚未实际出现前即出现行为,这种现象称为「鸣枪前偷跑」,源自人类赛跑比赛时因预期心理而出现的行为。那些在他人给予讯号或要求之前即行动的人通常被视成过度急切、奉承讨好或阿谀奉承,这种习性令人生厌,并不是种美德。
参加服从竞赛的杜宾犬有时会遇上这类困难,虽然牠们是极易训练的狗,但是牠们极其警觉,只要预期的指令出现一点点端倪即能察觉,于是常在指令实际出现之前出现动作,因而惨遭扣分。参加小牛套索马术竞赛的马匹也常见这种预期心理的问题,牛仔和马匹原本应待在隔栏后方,等待小牛先跑出去,但马匹常会在过于兴奋的状态中没有等到讯号下达即冲出去。牛仔有时会认为这真是匹好马,但是实则是这匹马儿尚未达成刺激控制的训练。另一个常见预期心理出现的例子是美式足球的「越位」犯规动作,在开始踢球的讯号下达之前,某名球员由于心急而跑入对手防守区域之内,导致所属球队必须受罚。
利用「暂停」的处置可以改善预期心理的问题。若你不想再见到训练对象因为预期讯号而出现动作,你可以停止所有活动,整整一分钟内什么都不做,不给任何讯号,每次训练对象太早出现行为时就停下来,然后再重新开始,让过度急切的行为导致下次表现的机会延后出现,因而惩罚了过度急切的行为。这种方法可以有效消除预期心理,然而如果处以责骂、惩罚或多次重复动作却可能毫无效用。
利用刺激作为增强物:连锁行为 (p.135)
(Stimuli as Reinforcers: Behaviour Chains – p.85)
在制约刺激建立之后,有件有趣的事会发生 –这个制约刺激变成了一个增强物。以学校下课的钟声为例,钟声代表「下课了,你可以出去玩啰!」的讯号,不过它也会被视为增强物 – 孩子们听到钟声会很高兴,如果可以让钟声早点响,他们绝对会这么做。现在想象一下,要是下课钟声必须等到教室安静下来才会响,状况会是如何?每次接近下课时间,你将发现教室变得异常安静。
区辨刺激代表获得增强的机会出现了,所以它成为训练对象乐于见到的事件,而这个事件本身即具有增强作用,意谓你其实可以把「引发某个行为的刺激」作为另一个行为的增强物。举例来说,如果我对猫咪说「过来!」,然后给牠一点零食奖励牠过来的行为,牠将学会这个口令而且也会照做,日后我每次碰巧看见牠坐在壁炉台上时便叫牠过来并奖励牠,很快地,猫咪将因为想吃零食而跑到壁炉台上待着(请记住:从猫咪的观点来看,是牠在训练我,牠发现了一个让我说「过来」的方法)。假设找接着想教牠在我手比着壁炉台时牠就跳上去,并利用食物或「过来!」口令增强这个行为,以后我遇到以下情况即可指着壁炉台:(1)我知道牠肚子饿的时候。(2)牠刚好躺在地上四脚朝天的时候,或者任何其它情况。我所训练出来的是一个连锁行为。
我们在日常生活中常出现一长串的连锁行为,例如木工和家务,都是由许多熟知步骤所构成的一连串行为。而我们对动物也有一样的期待:要求牠们「过来!」、「坐下!」、「趴下!」、「跟好!」等长串连续动作,这种长串连续的行为是「连锁行为」,不同于「长时间维持的单一行为」(维持一小时或做一百次)。连锁行为可以很容易维持,表现不会变差或延迟反应时间,因为每一个行为其实都被下一个行为的讯号或出现机会所增强,直到所有行为完成,最后才获得奖励。
连锁行为可分为数种:由重复发生的同一行为所构成的「同构型连锁行为」(Homogeneous chains),例如马匹连续跳过一连串同型跳跃障碍物;以及由不同行为构成的「异质性连锁行为」(Heterogeneous chains),待最后一个行为完成之后方获增强。
正式的狗儿服从竞赛多半属于异质性连锁行为,例如中级竞赛项目:(1)主人把哑铃丢到跳跃障碍的另一边时,狗儿必须坐在主人脚侧。(2)一听到讯号即跳越障碍。(3)找到哑铃,把它咬起来。(4)衔着哑铃回头并跳过障碍。(5)坐在主人面前,等主人拿走哑铃。(6)听讯号回到主人脚侧,竞赛时这些连续行为的顺序通常一成不变,不过你可以先个别训练单一步骤,或在训练其他连锁行为时顺便练习同样的步骤。
连锁行为的行为顺序并不重要,但它有三点要素:(1)构成连锁行为的个别行为紧凑发生,没有耽搁。(2)这些行为由来自训练者或环境的讯号主导。(3)等到整个连锁行为完成才出现初级加强物。
无论狗儿参加打猎竞赛或赶羊竞赛,每次参赛的习得行为出现顺序或许会因环境不同而大肆更动,然而在牠拾回雉鸡或把羊只全赶入栏内时,整套的连锁行为最后才会获得增强。
连锁行为之所以能够出现是因为个别行为都曾被增强,而且都受到刺激控制(即完全依讯号行事),于是这些保证增强物一定会出现的习得讯号可用来维持连锁行为的个别行为。讯号可由操作手给予,牧羊人以哨音告知牧羊犬转弯的方向、行进速度、何时停下和何时回头;讯号也可由环境提供,参加服从竞赛的狗儿在跳越障碍之前,眼前出现的哑铃便是要牠拾起来的讯号,而拾起来的动作是回到操作手身边的讯号,看到障碍物则又是跳越的讯号,主人不必为这些连锁行为中的个别行为提供口头讯号,可是讯号早已存在。
有时,前一个行为就是下一个行为的讯号。我最近刚搬到一个新城市,找了一处新家也设置了新公司,我把新地址、新电话号码、新传真号码和新的电子邮件账号全背了下来,但是有好几个月,我没办法从这一连串的数据中抽出片段数据告诉他人,直接问我邮递区号是多少,我肯定当场被考倒,除非让我先背出镇名和州名,接着我才能顺利背出邮递区号。电话号码也是如此,我必须先说出区域号码才能背出其余的号码 -- 这就是一种内建讯号的连锁行为。
我们每天所做的许多事(如冲澡后穿上衣服)都是这类连锁行为。行为分析学者发现教导具有发展缺陷的人们时,仔细建立依讯号行事并获增强的连锁行为对于这些人的独立或半独立生活技巧有极大帮助。
我们都看得到连锁行为的用处及效用,但是我们常看不出来的是,我们眼中所见的错误行为常只是连锁行为瓦解后的结果。我帮训犬师上操作制约课程时曾听过许多他们在狗儿没做对时的解释:「这只狗很顽固。」、「牠只是企图报复我。」、「牠很紧张/发情了/刚发情结束。」或其它说法。其实牠的犯错,只是训练者建立或维持连锁行为不力的结果。
当构成连锁行为的行为当中,有一些未学成的行为或尚未受到刺激控制的行为时,这个连锁行为便会瓦解崩离。当训练对象不懂得讯号或无法达成讯号所要求的行为时,你便无法利用这个讯号增强,这代表每个连锁行为都应该倒过来训练,从最后一个行为开始训练。先确定训练对象已经学会这个行为,而且也能辨识出引发这个行为的讯号,然后再训练倒数第二个行为,如法炮制直到完成所有行为。当你想背一首诗、一段音乐、讲稿或台词时,把它分成五个段落,把次序反过来,从最后一段开始背起,从自己最弱的部份背到最熟练的部份;相反的,若依照记忆内容原先撰写及呈现的顺序开始背诵,你便必须不断从熟悉的段落背到较为困难且未知的段落,这种经验让人极无成就感。以看待连锁行为的方式处理背诵一事,不仅可以缩短所需的记忆时合,也能让整个背诵过程变得较为愉快。
连锁行为是个独特奇怪的概念,我自己也曾经因它大感挫折,觉得自己已经无计可施了,却还是没办法让某只动物、某个小孩或自己去进行一些显然并不难的连锁行为,直到我领悟到原来我一向把连锁行为的训练顺序弄反了。
加上糖霜装饰是做蛋糕时的最后一个步骤,如果你想让孩子喜欢做蛋糕这件事,你的第一步应该是在装饰糖霜时请他们来「帮忙」。
教狗儿玩飞盘:一个连锁行为的例子
(An Example of A Behavior Chain: Teaching A Dog To Play Frisbee – p.89)
我有一位住在纽约市的朋友,每个周末都带他的黄金猎犬到中央公园玩飞盘,他告诉我,生活中似乎到处是束手无策、不知如何教狗儿玩飞盘游戏的人。这真是一件可惜的事,因为对居住在都市里的大型犬而言,玩飞盘是绝佳的运动方式。飞盘虽的速度比球慢得多,移动的方向也较飘忽不定,或许更接近真正的猎物。激励狗儿跃入空中做出花式飞接让饲主感到很有趣,而且玩飞盘时饲主可以站在原地,却仍能让狗儿来回奔跑。