Clicker-training: dolfijntraining voor je hond

Bijna iedereen is wel eens naar een dolfinarium geweest of heeft toch minstens een dergelijke show op televisie gezien. Om de paar uur werken de dolfijnen daar een prachtig programma af met hoge sprongen en buitelingen, onderdelen waarbij een groep de sprongen precies tegelijk uitvoert en de dieren leuke grapjes uithalen met de trainer en het publiek. Wat mij altijd opvalt, is het plezier dat er bij de dieren van afstraalt. Hoe werden hen al die oefeningen aangeleerd? Je raadt het al: met clicker-training.

Om te kunnen overleven in de natuur is het voor dieren noodzakelijk om zich aan te passen aan hun steeds veranderende omgeving. Daarom leren dieren van de gevolgen van hun acties. Als een dier iets doet dat wordt gevolgd door iets plezierigs, is de kans groot zijn dat hij het opnieuw zal doen. Andersom zal het dier, als zijn actie wordt gevolgd door iets onplezierigs, dat gedrag minder vaak of zelfs niet meer herhalen. Dit zijn algemeen geldende leerregels. Zie ook de artikelen Gebruik belonen effectief! en Straf: een middel met veel valkuilen.

De clicker-methode concentreert zich op de op beloning georiënteerde kant, die aangeduid wordt met positieve versterking.

De clicker

Karakteristiek voor de clicker-methode is natuurlijk de clicker zelf. Dit apparaatje is een robuuste uitvoering van wat vroeger ook wel een ‘kikkertje’ werd genoemd en brengt een klikgeluidje voort. Door dit geluidje steeds te laten volgen door een beloning (meestal een voertje, maar andere soorten beloning zijn ook mogelijk en zelfs wenselijk), wordt het een geconditioneerde versterker. Het dier weet dan dat als het dat geluidje hoort, er voor hem iets leuks gaat gebeuren. Als je nu steeds op het moment dat de hond gaat zitten klikt en vervolgens beloont, leert hij dat gaan zitten leuke gevolgen heeft. Hij associeert het moment van de klik met de beloning, niet het moment dat hij de daadwerkelijke beloning (de primaire versterker) krijgt.

Maar waarom dan een geconditioneerde beloner? Het nadeel van het direct toedienen van bijvoorbeeld een voertje, is dat je vaak te laat bent met belonen. De meeste beloningen zijn op een afstandje bovendien onbruikbaar. Een clicker heeft enorme voordelen bij het juist timen van je beloning. Dat komt doordat het signaal zo kort en uniek is. Dat is niet alleen voor de hond zeer duidelijk, ook de baas merkt veel beter of hij te vroeg of te laat is dan wanneer hij met de stem beloont. Bovendien is het apparaatje op (gehoors)afstand te gebruiken.

Clicker-training is niet alleen en uitsluitend mogelijk met een clicker. Een andere geluidje, een tongklak of een fluitsignaal (dolfijnen) bijvoorbeeld, of een lichtsignaal, of een gebaar – er is van alles mogelijk. De clicker zelf heeft de volgende voordelen en eigenschappen:

Kort geluid: hiermee is het mogelijk precies een bepaald gedrag te markeren. Bij een langer geluid (bijvoorbeeld “goed zo”) kan de hond al drie verschillende gedragingen hebben vertoond voordat het geluid is afgelopen.
Uniek geluid, in tegenstelling tot onze stem, die we de hele dag gebruiken voor allerlei (voor de hond) onzinnig gebabbel. Hierdoor is een woord voor hem moeilijk herkenbaar, zelfs als het op een andere toon wordt uitgesproken.
Door deze twee eigenschappen ontstaat een duidelijke informatie-overdracht: “DIT gedrag is goed”.
Op afstand te gebruiken. Dit in tegenstelling tot bijvoorbeeld een voertje geven, wat op een meter afstand al onmogelijk goed te timen is.
Het markeert het einde van de oefening. Na de klik is de oefening dus afgelopen. Na het voertje kan de hond de volgende klik proberen te verdienen.
Gemakkelijk te bedienen.
Klein en hanteerbaar.
Het is een brugsignaal: het geluidje legt het verband en overbrugt de tijd tussen het goede gedrag en de eigenlijke beloning. Bij een beetje gevorderde honden heb je na de klik de tijd om een voertje uit je zak te halen.

Niet alleen voor de hond

Dolfijn

Clicker-training niet alleen geschikt voor honden. Het wordt bij ontelbare diersoorten met succes gebruikt. Onder andere bij paarden, ezels, ratten, vissen, fretten, katten, en zelfs bij mensen. Bij dolfijnen wordt het inmiddels het langste als standaard- trainingsmethode toegepast, maar dan met fluitjes in plaats van clickers.
Een dolfijn is moeilijk te straffen of te dwingen, hij zwemt gewoon weg. Heb je toch een manier bedacht? Dat heeft een dolfijntrainer helemaal niet nodig! En denk nu niet dat dolfijnen veel gemakkelijker te trainen zijn dan honden: volgens trainers die beide diersoorten onder handen hebben gehad, is eerder het tegendeel waar. Hoe kan het dan toch dat die dieren meerdere keren per dag van die schitterende voorstellingen geven?

Shaping

Eén kenmerk van clicker-training is het gebruik van “shaping”. Dit wil niets anders zeggen dan dat een gedrag in heel kleine stapjes wordt aangeleerd, vaak beginnend bij een gedraging die het dier uit zichzelf al vaak uitvoert. Als het dier het gedrag, dankzij de versterkingen, duidelijk vaker gaat uitvoeren, wordt er vervolgens pas geklikt als het gedrag iets meer op de uiteindelijke oefening lijkt: de eisen worden steeds ietsjes opgeschroefd. Ook in de traditionele hondentraining worden oefeningen wel in stapjes aangeleerd, maar bij shaping zijn de stapjes véél kleiner. Dat moet ook wel, want het dier moet steeds zelf redelijk gemakkelijk kunnen achterhalen wat de volgende stap inhoudt door te experimenteren. Immers, nergens leer je zo snel en zo grondig van als uit eigen ondervinding. Maar als de leerstappen te groot zijn, lukt dat gewoon niet of slechts heel moeizaam, waardoor de training een enorm frustrerende bezigheid wordt voor trainer èn dier.

Zo zal een niet-getrainde dolfijn nooit spontaan door een hoepel op 3 meter hoogte springen. Zelfs de kans dat hij dat op een halve meter doet, is uiterst gering. Sterker nog, de kans dat een dolfijn ònder water door die hoepel zal zwemmen, is erg klein. Een dolfijntrainer beloont de dolfijn dan ook al als hij richting de hoepel zwemt. Als hij daarvoor op dat moment beloond wordt (fluit+vis), zal hij dat gedrag nog eens herhalen, waarvoor hij dan weer versterkt wordt, waardoor hij het nog vaker zal herhalen. De volgende stapjes zijn simpel: de eisen worden langzaam opgeschroefd, zodat de dolfijn steeds dichter bij de hoepel moet komen om zijn fluit+vis te verdienen. Als hij uiteindelijk door de hoepel zwemt, wordt deze vervolgens steeds hoger gehangen. De dolfijn wordt steeds beloond als hij erdoorheen gaat… en zal tenslotte met gemak door een hoepel op 3 meter hoogte springen.

Op papier lijkt dit misschien een erg langdurige aanpak, maar in de praktijk gaat het, zeker bij een wat ervaren clicker-dier, razendsnel. Karen Pryor, die clicker-training in de Verenigde Staten bekend heeft gemaakt, is het vaker binnen een kwartier gelukt om een dolfijn op deze manier te leren door de hoepel te springen. Ook volgens veel hondentrainers die zowel “gewoon” als met de clicker- methode hebben getraind, gaat het minstens even snel, vaak zelfs veel sneller. En bovendien hebben zijzelf en de hond er veel meer lol in.

Op deze manier zijn heel complexe gedragingen aan te leren. Een praktijkvoorbeeld hiervan is een onhandelbare, zelfs voor mensen gevaarlijke olifant, die leerde zijn voet rustig door een gat in de muur te steken en de voet daar te houden terwijl het eelt van zijn voeten werd bijgeschaafd. Doordat het dier niet kon worden benaderd, was het eelt helemaal doorgegroeid. Een leuke bijkomstigheid was dat de olifant als gevolg van deze training heel wat prettiger in de omgang werd, waarschijnlijk door de vertrouwensband die deze trainingsmethode vaak tussen trainer en dier schept.
Een ander voorbeeld is dat inmiddels paarden, katten en zelfs cavia’s is geleerd om te apporteren. Hoeveel moeite hebben sommige honden hiermee soms om dit te leren!

Eerst het gedrag

Een andere eigenschap van clicker-training is dat niet tegelijk met de oefening een commando wordt aangeleerd. Het dier leert eerst stapje voor stapje het gedrag. Pas als hij de uiteindelijke oefening goed beheerst, wordt een commando toegevoegd.

De reden hiervoor is dat het erg moeilijk is twee dingen tegelijk te leren. Dat heb je zelf vast ook wel eens ervaren. Voor mij was het tijdens dansles vaak onmogelijk om tegelijk het voetenwerk èn de armbewegingen onder de knie te krijgen. Dat lukte me pas als beide bewegingen apart werden geoefend. Als het met beide op die manier goed ging, werd het later weer aan elkaar gekoppeld. Sneller èn minder frustrerend.

Voor de hond is mensentaal iets totaal onbegrijpelijks, waar hij slechts zo nu en dan een bekende klank uit weet te halen. Voor hem is het leren van een commando in de mensentaal dan ook heel moeilijk (daarentegen zijn honden meesters in het oppikken van lichaamstaal), en slecht te combineren met het aanleren van een nieuwe oefening. En nu zou je de hond natuurlijk wel direct een commando kunnen proberen aan te leren – maar een commando zonder gedrag is een beetje nutteloos!

Straf wordt bij de clicker-methode niet gebruikt. De reden daarvoor is niet teerhartigheid, maar het feit dat er in verreweg de meeste gevallen oplossing voorhanden is. Bovendien heeft straf behoorlijk nadelige bijwerkingen, waarvan sommige direct te zien zijn, maar andere pas op de langere termijn aan de oppervlakte komen (zie Straf: een middel met veel valkuilen).

Hond werkt actief mee aan training

Bij clicker-training gaat het erom dat de hond werkt omdat hij dat wil. Je laat de hond namelijk werken voor iets dat hij graag wil hebben of doen. Je geeft hem een grote kans (± 80%) om te slagen. Als iets hem steeds niet lukt, geen nood: dan maak je het iets makkelijker voor hem, zodat hij wèl slaagt. Daarna pas vraag je weer iets meer van hem. Door dat grote slagingspercentage krijgt je hond veel vertrouwen in zichzelf, in jou als trainer èn in de clicker. Je dwingt hem niet, waardoor hij ook geen weerstand kan krijgen.

Met clicker-training leert de hond door eigen ondervinding, door zelf uit te proberen wat wel en wat geen klik oplevert. Je ziet de hond echt denken: “Wat kan ik nog meer doen om die klik te verdienen? Als ik nu zo doe – niet? Zo dan?” Het resultaat is een hond die actief en enthousiast meewerkt aan de training – wat weer een enorme beloning en stimulans voor de baas betekent!

Supersnel leren

Door al deze positieve aspecten – ontspannen sfeer, zelfvertrouwen, succes – is het zelfs mogelijk dat het leervermogen van de hond in een stroomversnelling komt. Het komt voor dat honden wel 10 keer sneller kunnen leren! Een dergelijke versnelling kan met één bestraffing teniet worden gedaan. Op zich al reden genoeg om uiterst spaarzaam met straf om te gaan.

Wil je meer informatie over deze methode, er zijn inmiddels heel veel goeie boeken over clicker-training in het Nederlands vertaald en geschreven. Heb je specifieke vragen (ook over informatiebronnen), dan kun je natuurlijk ook altijd bij mijzelf terecht. Mijn mailadres is: snamkruh.ardnas.[antispam].@kc-delft.nl

Sandra Hurkmans