Belöningssignaler för sökarbete

Att få tillbringa en hel dag på kurs ligger högt på listan över mina önskeaktiviteter, mina två hundar har kanske andra prioriteringar men brukar vara nöjda med att hänga med. När så tillfälle gavs att få delta på kurs ledd av Jens Frank från SWDI, (Swedish Working Dog Institute) och den handlar om belöningssignaler och belöningsplacering för nosarbete är förväntningarna stora och jag anmälde mig och Ria. 

SWDI utbildar tjänstehundar och hundförare inom t ex försvaret, polisen, tullen mm, i Sverige och utomlands. Jens Frank arbetar dels för SWDI och för SLU på Grimsö forskningsstation i Västmanland. För mer information om hur de arbetar så finns en Facebooksida att följa där det ofta läggs ut intressanta och imponerande filmer från deras hundträningen.

Vi var 10 st. med hundar på kursen samt ett antal deltagare utan hund. Jens hade delat in dagen i teoripass varvat med övningar för hund och förare. Vi delades in i grupper med två hundar och minst en medhjälpare utan hund i varje grupp. Målet var att få till markeringar för nosarbete, där hunden ska fokusera under en tid på föremålet/doften utan att vända sig mot föraren och utan att röra föremålet/doftkällan.

Under teoripassen tog Jens upp på många exempel på hur tjänstehundar väljs ut och hur grundträning går till. Han visade många informativa filmer från olika träningspass som belyste vikten av att ha en stegringsplan och följa den, något som han återkom till många gånger under dagen. Inlärningsmetoden som används är i princip alltid shaping, den metod som enligt SWDI är den som fungerar av de vi idag känner till. Jens nämnde här att han är mycket intresserad av ”imitating” som inlärningsmetod. Vi ser detta nu som t ex ”do-as-I-do” och Jens tror att detta kommer att utvecklas och bli stort om 10-15 år.

Belöningssignaler kan delas i tre olika typer:

The ”reinforcing” hypothesis

  • Det som används vid operant betingning, (Skinner). Hunden utför målbeteendet, vi markerar att beteendet var rätt med någon typ av signal t ex en klicker, en visselpipa, ett ”bra”, en spark på bollen eller annan sekundär förstärkare.

The ”marking” hypothesis

  • Plötsliga ljud (Liebermann 1979) t. ex då ett skarpt ljud/ljus inträffar samtidigt som ett beteende ger större sannolikhet för upprepande av beteendet. Forskningen visar alltså att när vi hör eller ser ett oväntat och skarpt ljud eller ljus så har vi och även hunden en benägenhet att minnas vad vi gjorde just då det plötsliga ljudet/ljuset inträffade. Det har också visat sig att dessa beteenden har högre sannolikhet att upprepas. 

Intressant fenomen men inte tillämpbart i hundträning.

The ”bridge” hypothesis

  • En signal fyller tomrummet mellan målbeteendet och belöningen (Kaplan & Hurt 1982) och gör det möjligt att sträcka ut tiden mellan beteende och belöning. t ex dra lätt i kopplet under frysmarkering, prata/sjunga, rörelser, tecken. Hunden har lätt att generalisera detta. En av flera filmer som Jens visade om olika typer av bridge var på en tjänstehundförare från vårt grannland som sjöng norska nationalsången medan hunden stadigt markerade en doftkälla. Så länge hon sjöng satt hunden kvar i markeringen och hon kunde lugnt röra sig fram till den.

Även belöningens placering är viktig vid träning av markering. Den påverkar var hunden har störst förväntan och det är en stor fördel om vi kan kontrollera belöningsplaceringen. Om belöningen alltid finns hos eller kommer med föraren är risken för att träna in felmarkering större, tex hunden hittar föremålet och vänder mot föraren. Jens berättade t ex att när han tränar vattensök riggar han belöningsbollen under vattenytan med en enkel ”kastmaskin”. Då hunden markerar fyndplatsen genom att simma i cirkel ovanför den så skjuts bollen upp.

Belöningens värde är en annan faktor att ta med i planeringen, en felbelöning ger mindre intresse för att vilja upprepa beteendet. Vi fick här se en film där en hund sökte doft i en husvägg och belönades med godis, arbetet gick sisådär, många avbrott och okoncentrerade markeringar. Därefter fick samma hund göra om arbetet men blev nu belönad med boll och en markant skillnad i intensitet och koncentration syntes tydligt. Lekbelöning ger möjlighet att kunna arbeta längre, godis gör hunden mätt efter ett tag. Vid inlärning av nya beteenden rekommenderas en låg nivå på upphetsning hos hunden och för detta kan det behövas lägre värde på belöningen men då beteendet ska upprepas många gånger och säkras i nya miljöer krävs en högre nivå på belöningen.

Jens påpekade flera gånger under teoripassen att de tjänstehundar som vi såg på filmerna selekteras för att vilja arbeta för belöningen och vara lätta att lekbelöna.

Sekundära förstärkare används i många situationer med hunden., ibland utan att vi själva är medvetna om vad vi gör. Om vi t ex ska träna in en passiv markering, att sitta och titta mot ett mål, kan vi göra enligt följande:

  1. använd en leksak som hålls stilla 
  2. hunden ”markerar”, tittar mot leksaken
  3. sätt igång lek

Din rörelse är belöningssignal här.

  • lägg leksaken på marken 
  • hunden markerar 
  • sparka på leksaken och lek med hunden
  • upprepa ovan men sparka nu leksaken och vissla samtidigt – lek med hunden
  • upprepa men vissla innan spark

Visselljud är nu belöningssignal

Sambandet signal-belöning kan mätas som ökad dopaminnivå hos hunden. Att etablera samband tar ca 30-100 upprepningar, att bryta samband görs på 30-50 upprepningar utan belöning. 

Under dagen fick bröts teoripassen tre gånger och vi fick uppgifter att träna med hundarna. Den första uppgiften var: ”Få hunden att fokusera på ett föremål i 3 sekunder innan den får ta det”. Vi fick 5 minuter på oss att skriva ned en stegringsplan för träningen. Jens hade alldeles innan visat en film på en hund som gick fram till en leksak, satte sig och fokuserade blicken på leksaken i ca 30 sekunder innan den fick belöningssignal från föraren som stod 20 meter bakom hunden. Jag trodde en stund att det var så resultatet skulle se ut och fick lite lätt panik när jag försökte få till en plan som skulle gå att genomföra på en timme. Som tur var så var övningen lite lättare än jag befarat, men med en hel del problem för många av oss ändå t ex att hunden är van vid kontaktövningar med föraren och tänker att bara jag tittar min matte i ögonen tillräckligt länge får jag nog leka snart. Jens filmade oss när vi tränade i våra grupper och vid genomgången efteråt fick vi följande tips:

  1. Då hunden inte är intresserad leksaken, t ex en boll, så lek med den, flippa iväg bollen, gör den intressant. Håll den sedan still någon sekund och markera/belöna t ex med klicker och godis när hunden stannar till och tittar på bollen.
  2. Hunden ska själv stanna, säg inte sitt.
  3. Hela jag är en belöning, var tyst och stilla.
  4. Viktigt att rensa belöningssignalen från andra signaler, t ex handrörelser
  5. Dela ”kommando”-ord och kroppsignal, liten tid emellan ger större tydlighet och gör det lättare att ta bort kroppsignalen. Säg t ex först ”varsågod” och ge efter någon sekund ett handtecken, inte samtidigt, gör handtecknet mindre och mindre för att till sist ta bort det helt.
  6. Viktigt att så snart som möjligt få hunden att utföra markering från rörelse för att det ska fungera som en markering i praktiken.
  7. Bra att filma sin träning

Nästa övning blev att sträcka ut tiden för markering till minst 10 sekunder med hjälp av minst en medveten bridge som belöningssignal. Tips för inlärning var att om vi ville använda sträckt lina så skulle vi dra i linan och ge belöning samtidigt och sedan stegvis utöka tiden för sträckt lina innan belöning. Jag och många andra av oss valde den varianten på bridge men någon föredrog att sjunga och någon annan att använda rörelse. Jag gjorde övningen så att jag placerade en leksak på marken och bad Ria ”visa” den. Detta är något hon redan kände igen, men då brukar vi träna på dofter. Jag hade henne i sele och koppel, jag följde efter när hon gick mot leksaken och när hon stannade sträckte jag kopplet. Effekten blev att hon stadigt fokuserade leksaken framför sig, hon försökte inte ta den och inte heller vända sig mot mig som hade varit ett av problemen i den första övningen, det sträckta kopplet hjälpte henne att fokusera. 

Efter att hundarna vilat under ett teoripass fick vi den sista uppgiften som blev att markera ett föremål under minst 10 sekunder med en valfri bridge som belöningssignal och en externbelöning placerad mellan target-föremålet och föraren. Jag kunde då fortsätta med det vi tränat i tidigare och bara lägga till en externbelöning. Det fick bli bollen som target och en mjukisräv som belöning. Till en början fick räven ligga hos mig, sedan flyttade vi den gradvis närmare en punkt mellan mig och target. Ria markerade bollen, linan sträcktes i 10 sekunder, när linan blev slak tog Ria sin räv och vi lekte. Denna övning tyckte både Ria och jag var rolig och markeringen blev riktigt bra.

Dagens sista teoripass handlade om stegringsplaner. Dessa är desamma för alla typer av sökarbete, först tränas markeringar, sedan systematiskt sökmönster, som exemplet fick vi se filmer på narkotikahundar och sprängämneshundar i arbete. Till sist lärs de specifika dofterna in.

Markeringsträning börjar alltid med kong, först hel sedan i bitar. Tidigt tränas markering i rörelse, på olika höjder och med olika ”bridge”-signal. Man lägger också kong-bitarna i plastpåsar för att differentiera doftbilden och mer efterlikna den verklighet hunden kommer att möta när den arbetar, de dofter tjänstehundar letar efter är oftast djupt gömda och försöker döljas på olika sätt.

Sökmönstret tränas separat genom att bakåtkedja söket. Noggrannhet uppnås då föraren alltid startar om hunden om något blir fel, t ex om hunden tappar i koncentration och börjar titta på föraren. Man använder ofta line-ups, karuseller eller andra typer av urvalsbanor t ex bildäck, tegelpannor eller annat på rad. Tricket är att överbelasta, betona, första biten av söket, om hunden förväntar sig att alltid få jobba länge för att hitta doften så kan den börja slarva i början. I början får man bromsa hunden lite genom att t ex gå före den, bakåtvänd och stoppa om den försöker gå förbi. Stegvis låter man sedan hunden arbeta mer och mer självständigt. man lägger in tomsök och blindsök samt variera tidigt miljö att träna i för att undvika att arbete associeras till en plats. När hunden kan markering och sökmönster lärs doften/dofterna in. 

Underhållsträning är viktigt. Undersökning hos brittiska försvarsdepartementet visar att det inte spelar någon roll för resultatet på sökarbetet om hunden under tre veckor tränat på kong eller ”skarp doft”, de två försöksgrupperna fick samma goda resultat vid prov. De hundar som inte tränat alls på 3 veckor misslyckades däremot med arbetet i hög grad.

Jens avslutade dagen med att, på deltagarnas begäran, med några filmer demonstrera hur dirigeringsträning går till. Vi blev så imponerade av de hundar som utför precisionssök på långt håll, ibland ensamma med gps och högtalare i halsbandet. I högtalaren dirigeras de ”höger/vänster/stanna/framåt/backa” mm. För de hundar som söker explosiva ämnen är det livsviktigt att dessa kommandon sitter till 100% tillsammans med det systematiska sökmönstret och en säker markering. Ingen överraskning egentligen att Jens återigen betonade det som vi alla som tränar hund egentligen vet men som ändå är så svårt för mig och säkert många andra, att ha en plan och FÖLJA den.

Trötta, nöjda och fullmatade med inspiration och lärdomar åkte Ria och jag hem den kvällen. Nu ska här planeras för markeringsträning, vi ska prova några nya ”bridgar” och vi ska rensa upp bland belöningssignalerna och använda dem som blir kvar medveten och effektivt. (Ja ni hör ju själva……den som lever får se!)