2014. nov 14.

A tanulás 3. rész

írta: Duna Dog Center
A tanulás 3. rész

Időzítés, operáns tanulás

Az időzítés fontossága

Azért hogy következmény összekapcsolódjon a cselekvéssel. A következmény pontosan a cselekvés után vagy alatt kell hogy törtéjen. Minél többet késik, annál kevesebb információz hordoz.

Ha a cselekvés előtt történik a jutalmazás = megvesztegetés, azaz előre fizetek. (pl. kapsz biciklit, de akkor utána jól tanulj!) - nem lesz hatásos

Túl késői időzítés is mást erősíthet meg, pl. év végén prémiumosztás nem kapcsolódik össze bennünk a teljesítménnyel.

A megerősítést nehéz jól időzíteni:
Nem vagyunk fizikailag mindig a kutya mellett, pl. távol csináljon valamit
Nehéz pontosan és időben célba juttatni (pl. mire előveszem a labdát a zsebemből, a kutya már rég mást csinál, mint amit jutalmazni akarok)
Erre a problémára sok trükk van, pl. labdaadagolós mellény lábnál követéshez, virsli köpködés a menet közbeni ültetésre - ezek csak speciális esetekben működnek

Megoldás: kondicionált megerősítés (innentől KM-el rövidítjük) (egyértelműen pavlovi)
Kaja és cselekvés közé be kell iktatni egy ingert (áthidaló inger, marker signal) - már nem a közvetlenül a kaja, hanem a kaját jelentő jelzés a cél!

Miért a klikker?
Elvileg bármilyen inger használható lenne

Klikker előnyei a verbális KM-hez képest:

  • rövid, jól időzíthető
  • egyedi, így könnyen felfogható
  • viszonylag szolid, nem zavaró a környezetnek
  • szabadon marad a szánk szövegelésre

Delfineknél síp van: jobban lehallatszik és a kéz maradhat szabadon

Hirtelen, impulzus-szerű ingerek könnyebben behatolnak a primitív agyba, ahol az örömérzet is keletkezik ember kondicionált megerősítése:

  • Pénz, mint univerzális KM. azt jelképezi, amit majd vehetek rajta - nagyon erőteljes érték, pedig a papír semmit nem ér. valakit már nem is a mögöttes dolog motivál, egyszerűen csak pénzt akar keresni, pedig már el se költi mindet

Klikker KM a kutyás kiképzőnél is: kutya sikeres akciói ember számára is megerősítőek. Kezdő klikkereseknél gyakori hiba, hogy egy idő után mindent meg akarnak erősíteni vele!

Operáns kondicionálás hármas egysége

  • Előzmények, pl. hangjel, testjel
  • Viselkedés
  • Eredmény - megerősítés

Abban az esetben, ha a viselkedést megelőző jel mindig jelen van, amikor a viselkedés megerősítést nyer, a jel és a viselkedés összekapcsolódik (jel és viselkedés összekapcsolódása pavlovi kondicionálás!, tehát nem kéne gondolkoznia előtte, automatikus viselkedés kell hogy legyen. tipikusan nem az még, ha ül a kutya, kiadod az ülj vezényszót, erre pozíciót vált)

Jelek, parancsok, ingerek
Klikker képzésben inkább jel, mint parancs (nincs kényszer!)

Először tanítjuk meg a viselkedést, aztán a jelet! Kényszer alapú tanításban először vezetik be a jelet, aztán végrehajtatják azt: figyelmeztető inger - lehetőséget ad a kellemetlenségek elkerülésére

Diszkriminatív ingerek
Egy viselkedéssel társuló inger, amely előre jelzi a viselkedés várható eredményét, pl. az ajtó ajtaján a nyitott lakat miatt tudom, hogy ki fog nyílni.

Két fajta:

  • ID: a cselekvés sikeres lesz
  • Delta: a cselekvés nem lesz sikeres, nem lesz megerősítve 
  • Pl. zöld/piros lámpa

Minden jel, amit kiadok, egy bizonyos cselekvésre diszkriminatív, minden másra pedig delta inger kell hogy legyen 

Inger kontroll - négy feltétel van, amelyek teljesülése esetén van teljes inger kontroll

  • X jelre X cselekvés kiváltódik (X jel ID X cselekvésre)
  • spontán az X cselekvésre nem történik meg (pl. ŐV után nem belez ki senkit) - a jelek tejes hiánya delta az X cselekvésre - általában ez a pont nem teljesül
  • Y jelre sohasem történik X cselekvés (pl. eltüsszentem magam v más vezényszót mondok, akkor nem jön a cselekvés)
  • X jelre sohasem történik Y cselekvés (X jel delta Y cselekvésre)

Belső motiváció externalizálása, külsővé tétele: fizetnek a dologért, amit szeretek csinálni - ha nem jön a pénz, abbahagyom. Vagy: gyerekek ordítanak - ha vezényszóra ordítozósat játsszunk, akkor már nem lesz olyan vicces

 

Permack szabály
Egy spontán esetben gyakrabban előforduló viselkedés végrehajtása megerősíti az előtte lévő, kevésbé valószínű viselkedést.
Pl. gyerek imád biciklizni - ezt lekorlátolom, előtte mindig mosogatnia kell → sűrűbben fog mosogatni.

Egy spontán ritkábban előforduló viselkedés végrehajtása bünteti az előtte levő, sűrűbben előforduló viselkedést (pl. apport: kifutni imád, be hozzám már nem - lebünteti a kifutást is)

Verset tanulni hátulról érdemes: így az ismeretlentől haladunk az ismert felé, a végén mindig megerősítés jár

 

Viselkedés láncok
Az egyes viselkedés befejezése jel a következő cselekvésre (pl. bója, ha odaért, fekszik, ott marad - ez mind egy vezényszó)
Ideális esetben fordítva is: egy később következő viselkedés végrehajtása megerősítője a megelőző viselkedésnek (a vége kell hogy a legbiztosabb legyen - megerősítés), pl. ŐV - ha a végén nincs meg az, hogy a kutya jól érzi magát, akkor következő alkalomra már a vége előtt is rosszul fogja érezni magát… ezért szokták mondani, hogy fusson a gazdi a kutyával egy nyugodt helyre

Visszaláncolás: mindig a végéről kell felépíteni



A jutalom kiszámíthatósága
Az egyhangú jutalom veszít az értékéből → jackpotot érdemes néha beiktatni
A kiszámíthatatlanság növeli az értékét - ez mozgatja a szerencsejátékokat is - ők is főnyereményt (jackpotot) várnak

  • Mikor csinált egy kimagaslóan jó feladatot, akkor érdemes jackpotot adni és abbahagyni, mert az utána következő valószínűleg úgysem lesz olyan jó, erre meg érdemes nagyon ráerősíteni

Megerősítési ütemezés: a sikeres és a megerősített viselkedések viszonya

Típusok:

  • folytonos: minden sikeres viselkedést
  • fix arányú: minden N-edik sikeres viselkedés megerősítve
  • változó arányú: minden 3., 5., 7.. 5., 3., 5. (minta) - vigyázni kell, hogy az elején is figyeljen
  • véletlenszerű: minden sikeres viselekdés után adott valószínűséggel
  • fix időtartamú: akkor van megerősítve egy sikeres viselkedés, ha az előző megerősítés óta már adott (fix) időtartam eltelt - vissza tudja venni a teljesítményt, pl. hónap végén kapja meg az ember a fizetést
  • változó időtartamú: ha eltelt egy adott (de változó) időtartam
  • ha nincs megerősítés: egyik esetben azt jelenti, hogy csinálj mást, nem ez kell; másik esetben azt jelenti: ismételd. ehhez ismernie kell a kutyának az üzemmódokat, hogy mikor melyik fajta tanulás van: pl. formázásnál ülök, nincs szemkontakt és beszéd; ismétlő trenírozásnál állok, szemkontakt, hang

Melyik milyen erős viselkedést ad?

  • legmeredekebb: fix arányú
  • majdnem ugyanilyen meredek: változó arányú (de sokkal kevesebb megerősítés kellett hozzá)
  • kisebb meredekségű: fix időtartamú (mert mindegy, hogy mennyire tekerek, úgyse kapok megerősítést egy darabig)
  • legkisebb: változó időtartamú.
    (ahol időalapon érdemes beleerősíteni: lábnál követés és helyben maradás, mert az időre megy)

Általánosító- és megfigyelőképesség
Kutyák számára a beérkező ingerek egyszerre hatnak, egy-egy külön dolgot jegyez meg, nehezen általánosít, pl. nem tud a kertben ülni, csak a szobában, mert a kertben 10 ingerből 7 más, mint a szobában.

Az általánosító képesség javítható: egy nagyon egyszerű viselkedést érdemes megtanítani sok helyen, pl. pálcaérintés

A büntetést a kutya könnyebben általánosítja (viszont sokszor rosszul) - még egy ok, amiért veszélyes büntetni.

  • Biológiai ok: a rossz ingert biztonságosabb általánosítani (ha az egyik színű oroszlántól kikaptam, akkor a másik színűhöz nem megyek oda kipróbálni)

A pozitív megerősítéssel tanított gyakorlatok sokkal inkább érzékenyek a környezeti ingerekre (a kutya itt nehezebben általánosít, viszont a környezeti ingereket is a tanult viselkedéshez köti). 
Cserébe nagyon jó megfigyelő

Mi jól általánosítunk: van egy kép a fejünkben a fáról és ez akkor sem változik meg, ha ránézünk egy másmilyen fára, aztán odébb megyünk.



Környezeti ingerek és hatásuk

  • habituáció (hozzászokok, közben mással foglalkozom)
  • szenzitizáció (adott ingerre egyre érzékenyebb lesz), pl. a vihar esetén egyre korábban bepánikolok
  • deszenzitizáció - az inger mindig küszöb alatt marad
  • elárasztás (az inger, amire érzékeny, tartósan az elviselhetőségi küszöb feletti)
    (pánikroham: nem tudatos, hogy milyen inger kapcsolódott össze egy negatív érzettel és hirtelen túl sok lesz belőle - vészreakció)

1512644_10151891980658174_1847845845_n.jpg

 

Forrás: 

Hornig Rudolf: Kiképzéselmélet, klikkeres tanítás

Szólj hozzá

Kutyaiskola Tudományoskodás Tükör Oktatóképzés Hornig Rudolf Kiképzéselmélet