A tanulás 3. rész
Időzítés, operáns tanulás
Az időzítés fontossága
Azért hogy következmény összekapcsolódjon a cselekvéssel. A következmény pontosan a cselekvés után vagy alatt kell hogy törtéjen. Minél többet késik, annál kevesebb információz hordoz.
Ha a cselekvés előtt történik a jutalmazás = megvesztegetés, azaz előre fizetek. (pl. kapsz biciklit, de akkor utána jól tanulj!) - nem lesz hatásos
Túl késői időzítés is mást erősíthet meg, pl. év végén prémiumosztás nem kapcsolódik össze bennünk a teljesítménnyel.
A megerősítést nehéz jól időzíteni:
Nem vagyunk fizikailag mindig a kutya mellett, pl. távol csináljon valamit
Nehéz pontosan és időben célba juttatni (pl. mire előveszem a labdát a zsebemből, a kutya már rég mást csinál, mint amit jutalmazni akarok)
Erre a problémára sok trükk van, pl. labdaadagolós mellény lábnál követéshez, virsli köpködés a menet közbeni ültetésre - ezek csak speciális esetekben működnek
Megoldás: kondicionált megerősítés (innentől KM-el rövidítjük) (egyértelműen pavlovi)
Kaja és cselekvés közé be kell iktatni egy ingert (áthidaló inger, marker signal) - már nem a közvetlenül a kaja, hanem a kaját jelentő jelzés a cél!
Miért a klikker?
Elvileg bármilyen inger használható lenne
Klikker előnyei a verbális KM-hez képest:
- rövid, jól időzíthető
- egyedi, így könnyen felfogható
- viszonylag szolid, nem zavaró a környezetnek
- szabadon marad a szánk szövegelésre
Delfineknél síp van: jobban lehallatszik és a kéz maradhat szabadon
Hirtelen, impulzus-szerű ingerek könnyebben behatolnak a primitív agyba, ahol az örömérzet is keletkezik ember kondicionált megerősítése:
- Pénz, mint univerzális KM. azt jelképezi, amit majd vehetek rajta - nagyon erőteljes érték, pedig a papír semmit nem ér. valakit már nem is a mögöttes dolog motivál, egyszerűen csak pénzt akar keresni, pedig már el se költi mindet
Klikker KM a kutyás kiképzőnél is: kutya sikeres akciói ember számára is megerősítőek. Kezdő klikkereseknél gyakori hiba, hogy egy idő után mindent meg akarnak erősíteni vele!
Operáns kondicionálás hármas egysége
- Előzmények, pl. hangjel, testjel
- Viselkedés
- Eredmény - megerősítés
Abban az esetben, ha a viselkedést megelőző jel mindig jelen van, amikor a viselkedés megerősítést nyer, a jel és a viselkedés összekapcsolódik (jel és viselkedés összekapcsolódása pavlovi kondicionálás!, tehát nem kéne gondolkoznia előtte, automatikus viselkedés kell hogy legyen. tipikusan nem az még, ha ül a kutya, kiadod az ülj vezényszót, erre pozíciót vált)
Jelek, parancsok, ingerek
Klikker képzésben inkább jel, mint parancs (nincs kényszer!)
Először tanítjuk meg a viselkedést, aztán a jelet! Kényszer alapú tanításban először vezetik be a jelet, aztán végrehajtatják azt: figyelmeztető inger - lehetőséget ad a kellemetlenségek elkerülésére
Diszkriminatív ingerek
Egy viselkedéssel társuló inger, amely előre jelzi a viselkedés várható eredményét, pl. az ajtó ajtaján a nyitott lakat miatt tudom, hogy ki fog nyílni.
Két fajta:
- ID: a cselekvés sikeres lesz
- Delta: a cselekvés nem lesz sikeres, nem lesz megerősítve
- Pl. zöld/piros lámpa
Minden jel, amit kiadok, egy bizonyos cselekvésre diszkriminatív, minden másra pedig delta inger kell hogy legyen
Inger kontroll - négy feltétel van, amelyek teljesülése esetén van teljes inger kontroll
- X jelre X cselekvés kiváltódik (X jel ID X cselekvésre)
- spontán az X cselekvésre nem történik meg (pl. ŐV után nem belez ki senkit) - a jelek tejes hiánya delta az X cselekvésre - általában ez a pont nem teljesül
- Y jelre sohasem történik X cselekvés (pl. eltüsszentem magam v más vezényszót mondok, akkor nem jön a cselekvés)
- X jelre sohasem történik Y cselekvés (X jel delta Y cselekvésre)
Belső motiváció externalizálása, külsővé tétele: fizetnek a dologért, amit szeretek csinálni - ha nem jön a pénz, abbahagyom. Vagy: gyerekek ordítanak - ha vezényszóra ordítozósat játsszunk, akkor már nem lesz olyan vicces
Permack szabály
Egy spontán esetben gyakrabban előforduló viselkedés végrehajtása megerősíti az előtte lévő, kevésbé valószínű viselkedést.
Pl. gyerek imád biciklizni - ezt lekorlátolom, előtte mindig mosogatnia kell → sűrűbben fog mosogatni.
Egy spontán ritkábban előforduló viselkedés végrehajtása bünteti az előtte levő, sűrűbben előforduló viselkedést (pl. apport: kifutni imád, be hozzám már nem - lebünteti a kifutást is)
Verset tanulni hátulról érdemes: így az ismeretlentől haladunk az ismert felé, a végén mindig megerősítés jár
Viselkedés láncok
Az egyes viselkedés befejezése jel a következő cselekvésre (pl. bója, ha odaért, fekszik, ott marad - ez mind egy vezényszó)
Ideális esetben fordítva is: egy később következő viselkedés végrehajtása megerősítője a megelőző viselkedésnek (a vége kell hogy a legbiztosabb legyen - megerősítés), pl. ŐV - ha a végén nincs meg az, hogy a kutya jól érzi magát, akkor következő alkalomra már a vége előtt is rosszul fogja érezni magát… ezért szokták mondani, hogy fusson a gazdi a kutyával egy nyugodt helyre
Visszaláncolás: mindig a végéről kell felépíteni
A jutalom kiszámíthatósága
Az egyhangú jutalom veszít az értékéből → jackpotot érdemes néha beiktatni
A kiszámíthatatlanság növeli az értékét - ez mozgatja a szerencsejátékokat is - ők is főnyereményt (jackpotot) várnak
- Mikor csinált egy kimagaslóan jó feladatot, akkor érdemes jackpotot adni és abbahagyni, mert az utána következő valószínűleg úgysem lesz olyan jó, erre meg érdemes nagyon ráerősíteni
Megerősítési ütemezés: a sikeres és a megerősített viselkedések viszonya
Típusok:
- folytonos: minden sikeres viselkedést
- fix arányú: minden N-edik sikeres viselkedés megerősítve
- változó arányú: minden 3., 5., 7.. 5., 3., 5. (minta) - vigyázni kell, hogy az elején is figyeljen
- véletlenszerű: minden sikeres viselekdés után adott valószínűséggel
- fix időtartamú: akkor van megerősítve egy sikeres viselkedés, ha az előző megerősítés óta már adott (fix) időtartam eltelt - vissza tudja venni a teljesítményt, pl. hónap végén kapja meg az ember a fizetést
- változó időtartamú: ha eltelt egy adott (de változó) időtartam
- ha nincs megerősítés: egyik esetben azt jelenti, hogy csinálj mást, nem ez kell; másik esetben azt jelenti: ismételd. ehhez ismernie kell a kutyának az üzemmódokat, hogy mikor melyik fajta tanulás van: pl. formázásnál ülök, nincs szemkontakt és beszéd; ismétlő trenírozásnál állok, szemkontakt, hang
Melyik milyen erős viselkedést ad?
- legmeredekebb: fix arányú
- majdnem ugyanilyen meredek: változó arányú (de sokkal kevesebb megerősítés kellett hozzá)
- kisebb meredekségű: fix időtartamú (mert mindegy, hogy mennyire tekerek, úgyse kapok megerősítést egy darabig)
- legkisebb: változó időtartamú.
(ahol időalapon érdemes beleerősíteni: lábnál követés és helyben maradás, mert az időre megy)
Általánosító- és megfigyelőképesség
Kutyák számára a beérkező ingerek egyszerre hatnak, egy-egy külön dolgot jegyez meg, nehezen általánosít, pl. nem tud a kertben ülni, csak a szobában, mert a kertben 10 ingerből 7 más, mint a szobában.
Az általánosító képesség javítható: egy nagyon egyszerű viselkedést érdemes megtanítani sok helyen, pl. pálcaérintés
A büntetést a kutya könnyebben általánosítja (viszont sokszor rosszul) - még egy ok, amiért veszélyes büntetni.
- Biológiai ok: a rossz ingert biztonságosabb általánosítani (ha az egyik színű oroszlántól kikaptam, akkor a másik színűhöz nem megyek oda kipróbálni)
A pozitív megerősítéssel tanított gyakorlatok sokkal inkább érzékenyek a környezeti ingerekre (a kutya itt nehezebben általánosít, viszont a környezeti ingereket is a tanult viselkedéshez köti).
Cserébe nagyon jó megfigyelő
Mi jól általánosítunk: van egy kép a fejünkben a fáról és ez akkor sem változik meg, ha ránézünk egy másmilyen fára, aztán odébb megyünk.
Környezeti ingerek és hatásuk
- habituáció (hozzászokok, közben mással foglalkozom)
- szenzitizáció (adott ingerre egyre érzékenyebb lesz), pl. a vihar esetén egyre korábban bepánikolok
- deszenzitizáció - az inger mindig küszöb alatt marad
- elárasztás (az inger, amire érzékeny, tartósan az elviselhetőségi küszöb feletti)
(pánikroham: nem tudatos, hogy milyen inger kapcsolódott össze egy negatív érzettel és hirtelen túl sok lesz belőle - vészreakció)
Forrás:
Hornig Rudolf: Kiképzéselmélet, klikkeres tanítás