Að beisla virkni jákvæðrar styrkingar á hegðun
Hér á eftir er hluti úr hópverkefni sem ég vann á Hólum sumarið 2011 og flutti fyrir bekkinn. Hópverkefnið fjallaði um umbun og refsingu og sá ég um hlutann sem var með umbun með fóðri, en við settum verkefnið upp sem leikþátt sem var með og á móti refsingum og svo með og á móti fóðurgjöf sem umbun.
Þetta er ágætur texti og skýrir vel virkni smelluþjálfunar eða notkun á jákvæðri styrkingu með hjálp óbeinnar styrkingar á hegðun.
Verkfærataska hestamannsins
Ef við tökum upp verkfæratösku hestamannsins má finna þar 3 verkfæri sem notuð eru við þjálfun og tamningu. Þessi tól kallast neikvæð styrking á hegðun, jákvæð styrking á hegðun og refsing.
Neikvæð styrking á hegðun er það verkfæri sem mest er notað en það er þegar knapinn setur þrýsting á hestinn og tekur hann af þegar hesturinn svarar rétt, þ.e. umbunar hestinum með því að gefa honum frið. Refsing er líka notuð en hana ætti að forðast sökum vandamála með tímasetningar og veldur hún í raun aðeins skaða (sjá: Vandamálið við refsingar)
Þetta er ágætur texti og skýrir vel virkni smelluþjálfunar eða notkun á jákvæðri styrkingu með hjálp óbeinnar styrkingar á hegðun.
Verkfærataska hestamannsins
Ef við tökum upp verkfæratösku hestamannsins má finna þar 3 verkfæri sem notuð eru við þjálfun og tamningu. Þessi tól kallast neikvæð styrking á hegðun, jákvæð styrking á hegðun og refsing.
Neikvæð styrking á hegðun er það verkfæri sem mest er notað en það er þegar knapinn setur þrýsting á hestinn og tekur hann af þegar hesturinn svarar rétt, þ.e. umbunar hestinum með því að gefa honum frið. Refsing er líka notuð en hana ætti að forðast sökum vandamála með tímasetningar og veldur hún í raun aðeins skaða (sjá: Vandamálið við refsingar)
Jákvæð styrking
Verkfærið jákvæð styrking á hegðun er umbun með fóðurgjöf. Hún er minna notuð sökum vöntunar á kerfi til að halda utan um virkni hennar. Fóður er vafalaust ein sterkasta styrking á hegðun fyrir dýr en það hefur ekki gefist vel að verðlauna hross með fóðri, því fljótt geta þau orðið frek og ágeng í leit að meira góðgæti.
Ein ástæða þess er vandamál með tímasetningu, þ.e. fóðrið kemur á eftir hegðuninni og hesturinn áttar sig illa á fyrir hvað nákvæmlega var verið að verðlauna.
Hesturinn veit í raun ekki af hverju eða hvenær fóðrið gæti komið aftur og tengir það fyrst og fremst við vasa þjálfarans en ekki eigin hegðun. Hesturinn reynir því ítrekað að sparka í dósavélina til að gá hvort eitthvað poppi ekki út.
Hin almenna notkun á jákvæðri styrkingu:
Dæmi um misheppnaða notkun á jákvæðri styrkingu er t.d. þegar verið er að gangsetja mjög klárgengan hest og hann stígur smá hreint tölt eftir kafla á brokktölti. Himinlifandi knapinn vill verðlauna hest sinn, stöðvar og gefur örlítinn mola.
Hesturinn myndi að líkindum telja að hann væri að fá verðlaun fyrir að stöðva, ekki fyrir að ganga á ákveðinn hátt, þ.e. ganga á hreinu tölti. Þar með færi tilgangurinn með umbuninni í raun út um þúfur og hegðunin ''hreint tölt'' styrkist ekki að marki þrátt fyrir fóðurumbun.
Verkfærið jákvæð styrking á hegðun er umbun með fóðurgjöf. Hún er minna notuð sökum vöntunar á kerfi til að halda utan um virkni hennar. Fóður er vafalaust ein sterkasta styrking á hegðun fyrir dýr en það hefur ekki gefist vel að verðlauna hross með fóðri, því fljótt geta þau orðið frek og ágeng í leit að meira góðgæti.
Ein ástæða þess er vandamál með tímasetningu, þ.e. fóðrið kemur á eftir hegðuninni og hesturinn áttar sig illa á fyrir hvað nákvæmlega var verið að verðlauna.
Hesturinn veit í raun ekki af hverju eða hvenær fóðrið gæti komið aftur og tengir það fyrst og fremst við vasa þjálfarans en ekki eigin hegðun. Hesturinn reynir því ítrekað að sparka í dósavélina til að gá hvort eitthvað poppi ekki út.
Hin almenna notkun á jákvæðri styrkingu:
Dæmi um misheppnaða notkun á jákvæðri styrkingu er t.d. þegar verið er að gangsetja mjög klárgengan hest og hann stígur smá hreint tölt eftir kafla á brokktölti. Himinlifandi knapinn vill verðlauna hest sinn, stöðvar og gefur örlítinn mola.
Hesturinn myndi að líkindum telja að hann væri að fá verðlaun fyrir að stöðva, ekki fyrir að ganga á ákveðinn hátt, þ.e. ganga á hreinu tölti. Þar með færi tilgangurinn með umbuninni í raun út um þúfur og hegðunin ''hreint tölt'' styrkist ekki að marki þrátt fyrir fóðurumbun.
Óbein styrking
Til að jákvæð styrking eða umbun með fóðurgjöf geti skilað árangri er nauðsynlegt að bæta við öðru verkfæri í verkfæratöskuna sem er ekki mikið notað. Kallast þetta verkfæri óbein styrking (e. secondary reinforcer).
Óbein styrking á hegðun er verkfæri sem myndar brú yfir í jákvæðu styrkinguna, þ.e. með henni má tímasetja rétt og segja hestinum nákvæmlega fyrir hvaða hegðun hann fær umbun í formi fóðurs.
Hægt er að taka sama dæmi og áður nefndi, þ.e. hestur á brokktölti sýnir loksins örlítið hreint tölt og um leið er óbeina styrkingin notuð, þ.e. hljóðmerki eins og smella sem segir hestinum ,,Þetta var rétt, nú færð þú verðlaun''. Þá stöðvar hesturinn og fær örlítið fóður í verðlaun.
Óbein styrking stuðlar að skilningi
Hér skilur hesturinn hinsvegar nákvæmlega fyrir hvaða hegðun verið var að verðlauna hann fyrir, þ.e. óbeina styrkingin sér fyrir réttri tímasetningu svo fóðurumbunin nýtist sem mjög öflug styrking á hegðun.
Þetta mun leiða til þess að hesturinn sækist strax í að framkvæma hegðunina aftur og bjóða mögulega fram enn betri hegðun. Nafn á þessu kerfi er smelluþjálfun eða clickertraining og er um mjög öflugt þjálfunartæki að ræða. Þessi aðferð er eitt allra hentugasta kerfið fyrir fóður sem umbun.
Til að jákvæð styrking eða umbun með fóðurgjöf geti skilað árangri er nauðsynlegt að bæta við öðru verkfæri í verkfæratöskuna sem er ekki mikið notað. Kallast þetta verkfæri óbein styrking (e. secondary reinforcer).
Óbein styrking á hegðun er verkfæri sem myndar brú yfir í jákvæðu styrkinguna, þ.e. með henni má tímasetja rétt og segja hestinum nákvæmlega fyrir hvaða hegðun hann fær umbun í formi fóðurs.
Hægt er að taka sama dæmi og áður nefndi, þ.e. hestur á brokktölti sýnir loksins örlítið hreint tölt og um leið er óbeina styrkingin notuð, þ.e. hljóðmerki eins og smella sem segir hestinum ,,Þetta var rétt, nú færð þú verðlaun''. Þá stöðvar hesturinn og fær örlítið fóður í verðlaun.
Óbein styrking stuðlar að skilningi
Hér skilur hesturinn hinsvegar nákvæmlega fyrir hvaða hegðun verið var að verðlauna hann fyrir, þ.e. óbeina styrkingin sér fyrir réttri tímasetningu svo fóðurumbunin nýtist sem mjög öflug styrking á hegðun.
Þetta mun leiða til þess að hesturinn sækist strax í að framkvæma hegðunina aftur og bjóða mögulega fram enn betri hegðun. Nafn á þessu kerfi er smelluþjálfun eða clickertraining og er um mjög öflugt þjálfunartæki að ræða. Þessi aðferð er eitt allra hentugasta kerfið fyrir fóður sem umbun.
Virða svæði knapans
Þegar hesturinn skilur þetta kerfi er afar mikilvægt að nota hljóðmerkið til að styrkja hegðun sem snýr að því að virða svæði knapans, eins og að víkja frá og bakka. Til að þetta kerfi gangi upp má aldrei gefa hestinum úr hendi nema þegar hann heyrir hljóðmerkið.
Með þessum hætti er hægt að gefa hestinum mikið fóður þegar það er verið að kenna honum eitthvað nýtt án þess að hann verði nokkru sinni frekur því hann veit að hann fóðrið kemur ekki nema hann heyri hljóðmerkið og virði svæði knapans.
Með þessum hætti tapast ekki leiðtogahlutverkið heldur verður þessi aðferð aðeins aukahlutur í verkfæratöskunni okkar til að ýta undir námshraða þegar við erum að kenna hestinum eitthvað nýtt.
Tilgangurinn að auka námshraða
Þegar hesturinn hefur lært það sem við ætluðum að ná fram hjá honum, eins og að stíga hreint tölt, þá er notkun umbunar með fóðri hætt enda eini tilgangurinn með henni að auka námshraða. Þá skal aðeins nota neikvæða styrkingu á hegðun nema hesturinn fari skref til baka í þjálfuninni, þá er umbunakerfið notað aftur til að örva hegðunina hafi hún ekki fests í sessi.
Fóður er öflugasta styrking á hegðun hestsins og með því að beisla virkni jákvæðrar styrkingar og nota hana samhliða neikvæðri styrkingu getum við margfaldað námshraða og komist hraðar yfir erfið verkefni með því að hraða skilningi hestsins.
Þegar hesturinn skilur þetta kerfi er afar mikilvægt að nota hljóðmerkið til að styrkja hegðun sem snýr að því að virða svæði knapans, eins og að víkja frá og bakka. Til að þetta kerfi gangi upp má aldrei gefa hestinum úr hendi nema þegar hann heyrir hljóðmerkið.
Með þessum hætti er hægt að gefa hestinum mikið fóður þegar það er verið að kenna honum eitthvað nýtt án þess að hann verði nokkru sinni frekur því hann veit að hann fóðrið kemur ekki nema hann heyri hljóðmerkið og virði svæði knapans.
Með þessum hætti tapast ekki leiðtogahlutverkið heldur verður þessi aðferð aðeins aukahlutur í verkfæratöskunni okkar til að ýta undir námshraða þegar við erum að kenna hestinum eitthvað nýtt.
Tilgangurinn að auka námshraða
Þegar hesturinn hefur lært það sem við ætluðum að ná fram hjá honum, eins og að stíga hreint tölt, þá er notkun umbunar með fóðri hætt enda eini tilgangurinn með henni að auka námshraða. Þá skal aðeins nota neikvæða styrkingu á hegðun nema hesturinn fari skref til baka í þjálfuninni, þá er umbunakerfið notað aftur til að örva hegðunina hafi hún ekki fests í sessi.
Fóður er öflugasta styrking á hegðun hestsins og með því að beisla virkni jákvæðrar styrkingar og nota hana samhliða neikvæðri styrkingu getum við margfaldað námshraða og komist hraðar yfir erfið verkefni með því að hraða skilningi hestsins.