Instrumentalno uslovljavanje

S Vikipedije, slobodne enciklopedije

Operantno ili instrumentalno uslovljavanje je odgovor koji se uslovljavanjem očekuje od okoline. Pod operantnim ili delatnim ponašanjem, bihevioristi podrazumevaju svako ponašanje koje deluje na okolinu na takav način da u njoj izaziva neke posledice. Pod operantnim uslovljavanjem se zato podrazumeva onaj odgovor koji se uslovljavanjem očekuje od okoline (poželjan ili nepoželjan) te je ovakav vid uslovljavanja u funkciji svojih posledica. Uslovljavanje se odvija po modelu stimulus – operantni odgovor – davanje potkrepljenja.

Instrumentalno učenje je oblik učenja u kome ponašanje predstavlja sredstvo ili instrument dolaženja do cilja, tj  dovodi do nagrađujućeg događaja ili do izbegavanja neprijatnog događaja. U ovom obliku učenja vlada tkzv zakon efekta koji je formulisao Torndajk, po kome se ponašanja ili odgovori koji dovode do pozitivnog potkrepljenja učvršćuju, a oni odgovori u kojim se dolazi do negativnog potkrepljenja eliminišu. Odgovori jačaju u zavisnosti od posledica do kojih dovode. Ono što sledi ponašanje jeste potkrepljenje.[1]

Instrumentalno učenje naziva se još i učenje pokušajima i greškama, učenje putem slepih pokušaja i slučajnih uspeha, učenje potkrepljenjem ili operantno učenje. Karakteristično za ovaj oblik učenja jeste to što je postupno.

Karakteristike učenja[uredi | uredi izvor]

  • Postupno učenje
  • Učenje potkrepljenjem
  • Bez učešća viših kognitivnih procesa
  • Asocijacionistička S-R objašnjenja
  • Zakon efekta

Instrumentalno, odnosno operantno učenje je veoma značajno i kod ljudi. Roditelji, nastavnici i drugi agensi socijalizacije koriste nagrade i kazne da razviju određena ponašanja kod dece. Važno je istaknuti da potkrepljenje kod ljudi ne mora da se odnosi samo na jednostavne oblike nagrada i kazni. Poznavanje rezultata učenja predstavlja veoma važan podsticaj za učenje dece i odraslih.

Pre svega, korišćenjem nagrade usvajaju se nova ponašanja. Kaznom se mogu samo eliminisati već postojeći, neželjeni oblici ponašanja. Kazna je manje efikasna od nagrade. Da bi efekti korišćenja pozitivnog potkrepljenja bili što bolji, treba se pridržavati pravila:

  • Potkrepljenje treba dati neposredno nakon željenog ponašanja
  • Za male nagrade treba postaviti male zadatke
  • Treba definisati ponašanja koja su približna željenom ponašanju i nagrađivati ih, shodno principu oblikovanja ponašanja.
  • Treba početi s potkrepljivanjem svakog izvedenog željenog ponašanja, a kada se ono učvrsti, treba preći na parcijalno potkrepljenje (davati nagradu ili pohvalu povremeno)

Da bi kažnjavanje bilo delotvorno:

  • Osoba koja se kažnjava mora da se plaši mogućnosti da bude kažnjena
  • Osoba koja se kažnjava mora da doživljava kaznu kao novo i šokantno iskustvo
  • Osoba mora tačno da zna za koje ponašanje je kažnjena
  • Mora da bude u stanju da kontroliše to ponašanje
  • Motivacija za nepoželjno ponašanje koje se kažnjava mora da bude slaba
  • Ponašanje mora da bude kažnjeno pre nego što pređe u naviku

Treba napomenuti da se kažnjeno ponašanje nikad ne zaboravlja, već samo ne ispoljava. Negativne posledice kažnjavanja su brojne-kazna nas frustrira, stvara anksioznost, strah, ljutnju... Ukoliko su kazne nepredvidive i neizbežne,, a ponašanje koje je kažnjeno nije pod našom kontrolom, javljaju se osećanja bespomoćnosti i nemoći. Prema tome, kažnjavanje može da proizvede jake neželjene efekte koji zapravo otežavaju stvaranje pozitivnih oblika ponašanja.

Eksperiment sa mačkama[uredi | uredi izvor]

Edvard Li Torndajk je u okviru svoje doktorske teze predstavio teoriju učenja kako bi ukazao na ulogu iskustva u uspostavljanju veze između odgovora na stimulus i procesa učenja (konekcionizam). Opisao je svoj ekperiment kojim je ukazao na princip učenja putem slepih pokušaja i slučajnog uspeha.

Gladnu mačku zatvorio je u kavez sa sistemom poluge za otvaranje vrata ispred koga je ostavio hranu. Mačka je pokušavala da izađe provlačenjem bez uspeha, a svoj bes neuspehom ispoljavala je skakanjem po kavezu sve dok slučajno nije dodirnula polugu za izlaz. U svakom narednom ponavljanju eksperimenta broj slučajnih pokušaja kod mačke bio je manji što je ukazalo na postupnost u učenju na osnovu pokušaja i pogrešaka. Dakle, u ovoj situaciji mačka izvodi niz bezuspešnih pokreta dokle slučajno ne podigne ogradu na vratima i stigne do nagrade. Ono što je važno za opis ovog učenja jeste da ona opet izvodi bezuspešne pokušaje da dođe do hrane. Međutim, broj bezuspešnih pokušaja se vremenom smanjuje.

Ovaj eksperiment govori u prilog asocijacionističkim S-R teorijama po kojima tokom učenja jača veza ili asocijacija između draži i odgovora i značajan je i kod životinja i kod ljudi. Greška asocijacionističkih teorija leži, međutim, u tome što su pokušali da učenja različitih stepena složenosti svedu na ovaj oblik učenja.[1]

Torndajkovi zakoni[uredi | uredi izvor]

Edvard Li Torndajk je na osnovu svog eksperimenta sa mačkama stvorio tri zakona, za koje smatra da se javljaju u toku instrumentalnog uslovljavanja:

  • „Zakon efekta“: kada je veza između stimulusa (S) i odgovora (R)  pozitivno nagrađena jačaće, povećava se verovatnoća njegovog javljanja, a kada je kažnjeno slabiće, smanjivaće se verovatnoća njegovog javljanja
  • „Zakon vežbanja“: što se jedna S-R veza više vežba, to će biti jača
  • „Zakon spremnosti“: zbog strukture nervnog sistema u određenoj situaciji određene jedinice ponašanja će se verovatnije izvesti, pojaviti nego neke druge[1]

Skinerova istraživanja[uredi | uredi izvor]

Skiner je demonstrirao da pažljivim režimom potkrepljenja spontano emitovanih odgovora životinja može da se nauči i veoma složenim ponašanjima. Pri tome je važan princip oblikovanja: kada životinja izvede neki pokret koji je približan određenom obliku ponašanja koji želimo da životinja učvrsti, potkrepljenje dajemo za odgovor koji je još bliži konačnom, ciljnom ponašanju. Na kraju opita, potkrepljenje se daje samo za vršenje određenog ponašanja. Na taj način, Skiner je učio golubove da hodaju u osmicama ili da igraju pingpong.

Skinerova kutija[uredi | uredi izvor]

Saznanja do kojih je došao vršeći ispitivanja na životinjama primenio je i na ljudsko ponašanje. U "Skinerovoj kutiji" nalazila se poluga i dozer sa hranom koja se istiskuje kada se poluga pritisne. Pacov ili golub koje je koristio u eksperimentima, ispitujući sredinu, slučajno pritiska polugu i emituje operant, "spontano nastali odgovor koji dovodi do određene posledice u sredini". Hrana je posledica emitovanog operanta. Nakon određenog vremenskog perioda i niza slučajnih pritiskivanja poluge, uočava se pojačani tempo operanta. Verovatnoća ponovnog javljanja operanta zavisiće od potkrepljenja i na taj način ostati kao naučena radnja u ponašanju životinje u istoj ili sličnoj situaciji.

Potkrepljenje[uredi | uredi izvor]

Potkrepljenje je posledica koja povećava verovatnoću javljanja određenog ponašanja. Primarno potkrepljenje je zadovoljavanje osnovnih potreba (glad, žeđ, potreba za snom, seksualna,itd). Sekundarno potkrepljenje je uparivanje s primarnim ili nekim već usvojenim sekundarnim potkrepljenjem. Tri su osnovne vrste sekundarnih potkrepljivača:

  • Socijalna potkrepljenja (osmeh, pohvala, pažnja,zagrljaj)
  • Potkrepljivačke  aktivnosti (pristup igri, zabavi, što se voli)
  • Simbolička potkrepljenja (novac, ocene). Novac je sekundarni potkrepljivač koji sam po sebi nema neku vrednost, ali se može zameniti za niz primarnih potkrepljivača.

Jedno od najvažnijih dostignuća Skinerovih opita jeste otkriće režima potkrepljenja i njihovih efekata. Naime, potkrepljenje može se davati povremeno, a ne za svaku uspešno izvedenu radnju. Nadalje, može se varirati količina ili kvalitet potkrepljenja kao i način odlaganja potkrepljenja. Jedan od paradoksalnih nalaza jeste da je naučeno ponašanje mnogo otpornije na gašenje (stečena navika je mnogo snažnija) ako se potkrepljenje da parcijalno. Kao da organizam nauči da uporno radi za retke i nepredvidive nagrade, pa ga brojni neuspesi ne obeshrabruju.[1]

Razlike između negativnog potkrepljenja i kažnjavanja[uredi | uredi izvor]

Negativno potkrepljenje povećava verovatnoću ponašanja, jer uklanja ili smanjuje neprijatnu draž, a ne donese druge neželjene posledice (roditelj koji pravda bežanje iz škole zbog kontrolnog) – npr.nema domaćeg za vikend jer su marljivo uradili sve preko nedelje.

Kazna smanjuje verovatnoću ponašanja, davanjem neprijatnih draži (fizička kazna, klečanje na kukuruzu) ili uskraćivanjem pozitivnih (npr. kašenjenje se kažnjava gubljenjem određenih privilegija; ako ste nemirni produžićemo čas).

Režimi potkrepljenja[uredi | uredi izvor]

Kada se izvede željeno ponašanje, potkrepljenje ne mora biti 100%, može se održavati i povremenim potkrepljivanjem – režim delimičnog potkrepljenja

Režimi delimičnog potkrepljenja:

  • intervalne šeme
  • racio šeme

Fiksne intrvalne šeme su ciljno ponašanje se potkrepljuje posle tačno određene, fiksirane količine vremena od poslednjeg potkrepljenja. Varirajuće intrvalne šeme su one u kojima se varira vreme koje treba da prođe između potkrepljivanja. Fiksne racio šeme jesu fiksirani broj tačnih odgovora mora se javiti pre nego što se ponovo da potkrepljenje. Varirajuće racio šeme predstavljaju broj ponavljanja tačnog odgovora za potkrepljenje može varirati.

Varirajuće intervalne šeme, a posebno varirajuće racio šeme dovode do stabilnijeg i trajnijeg očuvanja ponašanja, odgovora, jer onaj koji uči ne može da predvidi kada će se javiti potkrepljenje, mada zna da će se ono pojaviti.[1]

Nagrađivanje[uredi | uredi izvor]

Korišćenjem nagrade usvajaju se novi oblici ponašanja, kaznom se eliminišu stari.

Oblikovanje ponašanja:

  • Potkrepljenje - neposredno nakon ponašanja
  • Male nagrade – mali zadaci
  • Def. približna ponašanja željenom i nagrađivati ih
  • Početi sa potkrepljivanjem svakog izvedenog željenog ponašanja, a zatim parcijalno potkrepljivati

Kažnjavanje[uredi | uredi izvor]

  • Kaznom se samo mogu eliminisati postojeći nepoželjni oblici ponašanja
  • Kazna manje efikasna od nagrade
  • Uslovi:
  • Mora se plašiti mogućnosti da bude kažnjena
  • Kazna – kao novo, šokantno iskustvo
  • Tačno da zna za koje ponašanje je kazna
  • Mora da je u stanju da kontroliše to ponašanje
  • Motivacija za nepoželjno ponašanje da je slaba
  • Kazniti pre nego ponašanje pređe u naviku
  • Naučena bespomoćnost

Zakonitosti učenja[uredi | uredi izvor]

  • Veštine koje smo u potpunosti savladali zadržavaju se trajno ili se relativno lako obnavljaju, dok zaboravljamo ono što smo naučili samo površno ili delimično. Učenje zavisi ne samo od broja ponavljanja već i od toga kako su ponavljanja raspoređena u vremenu (savladavanje jednostavnih veština: kontinuirano, jednokratno ali duže vremena; složene veštine, gradivo: kraće učenje raspodeljeno u više termina) Za efikasno učenje neophodna je vežba – vežba je nužnija što su složenija znanja koja treba naučiti. Što su jasnije, preciznije i uvremenjene povratne informacije efikasnije je učenje.

Reference[uredi | uredi izvor]

  1. ^ a b v g d Trebješanin, Ž. (2010). Psihologija ličnosti. Beograd, Učiteljski fakultet.