Tabela kontigencije

S Vikipedije, slobodne enciklopedije

U statistici, tabela kontingencije (takođe poznata kao unakrsna tabela) je tip tabele u matričnom formatu koja prikazuje (multivarijantnu) distribuciju frekvencija varijabli. U velikoj meri se koriste u istraživanju s anketama, poslovnoj inteligenciji, inženjeringu i naučnim istraživanjima. One pružaju osnovnu sliku međuodnosa između dve varijable i mogu pomoći u pronalaženju interakcija između njih. Termin tabela kontigencije prvi je upotrebio Karl Pirson u „O teoriji kontingencije i njenoj vezi sa asocijacijom i normalnom korelacijom“, delu biometrijske serije istraživačkih memoara objavljenoj 1904. godine.

Ključni problem multivarijantne statistike je pronalaženje strukture (direktne) zavisnosti koja leži u osnovi varijabli sadržanih u visokodimenzionalnim tabelama kontingencije. Ako se otkriju neke od uslovnih nezavisnosti, onda se čak i skladištenje podataka može obaviti na pametniji način. Da bi se ovo uradilo, mogu se koristiti koncepti teorije informacija, koji dobijaju informacije samo iz distribucije verovatnoće, koja se može lako izraziti iz tabele kontingencije relativnim frekvencijama.

Pivot tabela je način za kreiranje tabela kontigencije pomoću softvera za proračunske tabele.

Primer[uredi | uredi izvor]

Pretpostavimo da postoje dve varijable, pol (muški ili ženski) i rukost (desnoruki ili levoruki). Dalje pretpostavimo da je 100 pojedinaca nasumično uzeto iz veoma velike populacije kao deo studije polnih razlika u rukovanju. Može se kreirati tabela za nepredviđene situacije da bi se prikazao broj pojedinaca koji su muškarci desnoruki i levoruki, žene dešnjaci i levoruki. Takva tabela nepredviđenih situacija je prikazana u nastavku.

Pol/Rukost Desnoruki Levoruki Total
Muški 43 9 52
Ženski 44 4 48
Total 87 13 100

Broj muškaraca, žena i dešnjaka i levorukih pojedinaca naziva se marginalni ukupni zbir. Ukupan zbir (ukupan broj pojedinaca predstavljenih u tabeli za nepredviđene situacije) je broj u donjem desnom uglu.

Tabela omogućava korisnicima da na prvi pogled vide da je procenat muškaraca koji su dešnjaci otprilike isti kao i procenat žena koje su dešnjaci, iako proporcije nisu identične. Jačina asocijacije se može meriti odnosom šanse, a odnos šanse populacije procenjen odnosom šanse uzorka. Značaj razlike između ove dve proporcije može se proceniti pomoću različitih statističkih testova uključujući Pirsonov hi-kvadrat test, G-test, Fišerov egzaktni test, Bošluov test i Barnardov test, pod uslovom da unosi u tabeli predstavljaju pojedince nasumično uzorkovanih iz populacije o čemu se izvode zaključci. Ako se proporcije pojedinaca u različitim kolonama značajno razlikuju između redova (ili obrnuto), kaže se da postoji kontingentnost između dve varijable. Drugim rečima, dve varijable nisu nezavisne. Ako ne postoji kontingentnost, kaže se da su dve varijable nezavisne.

Gornji primer je najjednostavnija vrsta tabele kontingentnosti, tabela u kojoj svaka promenljiva ima samo dva nivoa; ovo se zove tabela za kontigenciju situacija 2 × 2. U principu, može se koristiti bilo koji broj redova i kolona. Takođe može postojati više od dve varijable, ali tabele kontingentnosti višeg reda je teško vizuelno predstaviti. Odnos između rednih varijabli, ili između rednih i kategoričkih varijabli, takođe može biti predstavljen u tabelama kontingentnosti, iako je takva praksa retka.

Hi kvadrat test[uredi | uredi izvor]

Hi kvadrat test se može sprovesti na tabelama kontigencije da bi se proverilo da li postoji ili ne postoji veza između varijabli. Ovi efekti su definisani kao odnosi između redova i kolona. Mala vrednost hi kvadrata znači da postoji mali odnos između kategoričkih varijabli. Velika hi vrednost znači da postoji definitivna korelacija između dve varijable.[1]

Reference[uredi | uredi izvor]

  1. ^ Stephanie (2022-10-09). „Contingency Table: What is it used for?”. Statistics How To (na jeziku: engleski). Pristupljeno 2022-12-29.