Pređi na sadržaj

Deskriptivna statistika

S Vikipedije, slobodne enciklopedije

Deskriptivna statistika (u značenju imenice broja) je zbirna statistika koja kvantitativno opisuje ili sumira karakteristike iz zbirke informacija, dok je deskriptivna statistika (u masovnom imenskom značenju) proces korišćenja i analize tih statistika. Deskriptivna statistika se razlikuje od inferencijalne statistike (ili induktivne statistike) po tome što ima za cilj da sumira uzorak, a ne da koristi podatke za učenje o populaciji za koju se smatra da uzorak podataka predstavlja. Ovo generalno znači da deskriptivna statistika, za razliku od inferencijalne statistike, nije razvijena na osnovu teorije verovatnoće, i da je često neparametarska statistika. Čak i kada analiza podataka donosi svoje glavne zaključke koristeći inferencijalnu statistiku, generalno se takođe prikazuje deskriptivna statistika.[1] Na primer, u radovima koji izveštavaju o ljudskim subjektima, obično je uključena tabela koja daje ukupnu veličinu uzorka, veličine uzorka u važnim podgrupama (npr. za svaki tretman ili grupu izloženosti) i demografske ili kliničke karakteristike kao što su prosečna starost, proporcija ispitanika svakog pola, proporcija subjekata sa srodnim komorbiditetima, itd.

Neke mere koje se obično koriste za opisivanje skupa podataka su mere centralne tendencije i mere varijabilnosti ili disperzije. Mere centralne tendencije obuhvataju srednju vrednost, medijanu i modus, dok mere varijabilnosti uključuju standardnu devijaciju (ili varijansu), minimalne i maksimalne vrednosti varijabli, kurtozis i skjunis.[2]

Deskriptivna statistika je obično prvi korak u analizi podataka, a služi za opisivanje prikupljenih podataka. Deskriptivna statistika obično prethodi statističkom zaključivanju i predviđanju, ali može biti i krajnji cilj statističke analize. Izvođenjem zaključaka se bavi drugo područje statistike koje se zove statistika zaključivanja. Najčešće korišćene procedure u deskriptivnoj statistici su grafičko i tabelarno prikazivanje podataka i izračunavanje mera centralne tendencije i varijabiliteta. Većina autora svrstava mere korelacije i asocijacije varijabli u deskriptivnu statistiku, jer opisuju vezu između dve ili više varijable.[3]

Korišćenje u statističkoj analizi[uredi | uredi izvor]

Deskriptivna statistika pruža jednostavne rezimee o uzorku i o zapažanjima koja su napravljena. Takvi rezimei mogu biti ili kvantitativni, tj. zbirni statistički podaci, ili vizuelni, tj. jednostavni za razumevanje grafikoni. Ovi rezimei mogu ili činiti osnovu za početni opis podataka kao deo opsežnije statističke analize, ili mogu sami po sebi biti dovoljni za određeno istraživanje. Na primer, procenat šuta u košarci je deskriptivna statistika koja sumira učinak igrača ili tima. Ovaj broj je broj napravljenih šuteva podeljen brojem uzetih šuteva. Na primer, igrač koji šutira 33% ubacuje približno jedan šut u svaka tri. Procenat sumira ili opisuje više diskretnih događaja. Uzmite u obzir i prosek ocena. Ovaj pojedinačni broj opisuje opšti učinak učenika u čitavom nizu njihovih iskustava na kursu.[4]

Upotreba deskriptivne i zbirne statistike ima dugu istoriju i zaista, jednostavno tabelarno prikazivanje stanovništva i ekonomskih podataka bilo je prvi način na koji se pojavila tema statistike. U skorije vreme, kolekcija tehnika sumiranja je formulisana pod naslovom istraživačke analize podataka: primer takve tehnike je dijagram.

U poslovnom svetu, deskriptivna statistika pruža koristan sažetak mnogih vrsta podataka. Na primer, investitori i brokeri mogu da koriste istorijski prikaz ponašanja prinosa vršeći empirijske i analitičke analize svojih investicija kako bi doneli bolje odluke o ulaganju u budućnosti.

Univarijantna analiza[uredi | uredi izvor]

Univarijantna analiza uključuje opisivanje distribucije jedne varijable, uključujući njenu centralnu tendenciju (što uključuje srednju vrednost, medijanu i modus) i disperziju (uključujući opseg i kvartile skupa podataka, kao i mere širenja kao što su varijansa i standardna devijacija). Oblik distribucije se takođe može opisati preko indeksa kao što su nagnutost i eksces. Karakteristike distribucije promenljive takođe mogu biti prikazane u grafičkom ili tabelarnom formatu, uključujući histograme i prikaz stabljike i lista.

Bivarijantna i multivarijantna analiza[uredi | uredi izvor]

Kada se uzorak sastoji od više od jedne varijable, deskriptivna statistika se može koristiti za opisivanje odnosa između parova varijabli. U ovom slučaju, deskriptivna statistika uključuje:

  • Unakrsne tabele i tabele za nepredviđene situacije
  • Grafičko predstavljanje preko dijagrama rasejanja
  • Kvantitativne mere zavisnosti
  • Opisi uslovnih raspodela

Glavni razlog za razlikovanje univarijantne i bivarijantne analize je taj što bivarijantna analiza nije samo jednostavna deskriptivna analiza, već opisuje i odnos između dve različite varijable. Kvantitativne mere zavisnosti uključuju korelaciju (kao što je Pirsonov r kada su obe varijable neprekidne, ili Spirmanov ro ako jedna ili obe nisu) i kovarijansa (koja odražava skale na kojima se varijable mere). Nagib, u regresionoj analizi, takođe odražava odnos između varijabli. Nestandardizovani nagib ukazuje na promenu jedinice u promenljivoj kriterijuma za jednu jediničnu promenu u prediktoru. Standardizovani nagib ukazuje na ovu promenu u standardizovanim jedinicama (z-skor). Veoma iskrivljeni podaci se često transformišu uzimanjem logaritama. Upotreba logaritama čini grafikone simetričnijim i sličnijim normalnoj raspodeli, što ih čini lakšim za intuitivno tumačenje.[5]

Reference[uredi | uredi izvor]

  1. ^ Drawing Conclusions From Data : Descriptive Statistics, Inferential Statistics, and Hypothesis Testing (na jeziku: engleski), SAGE Publications, Inc, 2017, str. 145—183, ISBN 9781506304168, doi:10.4135/9781506304144.n6, Pristupljeno 2022-11-30 
  2. ^ „Descriptive Statistics: Definition, Overview, Types, Example”. Investopedia (na jeziku: engleski). Pristupljeno 2022-11-30. 
  3. ^ „Deskriptivna statistika”. e-Statistika (na jeziku: srpski). Pristupljeno 2022-12-03. 
  4. ^ Trochim, William M. K. „Descriptive Statistics”. conjointly.com (na jeziku: engleski). Pristupljeno 2022-11-30. 
  5. ^ Nick, Todd G. (2007). „Descriptive Statistics”. Topics in Biostatistics. Methods in Molecular Biology. 404. New York: Springer. str. 33—52. ISBN 978-1-58829-531-6. PMID 18450044.