Pređi na sadržaj

Kurtozis

S Vikipedije, slobodne enciklopedije
Na slici se nalaze 4 različite vrste distribucije.

U teoriji verovatnoće i statistici, kurtozis (grč. κυρτος) je mera „repa“ distribucije verovatnoće slučajne promenljive realne vrednosti. Kao i iskrivljenost, kurtozis opisuje određeni aspekt distribucije verovatnoće. Postoje različiti načini da se kvantifikuje kurtozis za teorijsku distribuciju, a postoje i odgovarajući načini za procenu na osnovu uzorka iz populacije. Različite mere kurtozisa mogu imati različita tumačenja.

Uobičajeno je porediti višak ekscesa kurtozisa distribucije sa 0, što je višak kurtoze bilo koje univarijantne normalne distribucije. Za distribucije sa negativnim viškom ekscesa se kaže da su platikurtične, iako to ne znači da je distribucija „ravnog vrha“, kako se ponekad navodi. Umesto toga, to znači da distribucija proizvodi manje ekstremnih odstupanja od normalne distribucije. Primer platikurtične distribucije je uniformna distribucija, koja ne proizvodi vanjske vrednosti. Za distribucije sa pozitivnim viškom kurtoze se kaže da su leptokurtične. Primer leptokurtične distribucije je Laplasova raspodela, koja ima repove koji se asimptotski približavaju nuli sporije od Gausove, i stoga proizvodi više odstupanja od normalne raspodele. Uobičajena je praksa da se koristi višak ekscesa, koji je definisan kao Pirsonov kurtozis minus 3, da bi se obezbedilo jednostavno poređenje sa normalnom distribucijom. Neki autori i softverski paketi koriste "kurtozis" samo po sebi za označavanje viška ekscesa.

Pregled[uredi | uredi izvor]

Kurtoza je mera kombinovane težine repova distribucije u odnosu na centar distribucije. Kada se skup približno normalnih podataka grafički prikaže preko histograma, on pokazuje vrhunac i većinu podataka unutar tri standardne devijacije (plus ili minus) srednje vrednosti. Međutim, kada je prisutan visok kurtozis, repovi se protežu dalje od tri standardne devijacije normalne zvonasto zakrivljene distribucije. Kurtoza se ponekad meša sa merom vršnosti distribucije. Međutim, kurtozis je mera koja opisuje oblik repova distribucije u odnosu na njegov ukupni oblik. Distribucija može biti beskonačno vrhunska sa niskim kurtozisom, a distribucija može biti savršeno ravna sa beskonačnom kurtozom. Dakle, kurtozis meri „repidnost“, a ne „vrhost“.[1]

Vrste kurtozisa[uredi | uredi izvor]

Distribucije se mogu kategorisati u tri grupe na osnovu njihove kurtoze. Repovi su krajevi koji se sužavaju sa obe strane distribucije. Oni predstavljaju verovatnoću ili učestalost vrednosti koje su izuzetno visoke ili niske u poređenju sa srednjom. Drugim rečima, repovi predstavljaju koliko često se pojavljuju odstupanja.[2]

Mezokurtične Platikurtične Leptokurtične
Rep Srednji rep Tanak rep Debeo rep
Izuzetna frekvencija Srednja Niska Visoka
Kurtozis Umerena (3) Niska (<3) Visoka (3>)
Višak kurtozisa 0 Negativan Pozitivan
Primer distribucije Normalna Uniformna Laplasova

Mezokurtična distribucija[uredi | uredi izvor]

Mezokurtična distribucija je srednjeg repa, tako da odstupanja nisu ni veoma česta, ni veoma retka. Kurtozis se meri u poređenju sa normalnim distribucijama. Najistaknutiji primer mezokurtične distribucije je porodica normalne distribucije, bez obzira na vrednosti njenih parametara. Nekoliko drugih dobro poznatih distribucija može biti mezokurtična, u zavisnosti od vrednosti parametara: na primer, binomna distribucija je mezokurtična za:

Platikurtična distribucija[uredi | uredi izvor]

Distribucija sa negativnim viškom kurtoze naziva se platikurtična ili platikurtotična. „Plati-“ znači „široko“. U pogledu oblika, platikurtična distribucija ima tanje repove. Primeri platikurtičnih distribucija uključuju kontinuirane i diskretne uniformne distribucije i povišenu kosinusnu distribuciju. Najplatikurtičnija distribucija od svih je Bernulijeva raspodela sa p = 1/2 (na primer, koliko puta neko dobije "glavu" kada jednom baci novčić), za koju je višak ekscesa -2.

Platikurtična distribucija je tankog repa, što znači da su odstupanja retka. Platikurtične distribucije imaju manje ekscesa od normalne distribucije. Drugim rečima, platikurtične distribucije imaju kurtozis manji od 3, višak ekscesa manji od 0. Platikurtoza se ponekad naziva negativna kurtoza, pošto je višak ekscesa negativan.[2]

Leptokurtična distribucija[uredi | uredi izvor]

Distribucija sa pozitivnim viškom kurtoze naziva se leptokurtična ili leptokurtotična. „Lepto-“ znači „vitak“. U pogledu oblika, leptokurtična distribucija ima deblje repove. Primeri leptokurtičkih distribucija uključuju Studentovu t-distribuciju, Rejlijevu raspodelu, Laplasovu raspodelu, eksponencijalnu raspodelu, Poasonovu raspodelu i logističku raspodelu. Takve raspodele se ponekad nazivaju super-Gausovim.[3]

Računanje kurtozisa[uredi | uredi izvor]

Matematički govoreći, eksces je standardizovani četvrti trenutak distribucije. Trenuci su skup merenja koji vam govore o obliku distribucije. Momenti se standardizuju tako što se dele standardnom devijacijom podignutom na odgovarajuću snagu.

Populacija[uredi | uredi izvor]

Kurtozis populacije se računa formulom:

- je standardizovani četvrti momenat

- je nestandardizovani centralni četvrti momenat

- je standardna devijacija

Uzorak[uredi | uredi izvor]

Može izgledati prirodno izračunati eksces uzorka kao četvrti trenutak uzorka podeljen njegovom standardnom devijacijom na četvrti stepen. Međutim, ovo dovodi do pristrasne procene. Formula za nepristrasnu procenu viška ekscesa uključuje dugu korekciju zasnovanu na veličini uzorka:

- veličina uzorka

- su zapažanja varijable h

- prosek varijable h

Reference[uredi | uredi izvor]

  1. ^ „Kurtosis Definition, Types, and Importance”. Investopedia (na jeziku: engleski). Pristupljeno 2022-12-02. 
  2. ^ a b Turney, Shaun (2022-06-27). „What Is Kurtosis? | Definition, Examples & Formula”. Scribbr (na jeziku: engleski). Pristupljeno 2022-12-02. 
  3. ^ Benveniste, A.; Goursat, M.; Ruget, G. (1980). „Robust identification of a nonminimum phase system: Blind adjustment of a linear equalizer in data communications”. IEEE Transactions on Automatic Control. 25 (3): 385—399. doi:10.1109/tac.1980.1102343.