Standardna devijacija

S Vikipedije, slobodne enciklopedije

Grafikon normalne distribucije (ili kriva u obliku zvona) gde svaka traka ima širinu od 1 standardne devijacije – pogledajte takođe: pravilo 68–95–99,7.
Kumulativna verovatnoća normalne distribucije sa očekivanom vrednošću 0 i standardnom devijacijom 1

Standardna devijacija je u statistici apsolutna mera disperzije u osnovnom skupu. Ona govori, koliko u proseku elementi skupa odstupaju od aritmetičke sredine skupa. Označava se grčkim slovom sigma, σ.[1] Niska standardna devijacija ukazuje na to da vrednosti imaju tendenciju da budu blizu srednje vrednosti (koja se naziva i očekivanom vrednošću) skupa, dok visoka standardna devijacija ukazuje da su vrednosti raspoređene u širem opsegu.

Standardna devijacija može biti skraćeno zapisana kao SD, a najčešće je predstavljena u matematičkim tekstovima i jednačinama malim grčkim slovom sigma σ, za standardnu devijaciju populacije, ili latiničnim slovom s, za standardnu devijaciju uzorka.

Standardna devijacija slučajne promenljive, uzorka, statističke populacije, skupa podataka ili raspodele verovatnoće je kvadratni koren njene varijanse. Ona je algebarski jednostavnija, iako u praksi manje robustna, od prosečnog apsolutnog odstupanja.[2][3] Korisna osobina standardne devijacije je da je, za razliku od varijanse, izražena u istoj jedinici kao i podaci.

Formula za izračunavanje standardne devijacije je: ;

gde je:
N - broj elemenata u skupu
μ - aritmetička sredina skupa
- i-ti član skupa (i =1,2,...,N)

Standardna devijacija u uzorku nam govori koliko u proseku elementi uzorka odstupaju od aritmetičke sredine uzorka. Izračunava se po formuli:

;

gde je:
n - broj elemenata u uzorku
(iks-bar) - aritmetička sredina uzorka

- i-ti član uzorka (i =1,2,...,n)

Pravila za normalno raspodeljene podatke[uredi | uredi izvor]

Tamno plavo je unutar intervala od plus-minus jedne standardne devijacije od aritmetičke sredine. Za normalnu raspodelu, ovo obuhvata 68,27% skupa; plus-minus dve standardne devijacije od aritmetičke sredine obuhvataju 95,45 skupa%; plus-minus tri standardne devijacije obuhvataju 99,73% posto skupa.

U praksi, često se pretpostavlja da su podaci iz približno normalno raspodeljene populacije. Ako je ta pretpostavka opravdana, onda se oko 68% vrednosti nalazi u intervalu od plus-minus jedne standardne devijacije od aritmetičke sredine, oko 95% vrednosti se nalazi u intervalu od plus-minus dve standardne devijacije, a oko 99,7% se nalazi unutar plus-minus 3 standardne devijacije. Ovo je poznato kao Pravilo 68-95-99,7, ili empirijsko pravilo.

Intervali poverenja su sledeći:

σ 68,26894921371%
95,44997361036%
99,73002039367%
99,99366575163%
99,99994266969%
99,99999980268%
99,99999999974%

Za normalnu raspodelu, dve tačke na krivoj koje su udaljene jednu standardnu devijaciju od krive su takođe i prevojne tačke.

Osnovni primeri[uredi | uredi izvor]

Populaciona standardna devijacija ocena osmoro učenika[uredi | uredi izvor]

Pretpostavimo da je celokupna populacija od interesa osam učenika u određenom odeljenju. Za konačan skup brojeva, standardna devijacija populacije se nalazi uzimanjem kvadratnog korena proseka kvadrata odstupanja vrednosti oduzetih od njihove prosečne vrednosti. Ocene odeljenja od osam učenika (tj. statističke populacije) su sledećih osam vrednosti:

Ovih osam tačaka podataka imaju srednju vrednost (prosek) od 5:

Prvo se izračuna odstupanja svake tačke podataka od srednje vrednosti i kvadriraju se rezultati:

Varijansa je srednja vrednost ovih vrednosti:

a standardna devijacija populacije je jednaka kvadratnom korenu varijanse:

Ova formula važi samo ako osam vrednosti sa kojima je započeto čine kompletnu populaciju. Ako su vrednosti umesto toga bile slučajni uzorak izvučen iz neke velike roditeljske populacije (na primer, bilo je 8 učenika nasumično i nezavisno izabranih iz klase od 2 miliona), onda se deli sa 7 (što je n − 1) umesto sa 8 (što je n) u imeniocu poslednje formule, a rezultat je U tom slučaju, rezultat originalne formule bi bio nazivan standardna devijacija uzorka i označava sa s umesto sa Deljenje sa n − 1 umesto sa n daje nepristrasnu procenu varijanse veće roditeljske populacije. Ovo je poznato kao Beselova korekcija.[4][5] Grubo rečeno, razlog za to je da se formula za varijansu uzorka oslanja na izračunavanje razlika zapažanja od srednje vrednosti uzorka, a sama srednja vrednost uzorka je konstruisana da bude što je moguće bliža zapažanjima, tako da bi samo deljenje sa n potcenilo varijabilnost.

Standardna devijacija prosečne visine za odrasle muškarce[uredi | uredi izvor]

Ako je populacija od interesa približno normalno raspoređena, standardna devijacija daje informacije o proporciji zapažanja iznad ili ispod određenih vrednosti. Na primer, prosečna visina odraslih muškaraca u Sjedinjenim Državama je oko 70 inča (177,8 cm), sa standardnom devijacijom od oko 3 inča (7,62 cm). To znači da većina muškaraca (oko 68%, pod pretpostavkom normalne distribucije) ima visinu unutar 3 inča (7,62 cm) od srednje vrednosti (67–73 inča (170,18–185,42 cm)) – jedna standardna devijacija – i skoro svi muškarci (oko 95%) ima visinu unutar 6 inča (15,24 cm) od srednje vrednosti (64–76 inča (162,56–193,04 cm)) – dve standardne devijacije. Ako je standardna devijacija nula, onda bi svi muškarci bili visoki tačno 70 inča (177,8 cm). Ako bi standardna devijacija bila 20 inča (50,8 cm), onda bi muškarci imali mnogo varijabilniju visinu, sa tipičnim rasponom od oko 50–90 inča (127–228,6 cm). Tri standardne devijacije čine 99,7% populacije uzorka koja se proučava, pod pretpostavkom da je distribucija normalna ili u obliku zvona (pogledajte pravilo 68-95-99,7 ili empirijsko pravilo za više informacija).

Definicija populacionih vrednosti[uredi | uredi izvor]

Neka je μ očekivana vrednost (prosek) slučajne promenljive X sa gustinom f(x):

Standardna devijacija σ od X je definisana kao

što se može pokazati jednakim sa

Koristeći reči, standardna devijacija je kvadratni koren varijanse od X.

Standardna devijacija distribucije verovatnoće je ista kao i slučajna promenljiva koja ima tu distribuciju.

Nemaju sve slučajne promenljive standardnu devijaciju. Ako distribucija ima velike repove koji idu do beskonačnosti, moguće je da standardna devijacija ne postoji, jer integral možda neće konvergirati. Normalna distribucija ima repove koji idu u beskonačnost, ali njena srednja vrednost i standardna devijacija postoje, jer se repovi dovoljno brzo smanjuju. Pareto raspodela sa parametrom ima srednju vrednost, ali ne i standardnu devijaciju (slobodno govoreći, standardna devijacija je beskonačna). Košijeva raspodela nema srednju vrednost, ni standardnu devijaciju.

Diskretna slučajna promenljiva[uredi | uredi izvor]

U slučaju kada X poprima slučajne vrednosti iz konačnog skupa podataka x1, x2, …, xN, pri čemu svaka vrednost ima istu verovatnoću, standardna devijacija je

ili, koristeći zapis sumiranja,

Ako, umesto da imaju jednake verovatnoće, vrednosti imaju različite verovatnoće, neka x1 ima verovatnoću p1, x2 ima verovatnoću p2, …, xN ima verovatnoću pN. U ovom slučaju, standardna devijacija će biti

Kontinuirana slučajna promenljiva[uredi | uredi izvor]

Standardna devijacija kontinuirane slučajne promenljive X realne vrednosti sa funkcijom gustine verovatnoće p(x) je

i gde su integrali definitivni u odnosu na x u rasponu preko skupa mogućih vrednosti slučajne promenljive X.

U slučaju parametarske porodice distribucija, standardna devijacija se može izraziti u smislu parametara. Na primer, u slučaju log-normalne distribucije sa parametrima μ i σ2, standardna devijacija je

Vidi još[uredi | uredi izvor]

Reference[uredi | uredi izvor]

  1. ^ Bland, J.M.; Altman, D.G. (1996). „Statistics notes: measurement error”. BMJ. 312 (7047): 1654. PMC 2351401Slobodan pristup. PMID 8664723. doi:10.1136/bmj.312.7047.1654. 
  2. ^ Gauss, Carl Friedrich (1816). „Bestimmung der Genauigkeit der Beobachtungen”. Zeitschrift für Astronomie und Verwandte Wissenschaften. 1: 187—197. 
  3. ^ Walker, Helen (1931). Studies in the History of the Statistical Method. Baltimore, MD: Williams & Wilkins Co. str. 24—25. 
  4. ^ Weisstein, Eric W. „Bessel's Correction”. MathWorld. 
  5. ^ „Standard Deviation Formulas”. www.mathsisfun.com. Pristupljeno 21. 8. 2020. 

Literatura[uredi | uredi izvor]

Spoljašnje veze[uredi | uredi izvor]