Standardna devijacija
Standardna devijacija je u statistici apsolutna mera disperzije u osnovnom skupu. Ona govori, koliko u proseku elementi skupa odstupaju od aritmetičke sredine skupa. Označava se grčkim slovom sigma, σ.[1] Niska standardna devijacija ukazuje na to da vrednosti imaju tendenciju da budu blizu srednje vrednosti (koja se naziva i očekivanom vrednošću) skupa, dok visoka standardna devijacija ukazuje da su vrednosti raspoređene u širem opsegu.
Standardna devijacija može biti skraćeno zapisana kao SD, a najčešće je predstavljena u matematičkim tekstovima i jednačinama malim grčkim slovom sigma σ, za standardnu devijaciju populacije, ili latiničnim slovom s, za standardnu devijaciju uzorka.
Standardna devijacija slučajne promenljive, uzorka, statističke populacije, skupa podataka ili raspodele verovatnoće je kvadratni koren njene varijanse. Ona je algebarski jednostavnija, iako u praksi manje robustna, od prosečnog apsolutnog odstupanja.[2][3] Korisna osobina standardne devijacije je da je, za razliku od varijanse, izražena u istoj jedinici kao i podaci.
Formula za izračunavanje standardne devijacije je: ;
gde je:
N - broj elemenata u skupu
μ - aritmetička sredina skupa
- i-ti član skupa (i =1,2,...,N)
Standardna devijacija u uzorku nam govori koliko u proseku elementi uzorka odstupaju od aritmetičke sredine uzorka. Izračunava se po formuli:
- ;
gde je:
n - broj elemenata u uzorku
(iks-bar) - aritmetička sredina uzorka
- i-ti član uzorka (i =1,2,...,n)
Pravila za normalno raspodeljene podatke[uredi | uredi izvor]
U praksi, često se pretpostavlja da su podaci iz približno normalno raspodeljene populacije. Ako je ta pretpostavka opravdana, onda se oko 68% vrednosti nalazi u intervalu od plus-minus jedne standardne devijacije od aritmetičke sredine, oko 95% vrednosti se nalazi u intervalu od plus-minus dve standardne devijacije, a oko 99,7% se nalazi unutar plus-minus 3 standardne devijacije. Ovo je poznato kao Pravilo 68-95-99,7, ili empirijsko pravilo.
Intervali poverenja su sledeći:
σ | 68,26894921371% |
2σ | 95,44997361036% |
3σ | 99,73002039367% |
4σ | 99,99366575163% |
5σ | 99,99994266969% |
6σ | 99,99999980268% |
7σ | 99,99999999974% |
Za normalnu raspodelu, dve tačke na krivoj koje su udaljene jednu standardnu devijaciju od krive su takođe i prevojne tačke.
Osnovni primeri[uredi | uredi izvor]
Populaciona standardna devijacija ocena osmoro učenika[uredi | uredi izvor]
Pretpostavimo da je celokupna populacija od interesa osam učenika u određenom odeljenju. Za konačan skup brojeva, standardna devijacija populacije se nalazi uzimanjem kvadratnog korena proseka kvadrata odstupanja vrednosti oduzetih od njihove prosečne vrednosti. Ocene odeljenja od osam učenika (tj. statističke populacije) su sledećih osam vrednosti:
Ovih osam tačaka podataka imaju srednju vrednost (prosek) od 5:
Prvo se izračuna odstupanja svake tačke podataka od srednje vrednosti i kvadriraju se rezultati:
Varijansa je srednja vrednost ovih vrednosti:
a standardna devijacija populacije je jednaka kvadratnom korenu varijanse:
Ova formula važi samo ako osam vrednosti sa kojima je započeto čine kompletnu populaciju. Ako su vrednosti umesto toga bile slučajni uzorak izvučen iz neke velike roditeljske populacije (na primer, bilo je 8 učenika nasumično i nezavisno izabranih iz klase od 2 miliona), onda se deli sa 7 (što je n − 1) umesto sa 8 (što je n) u imeniocu poslednje formule, a rezultat je U tom slučaju, rezultat originalne formule bi bio nazivan standardna devijacija uzorka i označava sa s umesto sa Deljenje sa n − 1 umesto sa n daje nepristrasnu procenu varijanse veće roditeljske populacije. Ovo je poznato kao Beselova korekcija.[4][5] Grubo rečeno, razlog za to je da se formula za varijansu uzorka oslanja na izračunavanje razlika zapažanja od srednje vrednosti uzorka, a sama srednja vrednost uzorka je konstruisana da bude što je moguće bliža zapažanjima, tako da bi samo deljenje sa n potcenilo varijabilnost.
Standardna devijacija prosečne visine za odrasle muškarce[uredi | uredi izvor]
Ako je populacija od interesa približno normalno raspoređena, standardna devijacija daje informacije o proporciji zapažanja iznad ili ispod određenih vrednosti. Na primer, prosečna visina odraslih muškaraca u Sjedinjenim Državama je oko 70 inča (177,8 cm), sa standardnom devijacijom od oko 3 inča (7,62 cm). To znači da većina muškaraca (oko 68%, pod pretpostavkom normalne distribucije) ima visinu unutar 3 inča (7,62 cm) od srednje vrednosti (67–73 inča (170,18–185,42 cm)) – jedna standardna devijacija – i skoro svi muškarci (oko 95%) ima visinu unutar 6 inča (15,24 cm) od srednje vrednosti (64–76 inča (162,56–193,04 cm)) – dve standardne devijacije. Ako je standardna devijacija nula, onda bi svi muškarci bili visoki tačno 70 inča (177,8 cm). Ako bi standardna devijacija bila 20 inča (50,8 cm), onda bi muškarci imali mnogo varijabilniju visinu, sa tipičnim rasponom od oko 50–90 inča (127–228,6 cm). Tri standardne devijacije čine 99,7% populacije uzorka koja se proučava, pod pretpostavkom da je distribucija normalna ili u obliku zvona (pogledajte pravilo 68-95-99,7 ili empirijsko pravilo za više informacija).
Definicija populacionih vrednosti[uredi | uredi izvor]
Neka je μ očekivana vrednost (prosek) slučajne promenljive X sa gustinom f(x):
Standardna devijacija σ od X je definisana kao
Koristeći reči, standardna devijacija je kvadratni koren varijanse od X.
Standardna devijacija distribucije verovatnoće je ista kao i slučajna promenljiva koja ima tu distribuciju.
Nemaju sve slučajne promenljive standardnu devijaciju. Ako distribucija ima velike repove koji idu do beskonačnosti, moguće je da standardna devijacija ne postoji, jer integral možda neće konvergirati. Normalna distribucija ima repove koji idu u beskonačnost, ali njena srednja vrednost i standardna devijacija postoje, jer se repovi dovoljno brzo smanjuju. Pareto raspodela sa parametrom ima srednju vrednost, ali ne i standardnu devijaciju (slobodno govoreći, standardna devijacija je beskonačna). Košijeva raspodela nema srednju vrednost, ni standardnu devijaciju.
Diskretna slučajna promenljiva[uredi | uredi izvor]
U slučaju kada X poprima slučajne vrednosti iz konačnog skupa podataka x1, x2, …, xN, pri čemu svaka vrednost ima istu verovatnoću, standardna devijacija je
ili, koristeći zapis sumiranja,
Ako, umesto da imaju jednake verovatnoće, vrednosti imaju različite verovatnoće, neka x1 ima verovatnoću p1, x2 ima verovatnoću p2, …, xN ima verovatnoću pN. U ovom slučaju, standardna devijacija će biti
Kontinuirana slučajna promenljiva[uredi | uredi izvor]
Standardna devijacija kontinuirane slučajne promenljive X realne vrednosti sa funkcijom gustine verovatnoće p(x) je
i gde su integrali definitivni u odnosu na x u rasponu preko skupa mogućih vrednosti slučajne promenljive X.
U slučaju parametarske porodice distribucija, standardna devijacija se može izraziti u smislu parametara. Na primer, u slučaju log-normalne distribucije sa parametrima μ i σ2, standardna devijacija je
Vidi još[uredi | uredi izvor]
Reference[uredi | uredi izvor]
- ^ Bland, J.M.; Altman, D.G. (1996). „Statistics notes: measurement error”. BMJ. 312 (7047): 1654. PMC 2351401 . PMID 8664723. doi:10.1136/bmj.312.7047.1654.
- ^ Gauss, Carl Friedrich (1816). „Bestimmung der Genauigkeit der Beobachtungen”. Zeitschrift für Astronomie und Verwandte Wissenschaften. 1: 187—197.
- ^ Walker, Helen (1931). Studies in the History of the Statistical Method. Baltimore, MD: Williams & Wilkins Co. str. 24—25.
- ^ Weisstein, Eric W. „Bessel's Correction”. MathWorld.
- ^ „Standard Deviation Formulas”. www.mathsisfun.com. Pristupljeno 21. 8. 2020.
Literatura[uredi | uredi izvor]
- Edwards, A.W.F (2002). Pascal's arithmetical triangle: the story of a mathematical idea (2nd izd.). JHU Press. ISBN 0-8018-6946-3.
- Huygens, Christiaan (1657). De ratiociniis in ludo aleæ (English translation, published in 1714).
- Blitzstein, Joe; Hwang, Jessica (2014). Introduction to Probability. CRC Press. ISBN 9781466575592.
- Fristedt, Bert; Gray, Lawrence (1996). A modern approach to probability theory. Boston: Birkhäuser. ISBN 3-7643-3807-5.
- Kallenberg, Olav (1986). Random Measures (4th izd.). Berlin: Akademie Verlag. ISBN 0-12-394960-2. MR 0854102.
- Kallenberg, Olav (2001). Foundations of Modern Probability (2nd izd.). Berlin: Springer Verlag. ISBN 0-387-95313-2.
- Papoulis, Athanasios (1965). Probability, Random Variables, and Stochastic Processes (9th izd.). Tokyo: McGraw–Hill. ISBN 0-07-119981-0.
- Yates, Daniel S.; Moore, David S; Starnes, Daren S. (2003). The Practice of Statistics (2nd izd.). New York: Freeman. ISBN 978-0-7167-4773-4. Arhivirano iz originala 2005-02-09. g.
- „Random Variables”. www.stat.yale.edu. Pristupljeno 2020-08-21.
- Dekking, Frederik Michel; Kraaikamp, Cornelis; Lopuhaä, Hendrik Paul; Meester, Ludolf Erwin (2005). „A Modern Introduction to Probability and Statistics”. Springer Texts in Statistics (na jeziku: engleski). ISBN 978-1-85233-896-1. ISSN 1431-875X. doi:10.1007/1-84628-168-7.
- L. Castañeda; V. Arunachalam; S. Dharmaraja (2012). Introduction to Probability and Stochastic Processes with Applications. Wiley. str. 67. ISBN 9781118344941.
- Bertsekas, Dimitri P. (2002). Introduction to Probability. Tsitsiklis, John N., Τσιτσικλής, Γιάννης Ν. Belmont, Mass.: Athena Scientific. ISBN 188652940X. OCLC 51441829.
Spoljašnje veze[uredi | uredi izvor]
- Hazewinkel Michiel, ur. (2001). „Quadratic deviation”. Encyclopaedia of Mathematics. Springer. ISBN 978-1556080104.
- "Standard Deviation Calculator"
- Lawler, Greg. „Notes on Probability” (PDF). University of Chicago. Arhivirano iz originala (PDF) 25. 10. 2021. g. Pristupljeno 24. 10. 2021.