Standardna greška

Standardna greška (енгл. Standard error - SE) statističkog parametra (obično procene parametra) je standardna devijacija njegove distribucije uzorkovanja[1] ili procena tog standardnog odstupanja. Ako je parametar ili statistika srednja vrednost, ona se naziva standardnom greškom srednje vrednosti (енгл. standard error of the mean - SEM).
Distribucija uzorka populacione srednje vrednosti se generiše ponovljenim uzorkovanjem i beleženjem dobijenih srednjih vrednosti. Ovo formira distribuciju različitih srednjih vrednosti, i ova distribucija ima svoju srednju vrednosti i varijansu. Matematički, dobijena varijansa distribucije uzorkovanja jednaka je varijansi populacije podeljenoj veličinom uzorka. To je zato što kako se veličina uzorka povećava, srednje vrednosti uzoraka se bliže grupišu oko oko populacione srednje vrednosti. Stoga je odnos između standardne greške i standardne devijacije takav da je za datu veličinu uzorka standardna greška jednaka standardnoj devijaciji podeljenoj sa kvadratnim korenom veličine uzorka. Drugim rečima, standardna greška srednje vrednosti je mera disperzije srednjih vrednosti uzorka oko populacione srednje vrednosti.
U regresijskoj analizi, izraz „standardna greška” odnosi se na kvadratni koren redukovane hi-kvadratne statistike ili na standardnu grešku za dati koeficijent regresije (kao što se koristi, na primer, u intervalima poverenja).
Standardna greška srednje vrednosti[уреди | уреди извор]
Populacija[уреди | уреди извор]
Standardna greška srednje vrednosti (SEM) se može izraziti kao:
gde je
- σ - standardna devijacija populacije.
- n - veličina (broj opservacija) uzorka.
Procena[уреди | уреди извор]
Budući da je populaciona standardna devijacija retko poznata, standardna greška srednje vrednosti obično se procenjuje kao standardna devijacija uzorka podeljena sa kvadratnim korenom veličine uzorka (pod pretpostavkom statističke nezavisnosti vrednosti u uzorku).
gde je
- s - standarcna devijacija uzorka (i.e., procena bazirana na uzorku standardne devijacije populacije), i
- n - veličina (broj opservacija) uzorka.
Primer[уреди | уреди извор]
U onim kontekstima u kojima je standardna greška srednje vrednosti definisana ne kao standardna devijacija srednje vrednosti uzorka, već kao njena procena, ta se procena tipično daje kao njena vrednost. Stoga je uobičajeno da se standardna devijaciju srednje vrednosti alternativno definiše kao:
Standardna devijacija prosečne vrednosti uzorka jednaka je standardnoj devijaciji greške u srednjoj vrednosti uzorka u odnosu na pravu srednju vrednost, jer je srednja vrednost uzorka nepristrani procenjivač. Stoga se standardna greška srednje vrednosti može razumeti i kao standardna devijacija greške u srednjoj vrednosti uzorka u odnosu na pravu srednju vrednost (ili procenu te statistike).
Napomena: standardna greška i standardna devijacija malih uzoraka imaju tendenciju da sistematski potcenjuju populacionu standardnu grešku i standardnu devijaciju: standardna greška srednje vrednosti je pristrani procenjivač populacione standardne greške. Sa n = 2, podcenjivanje je oko 25%, doj je za n = 6, podcenjivanje je samo 5%. Gurland i Tripati (1971) daju korekciju i jednačinu ovog efekta.[2] Sokal i Rohlf (1981) daju jednačinu korekcijskog faktora za male uzorke od n < 20.[3] Pogledajte nepristrasnu procenu standardne devijacije za dalju diskusiju.
Praktični rezultat: Smanjenje neizvesnosti u proceni srednje vrednosti za faktor dva zahteva dobijanje četiri puta više opažanja u uzorku. Ili za smanjenje standardne greške za deset puta potrebno je sto puta više opažanja.
Derivacije[уреди | уреди извор]
Lua грешка in Модул:Further-lat at line 31: attempt to call field 'formatPages' (a nil value).
Formula se može izvesti iz varijanse sume nezavisnih randomnih promenljivih.[4]
- Ako su nezavisnih opservacija iz populacije koja ima srednju vrednost i standardnu devijaciju , onda je varijansa totala .
- Varijansa od (srednje vrednosti ) je Alternativno,
- Standardna devijacija od je
- Nezavisne i identično distribuirane randomne promenljive sa randomnom veličinom uzorka
Postoje slučajevi kada se uzima uzorak, a da se unapred ne zna koliko će opažanja biti prihvatljiva prema nekom kriterijumu. U takvim slučajevima, veličina uzorka N je randomna promenljiva čija varijacija se dodaje varijaciji X, tako da
- Var(T) = E(N)Var(X) + Var(N)E2(X).[5]
Ako N ima Puasonovu distribuciju, onda je E(N) = Var(N) sa procenjivačem N=n. Stoga procenjivač za Var(T) postaje nS2X + nXbar2 dajući
- standardna greška(Xbar) = √[(S2X + Xbar2)/n].
Studentova aproksimacija kad je σ vrednost nepoznata[уреди | уреди извор]
Lua грешка in Модул:Further-lat at line 31: attempt to call field 'formatPages' (a nil value).
U mnogim praktičnim aplikacijama prava vrednost σ nije poznata. Konsekventno, neophodno je da se koristi distribuciju koja uzima u obzir opseg mogućih σ vrednosti. Kada je poznato da je istinska ishodišna distribucija Gausijan, iako sa nepoznatim σ, tada dobijena procenjena distribucija sledi Studentovu t-distribuciju. Standardna greška je standardna devijacija Studentove t-distribucije. T-distribucije se donekle razlikuju od Gausove i variraju u zavisnosti od veličine uzorka. Mali uzorci u izvesnoj meri verovatnije mogu da dovedu do podcenjivanja populacione standardne devijacije i imaju srednju vrednost koja se razlikuje od stvarne populacione srednje vrednosti. Studentova t-distribucija daje verovatnoću ovih događaja s nešto težim repovima u poređenju sa Gausovom. Za procenu standardne greške Studentove t-distribucije dovoljno je da se koristi uzorkovanje standardne devijacije s umjesto σ, i to se može koristiti za izračunavanje intervala poverenja.
Napomena: Studentova raspodela verovatnoće je dobra aproksimacija za Gausovu raspodelu kad je veličina uzorka veća od 100. Za takve uzorke može se koristiti potonja raspodela, koja je znatno jednostavnija.
Vidi još[уреди | уреди извор]
- Koeficijent varijacije
- Ilustracija centralne granične teoreme
- Verovatna greška
- Ponderisana aritmetička sredina
- Srednja vrednost i kovarijansa uzorka
- Varijansa
Reference[уреди | уреди извор]
- ^ Everitt, B. S. (2003). The Cambridge Dictionary of Statistics. CUP. ISBN 978-0-521-81099-9.
- ^ Gurland, J; Tripathi RC (1971). „A simple approximation for unbiased estimation of the standard deviation”. American Statistician. 25 (4): 30—32. JSTOR 2682923. doi:10.2307/2682923.
- ^ Sokal; Rohlf (1981). Biometry: Principles and Practice of Statistics in Biological Research (2nd изд.). стр. 53. ISBN 978-0-7167-1254-1.
- ^ Hutchinson, T. P. Essentials of Statistical Methods, in 41 pages. Adelaide: Rumsby. ISBN 978-0-646-12621-0.
- ^ Cornell, J R, and Benjamin, C A, Probability, Statistics, and Decisions for Civil Engineers, McGraw-Hill, NY, 1970, pp.178-9.