Стандардна грешка

С Википедије, слободне енциклопедије
За вредност која је узоркована са непристрасном нормално расподељеном грешком, горе приказано представља удео узорака који би пао између 0, 1, 2 и 3 стандардне девијације изнад и испод стварне вредности.

Стандардна грешка (енгл. Standard error - SE) статистичког параметра (обично процене параметра) је стандардна девијација његове дистрибуције узорковања[1] или процена тог стандардног одступања. Ако је параметар или статистика средња вредност, она се назива стандардном грешком средње вредности (енгл. standard error of the mean - SEM).

Дистрибуција узорка популационе средње вредности се генерише поновљеним узорковањем и бележењем добијених средњих вредности.[2] Ово формира дистрибуцију различитих средњих вредности, и ова дистрибуција има своју средњу вредности и варијансу. Математички, добијена варијанса дистрибуције узорковања једнака је варијанси популације подељеној величином узорка. То је зато што како се величина узорка повећава, средње вредности узорака се ближе групишу око око популационе средње вредности. Стога је однос између стандардне грешке и стандардне девијације такав да је за дату величину узорка стандардна грешка једнака стандардној девијацији подељеној са квадратним кореном величине узорка. Другим речима, стандардна грешка средње вредности је мера дисперзије средњих вредности узорка око популационе средње вредности.

У регресијској анализи, израз „стандардна грешка” односи се на квадратни корен редуковане хи-квадратне статистике[3][4][5] или на стандардну грешку за дати коефицијент регресије (као што се користи, на пример, у интервалима поверења).

Стандардна грешка средње вредности[уреди | уреди извор]

Популација[уреди | уреди извор]

Стандардна грешка средње вредности (СЕМ) се може изразити као:

где је

σ - стандардна девијација популације.
n - величина (број опсервација) узорка.

Процена[уреди | уреди извор]

Будући да је популациона стандардна девијација ретко позната, стандардна грешка средње вредности обично се процењује као стандардна девијација узорка подељена са квадратним кореном величине узорка (под претпоставком статистичке независности вредности у узорку).

где је

s - стандарцна девијација узорка (и.е., процена базирана на узорку стандардне девијације популације), и
n - величина (број опсервација) узорка.

Пример[уреди | уреди извор]

У оним контекстима у којима је стандардна грешка средње вредности дефинисана не као стандардна девијација средње вредности узорка, већ као њена процена, та се процена типично даје као њена вредност. Стога је уобичајено да се стандардна девијацију средње вредности алтернативно дефинише као:

Стандардна девијација просечне вредности узорка једнака је стандардној девијацији грешке у средњој вредности узорка у односу на праву средњу вредност, јер је средња вредност узорка непристрани процењивач. Стога се стандардна грешка средње вредности може разумети и као стандардна девијација грешке у средњој вредности узорка у односу на праву средњу вредност (или процену те статистике).

Напомена: стандардна грешка и стандардна девијација малих узорака имају тенденцију да систематски потцењују популациону стандардну грешку и стандардну девијацију: стандардна грешка средње вредности је пристрани процењивач популационе стандардне грешке. Са n = 2, подцењивање је око 25%, дој је за n = 6, подцењивање је само 5%. Гурланд и Трипати (1971) дају корекцију и једначину овог ефекта.[6] Сокал и Рохлф (1981) дају једначину корекцијског фактора за мале узорке од n < 20.[7] Погледајте непристрасну процену стандардне девијације за даљу дискусију.

Практични резултат: Смањење неизвесности у процени средње вредности за фактор два захтева добијање четири пута више опажања у узорку. Или за смањење стандардне грешке за десет пута потребно је сто пута више опажања.

Деривације[уреди | уреди извор]

Формула се може извести из варијансе суме независних рандомних променљивих.[8]

  • Ако су независних опсервација из популације која има средњу вредност и стандардну девијацију , онда је варијанса тотала .
  • Варијанса од (средње вредности ) је Алтернативно,
  • Стандардна девијација од је
Независне и идентично дистрибуиране рандомне променљиве са рандомном величином узорка

Постоје случајеви када се узима узорак, а да се унапред не зна колико ће опажања бити прихватљива према неком критеријуму. У таквим случајевима, величина узорка N је рандомна променљива чија варијација се додаје варијацији X, тако да

Var(T) = E(N)Var(X) + Var(N)E2(X).[9]

Ако N има Пуасонову дистрибуцију,[10][11] онда је E(N) = Var(N) са процењивачем N=n. Стога процењивач за Var(T) постаје nS2X + nXbar2 дајући[12]

стандардна грешка(Xbar) = √[(S2X + Xbar2)/n].

Студентова апроксимација кад је σ вредност непозната[уреди | уреди извор]

У многим практичним апликацијама права вредност σ није позната. Консеквентно, неопходно је да се користи дистрибуцију која узима у обзир опсег могућих σ вредности. Када је познато да је истинска исходишна дистрибуција Гаусијан, иако са непознатим σ, тада добијена процењена дистрибуција следи Студентову т-дистрибуцију. Стандардна грешка је стандардна девијација Студентове т-дистрибуције. Т-дистрибуције се донекле разликују од Гаусове и варирају у зависности од величине узорка. Мали узорци у извесној мери вероватније могу да доведу до подцењивања популационе стандардне девијације и имају средњу вредност која се разликује од стварне популационе средње вредности. Студентова т-дистрибуција даје вероватноћу ових догађаја с нешто тежим реповима у поређењу са Гаусовом. За процену стандардне грешке Студентове т-дистрибуције довољно је да се користи узорковање стандардне девијације s умјесто σ, и то се може користити за израчунавање интервала поверења.[13][14]

Напомена: Студентова расподела вероватноће је добра апроксимација за Гаусову расподелу кад је величина узорка већа од 100. За такве узорке може се користити потоња расподела, која је знатно једноставнија.

Види још[уреди | уреди извор]

Референце[уреди | уреди извор]

  1. ^ Еверитт, Б. С. (2003). Тхе Цамбридге Дицтионарy оф Статистицс. ЦУП. ИСБН 978-0-521-81099-9. 
  2. ^ Мерберг, А. анд С.Ј. Миллер (2008). "Тхе Сампле Дистрибутион оф тхе Медиан". Цоурсе Нотес фор Матх 162: Матхематицал Статистицс, пгс 1–9.
  3. ^ Кеннеy, Ј.; Кеепинг, Е. С. (1963). Матхематицс оф Статистицс. ван Ностранд. стр. 187. 
  4. ^ Зwиллингер, D. (1995). Стандард Матхематицал Таблес анд Формулае. Цхапман&Халл/ЦРЦ. стр. 626. ИСБН 0-8493-2479-3. 
  5. ^ Хаyасхи, Фумио (2000). Ецонометрицс. Принцетон Университy Пресс. ИСБН 0-691-01018-8. 
  6. ^ Гурланд, Ј; Трипатхи РЦ (1971). „А симпле аппроxиматион фор унбиасед естиматион оф тхе стандард девиатион”. Америцан Статистициан. 25 (4): 30—32. ЈСТОР 2682923. дои:10.2307/2682923. 
  7. ^ Сокал; Рохлф (1981). Биометрy: Принциплес анд Працтице оф Статистицс ин Биологицал Ресеарцх (2нд изд.). стр. 53. ИСБН 978-0-7167-1254-1. 
  8. ^ Хутцхинсон, Т. П. Ессентиалс оф Статистицал Метходс, ин 41 пагес. Аделаиде: Румсбy. ИСБН 978-0-646-12621-0. 
  9. ^ Цорнелл, Ј Р, анд Бењамин, C А, Пробабилитy, Статистицс, анд Децисионс фор Цивил Енгинеерс, МцГраw-Хилл, НY, 1970, пп.178-9.
  10. ^ Хаигхт, Франк А. (1967). Хандбоок оф тхе Поиссон Дистрибутион. Неw Yорк, НY, УС: Јохн Wилеy & Сонс. ИСБН 978-0-471-33932-8. 
  11. ^ Поиссон, Симéон D. (1837). Пробабилитé дес југементс ен матиèре цриминелле ет ен матиèре цивиле, прéцéдéес дес рèглес гéнéралес ду цалцул дес пробабилитéс [Ресеарцх он тхе Пробабилитy оф Јудгментс ин Цриминал анд Цивил Маттерс] (на језику: француски). Парис, Франце: Бацхелиер. 
  12. ^ Ван Треес, Харрy L. (2013). Детецтион естиматион анд модулатион тхеорy. Кристине L. Белл, Зхи Тиан (Сецонд изд.). Хобокен, Н.Ј. ИСБН 978-1-299-66515-6. ОЦЛЦ 851161356. 
  13. ^ Хурст, Симон. „Тхе Цхарацтеристиц Фунцтион оф тхе Студент т Дистрибутион”. Финанциал Матхематицс Ресеарцх Репорт Но. ФМРР006-95, Статистицс Ресеарцх Репорт Но. СРР044-95. Архивирано из оригинала 18. 2. 2010. г. 
  14. ^ Нортон, Маттхеw; Кхокхлов, Валентyн; Урyасев, Стан (2019). „Цалцулатинг ЦВаР анд бПОЕ фор цоммон пробабилитy дистрибутионс wитх апплицатион то портфолио оптимизатион анд денситy естиматион” (ПДФ). Анналс оф Оператионс Ресеарцх. Спрингер. 299 (1-2): 1281—1315. дои:10.1007/с10479-019-03373-1. Архивирано из оригинала (ПДФ) 31. 03. 2023. г. Приступљено 2023-02-27. 

Литература[уреди | уреди извор]

Спољашње везе[уреди | уреди извор]