Пређи на садржај

Варијанса

С Википедије, слободне енциклопедије
(преусмерено са Статистичка дисперзија)
Пример узорака из две популације са истом средњом вредношћу, али различитим варијацијама. Црвена популација има средњу вредност 100 и варијансу 100 (SD=10), док плава популација има средњу вредност 100 и варијансу 2500 (SD=50).

Дисперзија или варијанса је појам из теорије вероватноће и статистике. Она представља математичко очекивање одступања случајне променљиве од њене средње вредности. Варијанса је мера дисперзије, што значи да изражава колико је скуп бројева раширен од њихове просечне вредности. Варијанса има централну улогу у статистици, где неке идеје које је користе укључују дескриптивну статистику, статистичко закључивање, тестирање хипотезе, адекватност уклапања и Монте Карло узорковање. Варијанца је важан алат у науци, где је уобичајена примена статистичке анализе података. Варијанца је квадрат стандардне девијације, други централни моменат дистрибуције и коваријанса случајне променљиве са самом собом, а често се представља са , , , , или .[1]

На пример, савршена коцка за игру може да да један од 6 исхода. Очекивана вредност броја којег ће коцка да покаже је (1 + 2 + 3 + 4 + 5 + 6)/6 = 3,5, очекивана стандардна девијација је σ ≈ 1.71 (квадратни корен аритметичке средине једнаковероватних квадрата апсолутних одступања: 3,5 − 1, 3,5 − 2, 3,5 − 3, 4 − 3,5, 5 − 3,5, 6 − 3,5, што даје 2,5, 1,5, 0,5, 0,5, 1,5, 2,5), очекивано квадратно одступање или варијанса је  17,5/6 ≈ 2,9 (средња вредност једнаковероватних квадрата одступања: 2,52, 1,52, 0,52, 0,52, 1,52, 2,52).

Дефиниција

[уреди | уреди извор]

Нека је математичко очекивање реалног случајног вектора за који постоји интеграл квадрата његових вредности. Тада је варијанса случајне променљиве:

Ако је вектор једнодимензионалан, услови за могу да се упросте. Ако је , онда важи:

Ова дефиниција обухвата случајне варијабле које су генерисане процесима који су дискретни, континуирани, ни једно ни друго или мешовити. Варијанса се такође може сматрати коваријансом случајне променљиве са самом собом:

Варијанса је такође еквивалентна другом кумуланту дистрибуције вероватноће која генерише . Варијанса се обично означава као , или понекад као или , или симболично као или једноставно (изговара се „сигма на квадрат”). Израз за варијансу се може проширити на следећи начин:

Другим речима, варијанса X је једнака средњој вредности квадрата X минус квадрат средње вредности X. Ова једначина не би требало да се користи за прорачуне коришћењем аритметике са плутајућим зарезом, јер пати од катастрофалног поништавања ако су две компоненте једначине сличне по величини. За друге нумерички стабилне алтернативе погледајте алгоритме за израчунавање варијансе.

Дискретна случајна променљива

[уреди | уреди извор]

Ако је генератор случајне променљиве дискретан са функцијом вероватноће , онда је

где је очекивана вредност. То је,

(Када је таква дискретна пондерисана варијанса одређена пондерима чији збир није 1, тада се дели збиром пондера.)

Варијанца колекције од једнако вероватних вредности може се написати као

где је просечна вредност. То је,

Варијанца скупа од једнако вероватних вредности може бити еквивалентно изражена, без директног позивања на средњу вредност, у смислу квадрата одступања свих тачака једне од друге:[2]

Апсолутно континуирана случајна променљива

[уреди | уреди извор]

Ако рандомна променљива има функцију густине вероватноће , и је кореспондирајућа кумулативна функција расподеле, онда је

или еквивалентно,

где је очекивана вредност од дата са

У овим формулама, интеграли у односу на и су Лебесгов и Лебесг–Стилтјеов интеграл, респетивно.

Ако је функција интеграбилна по Риману на сваком коначном интервалу онда је

при чему је овај интеграл неправилан Риманов интеграл.

Експоненцијална дистрибуција

[уреди | уреди извор]

Експоненцијална расподела са параметром λ је континуирана расподела чија је функција густине вероватноће дата са

на интервалу [0, ∞). Може се показати да је његова средња вредност

Користећи интеграцију по деловима и употребљавајући очекивану вредност која је већ израчуната, добија се:

Стога је варијанса од X дата изразом

Бацање коцке

[уреди | уреди извор]

Шестострана коца се може моделовати као дискретна рандомна променљива, X, са исходима од 1 до 6, сваки са једнаком вероватноћом 1/6. Очекивана вредност X је Дакле, варијанса X је

Општа формула за варијансу исхода, X, n-стране коцке је

Често коришћене дистрибуције вероватноће

[уреди | уреди извор]

Следећа табела наводи варијансу за неке често коришћене дистрибуције вероватноће.

Назив расподеле вероватноће Функција расподеле вероватноће Аритметичка средина Варијанса
Биномна расподела
Геометријска расподела
Нормална расподела
Униформна расподела (континуирана)
Експоненцијална расподела
Поасонова расподела

Референце

[уреди | уреди извор]
  1. ^ Wasserman, Larry (2005). All of Statistics: a concise course in statistical inference. Springer texts in statistics. стр. 51. ISBN 9781441923226. 
  2. ^ Yuli Zhang; Huaiyu Wu; Lei Cheng (јун 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). стр. 987—992. 

Литература

[уреди | уреди извор]

Спољашње везе

[уреди | уреди извор]