Нормална расподела

Из Википедије, слободне енциклопедије
Густина вероватноће нормалне расподеле са различитим параметрима. Зеленом бојом је представљена нормална нормирана расподела.

Нормална расподела или Гаусова расподела, је важна фамилија непрекидних расподела вероватноће, са применама у многим пољима. Чланови фамилије нормалне расподеле су дефинисани преко два параметра, математичко очекивање, и варијанса (дисперзија) σ2. Нормална нормирана расподела је нормална расподела са очекивањем једнаким нули, и варијансом једнаком један (зелена крива на слици десно). Карл Фридрих Гаус се доводи у везу са овим скупом расподела, јер је помоћу њих анализирао астрономске податке[1], и дефинисао једначину функције густине расподеле нормалне расподеле.

Важност нормалне расподеле као модела квантитативних феномена у природним и друштвеним наукама је последица централне граничне теореме. Многа психолошка мерења и физички феномени се могу добро апроксимирати нормалном расподелом. Иако су механизми који леже у основи ових феномена често непознати, употреба модела нормалне расподеле се теоретски оправдава претпоставком да много малих, независних утицаја адитивно доприносе свакој опсервацији.

Нормална расподела се јавља и у многим областима статистике. На пример, средња вредност узорка има приближно нормалну расподелу, чак и ако расподела вероватноће популације из које се узорак узима није нормална. Нормална расподела је најчешће коришћена фамилија расподела у статистици, и многи статистички тестови су базирани на претпоставци нормалности. У теорији вероватноће, нормалне респоделе се јављају као граничне расподеле више непрекидних и случајних фамилија расподела.

Дефиниција[уреди]

Случајна променљива X са расподелом вероватноће f:\R\to\R_{>0},\ x\mapsto f(x)

f(x) = \frac {1}{\sigma\sqrt{2\pi}}\exp\left(-\frac {1}{2} \left(\frac{x-\mu}{\sigma}\right)^2\right) [2]

има нормалну расподелу са параметрима \mu, \sigma, што се пише као X \sim \mathcal N(\mu, \sigma^2) или (\mu,\sigma^2), где је \mu математичко очекивање и \sigma стандардна девијација.

Функција расподеле вероватноће нормалне расподеле дата је изразом: F(x) = \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^x \exp\left(-\frac{1}{2} \left(\frac{t-\mu}{\sigma}\right)^2\right) \mathrm dt.

Функција расподеле вероватноће стандардне нормалне расподеле \varphi_{0;1}(x)=\frac {1}{\sqrt{2\pi}} \cdot e^{-\frac {1}{2} x^2}

То је густина вероватноће за стандардну нормалну расподелу (\mu=0,\ \sigma = 1). Интервали на растојању 1, 2 и 3 стандардне девијације од математичког очекивања 0 заузимају 68 %, 95,5 % и 99,7 % површине испод звонасте криве. Исти проценти важе за сваку нормалну расподелу, без обзира на математичко очекивање и стандардну девијацију. Треба приметити да густина нормалне расподеле никада не достиже 0, дакле важи f(x)>0 за све реалне вредности x.

Нормална расподела је гранични случај централне граничне теореме који никада није савршен у пракси. Међутим, конвергенција збирне вредности случајних променљивих расте врло брзо са повећањем броја променљивих n. Збир 30 или 40 независних случајних променљивих, које припадају идентичном и произвољном типу расподеле вероватноће, већ је веома близак нормалној расподели.

Особине[уреди]

Симетрија[уреди]

Граф функције нормалне расподеле  f:\R\to\R је звонаста Гаусова крива, чија висина и ширина зависи од параметра  \sigma . Крива је осно симетрична око осе  x = \mu . Њена кумулативна функција F има централну симетрију око тачке P(\mu|0,5).

Максимум и превојне тачке функције расподеле вероватноће[уреди]

Израчунавањем првог и другог извода можемо израчунати максимум и превојне тачке функције нормалне расподеле. Први извод функције расподеле вероватноће је

f'(x) = -\frac{x-\mu}{\sigma^2} f(x).

Максимум се налази у тачки x_\mathrm{max} = \mu, где износи f_\mathrm{max} = \frac 1{\sigma\sqrt{2\pi}}.

Други извод гласи:

f''(x) = \frac 1{\sigma^2}\left(\frac 1{\sigma^2}(x-\mu)^2-1\right) f(x).

Отуда закључујемо да се превојне тачке налазе на координатама x=\mu\pm\sigma.

Нормирање[уреди]

Укупна површина испод Гаусове звонасте криве је тачно 1, што је одраз чињенице да је вероватноћа сигурног догађаја 1. Одатле следи да од две Гаусове криве које имају исто \mu, али различиту вредност \sigma, она са већим \sigma је шира и нижа него она друга. Две Гаусове криве са са једнаким \sigma и различитим \mu имају графике који изгледају истоветно, осим што су померени по x-оси за износ разлике две вредности \mu.

Нормирање Гаусове криве се изводи на следећи начин.

Дефинишимо

A := \lim_{x \to \infty} F(x) = \frac 1{\sigma \sqrt{2\pi}} \int_{-\infty}^\infty \exp\left(-\frac 12 \left(\frac{t-\mu}\sigma\right)^2\right) \mathrm dt.

Да би расподела F била нормирана, мора важити A = 1.

Интеграл ћемо упростити коришћењем линеарне супституције \tau = \frac{t-\mu}\sigma, а онда важи \tau'(t) = \frac 1\sigma

\begin{align}
 A &= \frac 1{\sqrt{2\pi}} \int_{-\infty}^\infty \exp\left(-\frac 12 \tau(t)^2\right) \tau'(t) \mathrm dt\\
   &= \frac 1{\sqrt{2\pi}} \int_{-\infty}^\infty \exp\left(-\frac 12 \tau^2\right) \mathrm d\tau.
\end{align}

Као што смо и очекивали, вредност A је независна од параметара \sigma и \mu.

Израчунавање[уреди]

Директна примена интеграла за израчунавање површине испод Гаусове криве није могућа, јер се она не може свести на елементарне функције познатих интеграла. Раније су се за њено израчунавање користиле табеле. Данас је функција за израчунавање овог интеграла доступна на калкулаторима и рачунарима. Табеле овог интеграла се не дају за одабране вредност  \mu - и  \sigma , већ само за стандардну нормалну расподелу са параметрима  \mu=0 и  \sigma=1 (нормирана нормална расподела). За остале вредности ових параметара потребно је прерачунавање.

Табеле такође дају вредности кумулативне функције вероватноће  \Phi , познате и као Гаусов интеграл грешке:

\Phi(z)=\frac 1{\sqrt{2\pi}} \cdot \int_{-\infty}^z \mathrm{e}^{-\frac 12 t^2} \mathrm{d}t

По аналогији, одговарајућа нормирана функција густине вероватноће  f означава се са  \phi .

Математичко очекивање[уреди]

Нормална расподела има следеће математичко очекивање

 \operatorname{E}(X) =\frac{1}{\sigma\sqrt{2\pi}}\int\limits_{-\infty}^{+\infty}x
                               \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\operatorname{d}x
                             = \mu.

Варијанса и стандардна девијација[уреди]

Вредност варијансе нормалне расподеле је

\operatorname{Var}(X) = \frac{1}{\sigma\sqrt{2\pi}}\int\limits_{-\infty}^{+\infty}(x-\mu)^2
                               \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\operatorname{d}x
                             = \sigma^2.

За вредност стандардне девијације добијамо

\sqrt{\operatorname{Var}(X)} = \sigma.

Референце[уреди]

  1. ^ Havil (2003).
  2. ^ Код функције exp(x) ради се о експоненцијалној функцији са основом e, која се представља и као e^x.


Спољашње везе[уреди]

Викиостава
Викимедијина остава има још мултимедијалних датотека везаних за: Нормална расподела