Studentova t-raspodela

Из Википедије, слободне енциклопедије
Иди на навигацију Иди на претрагу
Studentova t
Funkcija gustine verovatnoće
Student t pdf.svg
Funkcija kumulativne raspodele
Student t cdf.svg
Parametri stepeni slobode (realnih)
Nositelj
PDF
CDF
gde je 2F1 hipergeometrijska funkcija
Prosek0 za , inače nedefinisana
Medijana0
Modus0
Varijansa za , ∞ za , inače nedefinisana
Koef. asimetrije0 za , inače nedefinisana
Kurtoza za , ∞ za , inače nedefinisana
Entropija
MGFnedefinisano
CF za

U verovatnoći i statistici, Studentova t-raspodela (ili jednostavno t-raspodela) je bilo koji član familije kontinuarnih raspodela verovatnoće koje nastaju iz procenjivanja srednje vrednosti normalne raspodele populacije u situacijama gde je veličina uzorka mala i populaciona standardna devijacija nije poznata. Ovu raspodelu je razvio Vilijam Goset pod pseudonimom Student.

t-Raspodela igra ulogu u velikom broju široko korištenih statističkih analiza, uključujući Studentov t-test za procenu statističke važnosti razlike između dve srednje vrednosti uzorka, izgradnju intervala pouzdanosti za razliku između dve populacijske sredine, i u linearnoj regresionoj analizi. Studentova t-distribucija se takođe pojavljuje u Bajesovoj analizi podataka iz normalne porodice.

Ako se uzme uzorak sa n opažanja iz normalne raspodele, onda se t-raspodela sa stepeni slobode može definisati kao raspodela lokacija srednje vrednosti uzorka u odnosu na pravu sredinu, podeljena sa standardnom devijacijom uzorka, nakon što se pomnoži sa standardizacionim članom . Na taj se način, t-raspodela se može koristiti za izgradnju intervala pouzdanosti za pravu sredinu.

t-Raspodela je simetrična i zvonastog oblika, poput normalne raspodele, ali ima teže repove, što znači da je sklonija stvaranju vrednosti koje padaju daleko od srednje vrednosti. Ovo je korisno za razumevanje statističkog ponašanja određenih vrsta odnosa slučajnih veličina, u kojima je varijacija u deliocu pojačana i može da proizvede udaljene vrednosti kada brojilac odnosa padne blizu nule. Studentova t-raspodela je poseban slučaj generalizovane hiperbolične raspodele.

Istorija i etimologija[уреди]

Statističar Wilijam Sili Goset, poznat kao „Student”

U statistici, t-raspodelu su prvi izveli kao posteriornu raspodelu Helmert[2][3][4] i Lirot 1876. godine.[5][6][7] t-Raspodela se isto tako pojavila u opštijoj formi kao Pirsonova raspodela tipa IV u publikaciji Karla Pirsona iz 1895. godine.

U litiraturi na engleskom jeziku ova raspodela nosi ime iz publikacije Vilijama Goseta iz 1908. godine u časopisu Biometrika objavljene pod pseudonimom „Student”.[8] Goset je radio u Ginisovoj pivari u Dablinu u Irskoj, i bio je zainteresovan za probleme malih uzoraka – na primer, hemijskih svojstva ječma gde veličina uzorka može da bude samo 3. Jedna verzija porekla pseudonima je da je Gosetov poslodavac preferirao da zaposleni koriste književne pseudonime kad objavljuju naučne radove umesto svojih stvarnih imena, tako da je on koristio ime „Student” da bi prikrio svoj identitet. Druga verzija je da Ginis nije želeo da njegovi konkurenti znaju da oni koriste t-test za određivanje kvaliteta sirovina.[9][10]

Gosetova publikacija naziva ovu raspodelu „frekvencija distribucije standardnih devijacija uzoraka uzetih iz normalne populacije”. Ona je postala dobro poznata zahvaljujući radu Ronalda Fišera, koji je nazivao ovu raspodelu „Studentova raspodela” i predstavljao testne vrednosti slovom t.[11][12]

Nastanak Studentove raspodele iz uzorkovanja[уреди]

Neka je nezavisno i identično raspodeljeni kao , i.e. ovo je uzorak veličine iz normalno raspodeljene populacije sa očekivanom srednjom vrednošću i varijansom .

Neka je

srednja vrednosti uzorka i neka je

(korigovana po Beselu) varijansa uzorka. Onda randomna promenljiva

ima standardnu normalnu raspodelu (i.e. normalnu sa očekivanom vrednosti 0 i varijansom 1), i randomna promenjiva

gde je supstituisano za , ima Studentovu t-raspodelu sa stepeni slobode. Brojilac i delilac u prethodnom izrazu su nezavisne randmne promenljive uprkos toga što se zasnivaju na istom uzorku .

Definicija[уреди]

Funkcija gustine verovatnoće[уреди]

Studentova t-raspodela ima funkciju raspodele datu sa

gde je broj stepeni slobode i je gama funkcija. Ovo se isto tako može napisati kao

gde je B Beta funkcija. Za celobrojne vrednosti stepena slobode važi:

Za parno,

Za neparno,

Funkcija gustine verovatnoće je simetrična, i njen sveukupni oblik podseća na zvonasti oblik promenljive sa normalnom raspodelom sa srednjom vrednosti od 0 i varijansom od 1, izuzev što je nešto niža i šira. Sa porastom broja stepeni slobode, t-raspodela prilazi normalnoj raspodeli sa srednjom vrednosti 0 i varijansom 1. Iz tog razloga je isto tako poznato kao parametar normalnosti.[13]

Sledeće slike prikazuju gustinu t-raspodele za povećane vrednosti od . Normalna raspodela je prikazana plavom linijom radi poređenja. Treba uočiti da t-raspodela (crvena linija) postaje bliža normalnoj raspodeli sa povećanjem .

Gustina t-raspodele (crveno) za 1, 2, 3, 5, 10, i 30 stepeni slobode u poređenju sa standardnom normalnom distribucijom (plavo).
Prethodni grafikoni su prikazani zeleno.
1df
1 stepen slobode
2df
2 stepena slobode
3df
3 stepena slobode
5df
5 stepeni slobode
10df
10 stepeni slobode
30df
30 stepeni slobode

Funkcija kumulativne raspodele[уреди]

Funkcija kumulativne raspodele se može napisati u smislu I, regulisane nekompletne beta funkcija. Za t > 0,[14][15]

gde je

Druge vrednosti se mogu dobiti simetrijom. Jedna alternativna formula, validna za , je[14]

gde je 2F1 poseban slučaj hipergeometrijske funkcije.

Za informacije o njenoj inverznoj funkciji kumulativne distribucije, pogledajte kvantilna funkcija § Studentova t-distribucija.

Specijalni slučajevi[уреди]

Određene vrednosti daju posebno jednostavnu formu.

Funkcija raspodele:
Funkcija gustine:
Pogledajte Košijevu raspodelu
Funkcija raspodele:
Funkcija gustine:
Funkcija raspodele:
Funkcija gustine:
Funkcija raspodele:
Funkcija gustine:
Funkcija raspodele:
Funkcija gustine:
Funkcija raspodele:
Pogledajte funkciju greške
Funkcija gustine:
Pogledajte normalnu raspodelu.

Reference[уреди]

  1. ^ Hurst, Simon. The Characteristic Function of the Student-t Distribution, Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95 Archived фебруар 18, 2010 at the Wayback Machine
  2. ^ Helmert FR (1875). „Über die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler”. Z. Math. U. Physik. 20: 300—3. 
  3. ^ Helmert FR (1876). „Über die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und uber einige damit in Zusammenhang stehende Fragen”. Z. Math. Phys. 21: 192—218. 
  4. ^ Helmert FR (1876). „Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit”. Astron. Nachr. 88 (8–9): 113—32. Bibcode:1876AN.....88..113H. doi:10.1002/asna.18760880802. 
  5. ^ Lüroth J (1876). „Vergleichung von zwei Werten des wahrscheinlichen Fehlers”. Astron. Nachr. 87 (14): 209—20. Bibcode:1876AN.....87..209L. doi:10.1002/asna.18760871402. 
  6. ^ Pfanzagl J, Sheynin O (1996). „Studies in the history of probability and statistics. XLIV. A forerunner of the t-distribution.”. Biometrika. 83 (4): 891—898. MR 1766040. doi:10.1093/biomet/83.4.891. 
  7. ^ Sheynin O (1995). „Helmert's work in the theory of errors”. Arch. Hist. Exact Sci. 49 (1): 73—104. doi:10.1007/BF00374700. 
  8. ^ "Student" [William Sealy Gosset] (1908). „The probable error of a mean” (PDF). Biometrika. 6 (1): 1—25. JSTOR 2331554. doi:10.1093/biomet/6.1.1. 
  9. ^ Wendl MC (2016). „Pseudonymous fame”. Science. 351 (6280): 1406. doi:10.1126/science.351.6280.1406. 
  10. ^ Mortimer RG (2005). Mathematics for physical chemistry (3rd изд.). Burlington, MA: Elsevier. стр. 326. ISBN 9780080492889. OCLC 156200058. 
  11. ^ Fisher RA (1925). „Applications of "Student's" distribution” (PDF). Metron. 5: 90—104. Архивирано из оригинала (PDF) на датум 5. 3. 2016. 
  12. ^ Walpole RE, Myers R, Myers S, et al. (2006). Probability & Statistics for Engineers & Scientists (7th изд.). New Delhi: Pearson. стр. 237. ISBN 9788177584042. OCLC 818811849. 
  13. ^ Kruschke JK (2015). Doing Bayesian Data Analysis (2nd изд.). Academic Press. ISBN 9780124058880. OCLC 959632184. 
  14. 14,0 14,1 Johnson NL, Kotz S, Balakrishnan N (1995). „Chapter 28”. Continuous Univariate Distributions. 2 (2nd изд.). Wiley. ISBN 9780471584940. 
  15. ^ Hogg RV, Craig AT (1978). Introduction to Mathematical Statistics (4th изд.). New York: Macmillan. ASIN B010WFO0SA. Sections 4.4 and 4.8 

Literatura[уреди]

Spoljašnje veze[уреди]