Diskretna uniformna raspodela

Из Википедије, слободне енциклопедије
Иди на навигацију Иди на претрагу
Diskretna uniformna raspodela
Funkcija verovatnoće
Discrete uniform probability mass function for n = 5
n = 5 gde je n = b − a + 1
Funkcija kumulativne raspodele
Discrete uniform cumulative distribution function for n = 5
Notacija ili
Parametri

Nositelj
pmf
CDF
Prosek
Medijana
ModusN/A
Varijansa
Koef. asimetrije
Kurtoza
Entropija
MGF
CF

U teoriji verovatnoće i statistici, diskretna uniformna raspodela je simetrična raspodela verovatnoće pri čemu je za konačni broj vrednosti podjednako verovatno da budu uočene; svaka od n vrednosti ima jednaku verovatnoću 1/n. Drugim rečima „diskretna uniformna distribucija” je „poznati, konačni broj ishoda koji su podjednako verovatni da se dogode”.

Jednostavan primer diskretne uniformne distribucije je bacanje kocke. Moguće vrednosti su 1, 2, 3, 4, 5, 6, i svaki put kada se baci kocka verovatnoća datih rezultata je 1/6. Ako se bacaju dve kocke i dodaju njihove vrednosti, rezultirajuća raspodjela više nije uniformna, jer svi zbirovi nemaju jednaku verovatnoću.

Sama diskretna uniformna raspodela je inherentno neparametarska. Prikladno je, međutim, prikazati njene vrednosti generalno svim celim brojevima u intervalu [a,b], tako da a i b postaju glavni parametri distribucije (često se jednostavno razmatra interval [1, n] sa jednim parametrom n). Ovim konvencijama može se izraziti funkcija kumulativne distribucije (engl. cumulative distribution function - CDF) diskretne uniformne distribucije za bilo koje k ∈ [a,b], kao

Procena maksimuma[уреди]

Uzorak k opažanja dobijen je iz uniformne distribucije celih brojeva , s ciljem procene nepoznatog maksimuma N. Ovaj problem je opšte poznat kao nemački tenkovski problem, po primeni maksimalne procene na procenu nemačke proizvodnje tenkova tokom Drugog svetskog rata.[1][2][3][4][5]

Nepristrasni procenjivač uniformne minimalne varijanse (engl. Uniformly minimum variance unbiased estimator - UMVU) za maksimum je dat sa[6][7]

gde je m maksimum uzorka i k je veličina uzorka, uzorkovanog bez zamene.[8] Ovo se može smatrati veoma jednostavnim slučajem procenе maksimalnog razmaka.

To ima varijansu od[8]

tako da je standardna devijacija aproksimativno , (populaciona) prosečna veličina razmaka između uzoraka; uporedite sa iznad.

Maksimum uzorka je procenjivač maksimalne verovatnoće za populacioni maksimum, mada, kao što je gore diskutovano, on je pristrasan.

Ako uzorci nisu numerisani, već su prepoznatljivi ili markirani, umesto toga se može proceniti veličina populacije metodom označavanja i ponovnog hvatanja.[9][10]

Derivacija[уреди]

Za neki ceo broj m takav da je k ≤ m ≤ N, verovatnoća da će maksimalni uzorak biti jednak m može se izračunati na sledeći način. Broj različitih grupa od k tenkova koji se mogu načiniti od ukupno N tenkova dat je binomnim koeficijentom . Pošto se u ovom načinu brojanja permutacija tenkova broji samo jednom, mogu se urediti serijski brojevi i uzeti u obzir maksimum svakog uzorka. Da bi se izračunala verovatnoća, mora se odrediti broj poređanih uzoraka koji se može formirati sa poslednjim elementom jednakim m, i svi ostali k-1 tenkovi manji ili jednaki m-1. Broj uzoraka sa k-1 tenkova koji se mogu napraviti od ukupno m-1 tenkova dat je binomnim koeficijentom , tako da je verovatnoća da je maksimum m jednaka .

Ako je dat ukupn broj N i veličina uzorka k, očekivana vrednost maksimuma uzorka je

gde je korišten identitet hokejaškog štapa .

Iz ove jednačine, nepoznati kvantitet N se može izraziti u obliku očekivanja i veličine uzorka kao

Iz linearnosti očekivanja se dobija da je

i stoga se nepristrasni procenjivač od N dobija zamenjivanjem očekivanja opservacijom,

Osim što je nepristrasan ovaj procenjivač takođe dostiže minimalnu varijansu. Da bi se to pokazalo, prvo treba napomenuti da je maksimalan uzorak dovoljna statistička za maksimum populacije, jer je verovatnoća P(m;N) izražena samo kao funkcija od m. Zatim se mora pokazati da su statistike za m takođe kompletne statistike, i posebna vrsta dovoljne statistike. Zatim Lehman-Šefeova teorema implicira da je minimalna procena nepristrasne varijanse od N.[11]

Varijansa procenjivača izračunava se iz varijance maksimuma uzorka

Varijanse maksimuma se zatim izračunava iz očekivanih vrednosti od i . Izračunavanje očekivane vrednosti od je,

gde je drugi član očekivana vrednost od . Prvi član se može izraziti tako da zavisi od k i N,

pri čemu je napravljena zamena i korišten je identitet hokejaškog štapa. Zamenjujući ovaj rezultat i očekivanje od u jednačini od ,

Variansa od se zatim dobija,

Konačno varijansa procenjivača se može izračunati,

Vidi još[уреди]

Reference[уреди]

  1. ^ „Gavyn Davies does the maths – How a statistical formula won the war”. The Guardian. 20. 7. 2006. Приступљено 6. 7. 2014. 
  2. ^ Matthews, Robert (23. 5. 1998), „Data sleuths go to war, sidebar in feature "Hidden truths", New Scientist, Архивирано из оригинала на датум 18. 4. 2001 
  3. ^ Bob Carruthers (2012-03-01). Panther V in Combat. Coda Books Ltd. стр. 94—. ISBN 978-1-908538-15-4. 
  4. ^ Johnson, Roger (2006), „Estimating the Size of a Population”, Getting the Best from Teaching Statistics, Архивирано из оригинала (PDF) на датум 20. 11. 2008 
  5. ^ Joyce, Smart. „German Tank Problem”. Logan High School. Архивирано из оригинала на датум 2012-04-24. Приступљено 8. 7. 2014. 
  6. ^ Keener, Robert W. (2006). Statistical Theory: Notes for a Course in Theoretical Statistics. Springer. стр. 47—48, 57—58. 
  7. ^ Voinov V. G.,, Nikulin M.S. (1993). Unbiased estimators and their applications, Vol.1: Univariate case. Kluwer Academic Publishers. стр. 521p. 
  8. 8,0 8,1 Johnson, Roger (1994), „Estimating the Size of a Population”, Teaching Statistics, 16 (2 (Summer)), doi:10.1111/j.1467-9639.1994.tb00688.x 
  9. ^ Krebs, Charles J. (2009). Ecology (6th изд.). стр. 119. ISBN 978-0-321-50743-3. 
  10. ^ Chao, A.; Tsay, P. K.; Lin, S. H.; Shau, W. Y.; Chao, D. Y. (2001). „The applications of capture-recapture models to epidemiological data”. Statistics in Medicine. 20 (20): 3123—3157. PMID 11590637. doi:10.1002/sim.996. 
  11. ^ G. A. Young and R. L Smith (2005) Essentials of Statistical Inference, Cambridge University Press, Cambridge, UK, p. 95

Literatura[уреди]

Spoljašnje veze[уреди]