Uzorak (statistika)

S Vikipedije, slobodne enciklopedije
Vizuelni prikaz procesa uzorkovanja

Uzorak je izabrani deo statističkog skupa koji treba da predstavlja reprezent populacije koja je obuhvaćena istraživanjem. Ukoliko je uzorak reprezentativan po svim važnim svojstvima, rezultati dobijeni istraživanjem su pouzdaniji. Statističkim putem se mogu formirati različiti tipovi uzoraka od kojih su najpoznatiji: stratifikovani, kvotni, spareni, proporcionalni i sl. Greške kod formiranja uzorka mogu biti standardne i verovatne što se izračunava posebnim postupkom.

U statistici, osiguranju kvaliteta i metodologiji anketa, uzorkovanje je odabir podskupa (statistički uzorak) pojedinaca iz statističke populacije[1][2][3] za procenu karakteristika cele populacije. Statističari nastoje da uzorci predstavljaju dotičnu populaciju. Dve prednosti uzorkovanja su niža cena i brže prikupljanje podataka od merenja celokupne populacije.

Svako posmatranje meri jedno ili više svojstava (kao što su težina, lokacija, boja) posmatranih tela koja se razlikuju kao nezavisni objekti ili pojedinci. U anketnom uzorkovanju, mogu se primeniti ponderi na podatke kako bi se prilagodili dizajnu uzorka, posebno u slojevitom uzorkovanju.[4] Rezultati teorije verovatnoće i statističke teorije koriste se za vođenje prakse. U poslovnim i medicinskim istraživanjima, uzorkovanje se široko koristi za prikupljanje podataka o populaciji. [5] Prihvatanje uzorka se koristi da bi se utvrdilo da li proizvodna serija materijala ispunjava važeće specifikacije.

Definicija populacije[uredi | uredi izvor]

Uspešna statistička praksa zasniva se na fokusiranom definisanju problema. U uzorkovanje, ovo uključuje definisanje „populacije” iz koje se uzima naš uzorak. Populacija se može definisati tako da uključuje sve ljude ili predmete sa karakteristikama koje neko želi da razume. Budući da vrlo retko ima dovoljno vremena ili novca za prikupljanje informacija od svih ili svega u nekoj populaciji, cilj postaje pronalaženje reprezentativnog uzorka (ili podskupa) te populacije.

Ponekad je očigledno ono što definiše populaciju. Na primer, proizvođač mora da odluči da li je serija materijala iz proizvodnje dovoljno kvalitetna da se proda kupcu ili treba da bude poslata na otpad ili doradu zbog lošeg kvaliteta. U ovom slučaju, serija je populacija.

Iako se populacija od interesa često sastoji od fizičkih predmeta, ponekad je potrebno uzorkovati tokom vremena, prostora ili neke kombinacije ovih dimenzija. Na primer, istraga osoblja osoblja supermarketa mogla bi da ispita dužinu linije za naplatu u različito vreme, ili bi studija o ugroženim pingvinima mogla da ima za cilj razumevanje njihovog korišćenja različitih lovišta tokom vremena. Što se tiče vremenske dimenzije, fokus može biti na periodima ili diskretnim tačkama.

U drugim slučajevima, ispitana „populacija” može biti još manje opipljiva. Na primer, Džozef Džager je proučavao ponašanje točkova ruleta u kasinu u Monte Karlu i to je koristio za identifikaciju pristrasnog točka. U ovom slučaju, „populacija” koju je Džeger želeo da istraži bilo je celokupno ponašanje točka (tj. raspodela verovatnoće[6][7][8] njegovih rezultata tokom beskonačno mnogo ispitivanja), dok je njegov „uzorak” formiran iz zapaženih rezultata sa tog točka. Slična razmatranja se javljaju prilikom ponovljenih merenja nekih fizičkih karakteristika, poput električne provodljivosti bakra.

Ova situacija se često javlja kada se traži znanje o uzročnom sistemu čiji je ishod posmatrana populacija. U takvim slučajevima, teorija uzorkovanja može posmatranu populaciju tretirati kao uzorak iz veće „superpopulacije”. Na primer, istraživač bi mogao da proučava stopu uspešnosti novog programa za „prestanak pušenja” na test grupi od 100 pacijenata, kako bi predvideo efekte programa ako bi bio dostupan širom zemlje. Ovde je superpopulacija „svi u zemlji, koji imaju pristup ovom tretmanu” - grupa koja još uvek ne postoji, jer program još uvek nije dostupan svima.

Populacija iz koje se uzima uzorak možda nije ista kao populacija o kojoj se žele informacije. Često postoji veliko, ali ne potpuno preklapanje između ove dve grupe zbog problema sa okvirom itd. (pogledaj ispod). Ponekad mogu biti potpuno odvojeni - na primer, neko može proučavati pacove kako bi bolje razumeo ljudsko zdravlje, ili može proučavati zapise ljudi rođenih 2008. godine kako bi izveo predviđanja o ljudima rođenim 2009. godine.

Vreme provedeno u preciziranju uzorkovane populacije i populacije od interesa obično je dobro utrošeno, jer pokreće mnoga gledišta, nejasnoće i pitanja koja bi inače bila previđeni u ovom stupnju.

Okvir uzorkovanja[uredi | uredi izvor]

U najjednostavnijem slučaju, kao što je uzorkovanje serije materijala iz proizvodnje (uzimanje uzoraka po partijama), bilo bi najpoželjnije identifikovati i izmeriti svaku pojedinu stavku u populaciji i uključiti bilo koju od njih u naš uzorak. Međutim, u opštijem slučaju to obično nije moguće ili praktično. Ne postoji način da se identifikuju svi pacovi u skupu svih pacova. Tamo gde glasanje nije obavezno, ne postoji način da se utvrdi koji će ljudi glasati na predstojećim izborima (pre izbora). Ove neprecizne populacije nisu podložne uzorkovanju ni na jedan od dole navedenih načina, a na koje bismo mogli primeniti statističku teoriju.

Kao alternativa, traži se okvir uzorkovanja koji ima svojstvo da može identifikovati svaki pojedinačni element i uključiti bilo koji u uzorak.[9][10][11][12] Najjednostavniji tip okvira je lista elemenata populacije (po mogućnosti celokupne populacije) sa odgovarajućim kontaktnim podacima. Na primer, u anketi, mogući okviri za uzorkovanje uključuju birački spisak i telefonski imenik.

Uzorak verovatnoće je uzorak u kome svaka jedinica u populaciji ima šansu (veću od nule) da bude izabrana u uzorku i ova verovatnoća se može tačno odrediti. Kombinacija ovih osobina omogućava izradu nepristrasnih procena populacionog totala, ponderisanjem uzorkovanih jedinica prema njihovoj verovatnoći izbora.

Primer: Mi želimo da procenimo ukupan prihod odraslih koji žive u datoj ulici. Mi posetimo svako domaćinstvo u toj ulici, identifikujemo sve odrasle osobe koje tamo žive i nasumično odaberemo po jednu odraslu osobu iz svakog domaćinstva. (Na primer, svakoj osobi možemo dodeliti randomni broj, generisan iz uniformne raspodele između 0 i 1, i odabrati osobu sa najvećim brojem u svakom domaćinstvu). Mi zatim intervjuišemo izabranu osobu i pronalazimo njen prihod.

Sigurno će biti izabrani ljudi koji žive samostalno, te jednostavno dodajemo njihov prihod našoj proceni ukupnog iznosa. Međutim osoba koja živi u domaćinstvu dvoje odraslih ima samo jednu u dve šanse za izbor. Da bismo to odrazili, kada dođemo u takvo domaćinstvo, dohodak odabrane osobe računaćemo dva puta u ukupnom iznosu. (Osoba koja je izabrana iz tog domaćinstva može se smatrati da takođe predstavlja osobu koja nije izabrana.)

U gornjem primeru, nemaju svi istu verovatnoću izbora; ono što ga čini uzorkom verovatnoće je činjenica da je verovatnoća svake osobe poznata. Kada svaki element u populaciji ima istu verovatnoću selekcije, to je poznato kao dizajn „jednake verovatnoće selekcije”. Takvi se dizajni nazivaju i „samoponderisanim”, jer se svim uzorkovanim jedinicama daje ista težina.

Uzorkovanje verovatnoće obuhvata: jednostavno slučajno uzorkovanje, sistematsko uzorkovanje, slojevito uzorkovanje, veličinu uzorkovanja proporcionalnu verovatnoći, i klastersko ili višestepeno uzorkovanje. Ovi različiti načini uzorkovanja imaju dve zajedničke karakteristike:

  1. Svaki element ima poznatu različitu od nule verovatnoću uzorkovanja i
  2. uključuje slučajni odabir u nekom trenutku

Reference[uredi | uredi izvor]

  1. ^ „Glossary of statistical terms: Population”. Statistics.com. Arhivirano iz originala 03. 03. 2016. g. Pristupljeno 22. 2. 2016. 
  2. ^ Yates, Daniel S.; Moore, David S; Starnes, Daren S. (2003). The Practice of Statistics (2nd izd.). New York: Freeman. ISBN 978-0-7167-4773-4. Arhivirano iz originala 9. 2. 2005. g. 
  3. ^ Mosteller, F.; Tukey, J. W. (1987) [1968]. „Data Analysis, including Statistics”. The Collected Works of John W. Tukey: Philosophy and Principles of Data Analysis 1965–1986. 4. CRC Press. str. 601–720 [p. 633]. ISBN 0-534-05101-4 — preko Google Books. 
  4. ^ Lance, P.; Hattori, A. (2016). Sampling and Evaluation. Web: MEASURE Evaluation. str. 6—8, 62—64. 
  5. ^ Salant, Priscilla, I. Dillman, and A. Don. How to conduct your own survey. No. 300.723 S3. 1994.
  6. ^ Evans, Michael; Rosenthal, Jeffrey S. (2010). Probability and statistics: the science of uncertainty (2nd izd.). New York: W.H. Freeman and Co. str. 38. ISBN 978-1-4292-2462-8. OCLC 473463742. 
  7. ^ Everitt, Brian (2006). The Cambridge dictionary of statistics (3rd izd.). Cambridge, UK: Cambridge University Press. ISBN 978-0-511-24688-3. OCLC 161828328. 
  8. ^ Ash, Robert B. (2008). Basic probability theory (Dover izd.). Mineola, N.Y.: Dover Publications. str. 66—69. ISBN 978-0-486-46628-6. OCLC 190785258. 
  9. ^ Robert M. Groves; et al. (2009). Survey methodology. ISBN 978-0470465462. 
  10. ^ Lohr, Sharon L. (1999). Sampling: Design and analysis. 
  11. ^ Särndal, Carl-Erik; Swensson, Bengt; Wretman, Jan. Model Assisted Survey Sampling. 
  12. ^ Scheaffer, Richard L.; William Mendenhal; R. Lyman Ott. (2006). Elementary survey samplingNeophodna slobodna registracija. 

Literatura[uredi | uredi izvor]

Standardi[uredi | uredi izvor]

ISO[uredi | uredi izvor]

  • ISO 2859 series
  • ISO 3951 series

ASTM[uredi | uredi izvor]

  • ASTM E105 Standard Practice for Probability Sampling Of Materials
  • ASTM E122 Standard Practice for Calculating Sample Size to Estimate, With a Specified Tolerable Error, the Average for Characteristic of a Lot or Process
  • ASTM E141 Standard Practice for Acceptance of Evidence Based on the Results of Probability Sampling
  • ASTM E1402 Standard Terminology Relating to Sampling
  • ASTM E1994 Standard Practice for Use of Process Oriented AOQL and LTPD Sampling Plans
  • ASTM E2234 Standard Practice for Sampling a Stream of Product by Attributes Indexed by AQL

ANSI, ASQ[uredi | uredi izvor]

  • ANSI/ASQ Z1.4

U.S. federalni i vojni standardi[uredi | uredi izvor]

Spoljašnje veze[uredi | uredi izvor]