Пређи на садржај

p-vrednost

С Википедије, слободне енциклопедије


U statističkom testiranju hipoteze, p-vrednost (engl. probability value) ili vrednost verovatnoće, za dati statistički model verovatnoća je da će, kada je nulta hipoteza tačna, statistički parametar (kao što je apsolutna vrednost prosečne razlike između dve upoređene grupe) biti veći ili jednak stvarno uočenom rezultatima.[1] Upotreba p-vrednosti u testiranju statističkih hipoteza je uobičajena u mnogim oblastima istraživanja[2] kao što su fizika, ekonomija, finansije, političke nauke, psihologija,[3] biologija, krivično pravo, kriminologija i sociologija.[4] Zloupotreba p-vrednosti je kontroverzna tema u metanauci.[5]

Zakošavanje slova, upotreba velikih slova i deljenja reči variraju. Na primer, AMA stil koristi „P vrednost”, APA stil koristi „p vrednost”, a Američko statističko udruženje koristi „p-vrednost”.[6]

Definicija i interpretacija

[уреди | уреди извор]

Verovatnoća pod nultom hipotezom dobijanja statistike testa sa realnom vrednošću koja je najmanje ekstremna kao i dobijena

[уреди | уреди извор]

Uzmimo u obzir posmatranu statistiku testa iz nepoznate distribucije . Tada je p-vrednost ono što bi bila prethodna verovatnoća da se posmatra statistička vrednost testa barem tako „ekstremna” kao ako je nulta hipoteza bila istinita. To je:

  • za jednostranu distribuciju test statistike na desni rep,
  • za jednostranu distribuciju test statistike sa leve strane,
  • za dvostranu distribuciju test-statistike. Ako je raspodela simetrična oko nule, onda je

p-vrednost kao statistika za izvođenje testova značajnosti

[уреди | уреди извор]

U testu značaja, nulta hipoteza se odbacuje ako je p-vrednost manja ili jednaka unapred definisanoj graničnoj vrednosti , koja se naziva alfa nivo ili nivo značajnosti. nije izvedeno iz podataka, već ga postavlja istraživač pre ispitivanja podataka. se obično postavlja na 0,05, mada se ponekad koriste niži nivoi za alfa. U 2018. godini, grupa statističara na čelu sa Danijelom Bendžaminom predložila je usvajanje vrednosti od 0,005 kao standardne vrednosti za statističku značajnost širom sveta.[7]

Kada je nulta hipoteza tačna, ako ima oblik , a osnovna slučajna promenljiva je kontinuirana, onda je raspodela verovatnoće p-vrednosti uniformna na intervalu [0,1]. Nasuprot tome, ako je alternativna hipoteza tačna, distribucija zavisi od veličine uzorka i prave vrednosti parametra koji se proučava.[2][8]

Distribucija p-vrednosti za grupu studija se ponekad naziva p-kriva.[9] p-kriva se može koristiti za procenu pouzdanosti naučne literature, kao što je otkrivanje pristrasnosti publikacije ili p-hakovanje.[9][10]

  1. ^ Wasserstein, Ronald L.; Lazar, Nicole A. (7. 3. 2016). „The ASA's Statement on p-Values: Context, Process, and Purpose”. The American Statistician. 70 (2): 129—133. doi:10.1080/00031305.2016.1154108. 
  2. ^ а б Bhattacharya, Bhaskar; Habtzghi, DeSale (2002). „Median of the p value under the alternative hypothesis”. The American Statistician. 56 (3): 202—6. doi:10.1198/000313002146. 
  3. ^ Wetzels, R.; Matzke, D.; Lee, M. D.; Rouder, J. N.; Iverson, G. J.; Wagenmakers, E. -J. (2011). „Statistical Evidence in Experimental Psychology: An Empirical Comparison Using 855 t Tests”. Perspectives on Psychological Science. 6 (3): 291—298. PMID 26168519. doi:10.1177/1745691611406923. 
  4. ^ Babbie, E. (2007). The practice of social research 11th ed. Thomson Wadsworth: Belmont, California.
  5. ^ Ioannidis, John P. A.; Ware, Jennifer J.; Wagenmakers, Eric-Jan; Simonsohn, Uri; Chambers, Christopher D.; Button, Katherine S.; Bishop, Dorothy V. M.; Nosek, Brian A.; Munafò, Marcus R. (januar 2017). „A manifesto for reproducible science”. Nature Human Behaviour (на језику: енглески). стр. 0021. doi:10.1038/s41562-016-0021. Приступљено 9. 5. 2019. 
  6. ^ ASA House Style
  7. ^ Benjamin, Daniel J.; Berger, James O.; Johannesson, Magnus; et al. (1. 9. 2017). „Redefine statistical significance”. Nature Human Behaviour. 2 (1): 6—10. PMID 30980045. doi:10.1038/s41562-017-0189-z. eISSN 2397-3374. 
  8. ^ Hung HM, O'Neill RT, Bauer P, Köhne K (март 1997). „The behavior of the P-value when the alternative hypothesis is true”. Biometrics (Submitted manuscript). 53 (1): 11—22. JSTOR 2533093. PMID 9147587. doi:10.2307/2533093. 
  9. ^ а б Head ML, Holman L, Lanfear R, Kahn AT, Jennions MD (март 2015). „The extent and consequences of p-hacking in science”. PLOS Biology. 13 (3): e1002106. PMC 4359000Слободан приступ. PMID 25768323. doi:10.1371/journal.pbio.1002106. 
  10. ^ Simonsohn U, Nelson LD, Simmons JP (новембар 2014). „p-Curve and Effect Size: Correcting for Publication Bias Using Only Significant Results”. Perspectives on Psychological Science. 9 (6): 666—681. PMID 26186117. S2CID 39975518. doi:10.1177/1745691614553988. 

Spoljašnje veze

[уреди | уреди извор]