P-verdi

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

I statistisk hypotesetesting er p-verdien sannsynligheten (eng: probability) for å oppnå et resultat minst like ekstremt som det observerte hvis nullhypotesen (H0) er sann. p-verdien er et tall mellom 0 og 1. Jo lavere verdien er, jo mindre forenlig er observasjonene våre med nullhypotesen (H0), og små p-verdier fører til forkasting av denne.

[rediger] Generelt

Noen vanlige null-hypoteser er

«Det er ingen forskjell på gruppene vi studerer» («Null forskjell»)

«Det er ingen endring over tid» («Null endring»)

«Det er ingen effekt av xxx på yyy» («Null effekt»)

Når vi sammenligner grupper, vil de nesten alltid være litt forskjellige. På samme måte vil vi nesten alltid få andre målinger og se andre ting når vi gjør observasjoner på ulike tidspunkter. Og vi vil nesten alltid se en (liten) effekt, enten positiv eller negativ, når vi setter i gang med et tiltak.

p-verdien hjelper oss å skille mellom observasjoner (gruppeforskjeller, endringer, effekter etc.) som kunne oppstått ved en tilfeldighet under nullhypotesen, og observasjoner (gruppeforskjeller, endringer, effekter etc.) som det er lite sannsynlig å observere hvis null-hypotesen er sann. Sistnevnte kalles statistisk signifikante, og fører til forkasting av null-hypotesen. For å begrense sannsynligheten for feilaktig forkasting av null-hypotesen («Type 1-feil»), velges det alltid en grense for hvor stor denne sannsynligheten kan være. Det gjøres på forhånd; før analysen. Denne grensen kalles signifikansnivå. Et konvensjonelt valg av signifikansnivå er 0,05, eller 5%. Dersom det er anses som svært viktig å begrense sannsynligheten for type 1-feil, velges et lavere signifikansnivå.

I en hypotesetest med signifikansnivå 5% forkastes null-hypotesen dersom p-verdien for det observerte er mindre eller lik 0,05.


[rediger] Eksempel (Oppdiktede tall):

Nullhypotese: «Det er ingen forskjell på nikotintyggegummi og informasjonsbrosjyrer når det gjelder å få folk røykfrie.»

Nikotintyggegummi gis til 40 tilfeldig valgte røykere, og informasjonsbrosjyrer til 41 andre tilfeldig valgte røykere. Etter en måned er 26 blitt røykfrie i tyggegummigruppa, og 21 i informasjonsbrosjyregruppa. Dette er forskjellig. Men er det stor nok forskjell til at vi kan si at det virkelig er en forskjell, eller må vi beholde null-hypotesen som sier at begge deler er like effektivt?

p-verdien for denne forskjellen, altså sannsynligheten for at vi finner så store gruppeforskjeller hvis nikotintyggegummi og informasjonsbrosjyrer er like effektivt, er 0,26 (26%). Med et signifikansnivå på 0,05 beholdes nullhypotesen fordi p-verdien sier at den observerte forskjellen er vanlig for grupper som er like. Disse observasjonene alene er ikke nok til å si at nikotintyggegummi eller informasjonsbrosjyrer er det foretrukne virkemiddelet.

Hvis resultatet av undersøkelsen derimot hadde vært at 26 ble røykfrie i tyggegummigruppa, men bare 15 i informasjonsbrosjyregruppa, ville p-verdien blitt 0,02. Denne verdien forteller at sannsynligheten bare er 2% for at så store forskjeller kunne oppstå ved tilfeldigheter. En så lav p-verdi sier at det vi har observert er uvanlig for grupper som er like, og at det tyder på at null-hypotesen skal forkastes. Konklusjonen ville da blitt at nikotintyggegummi er signifikant mer virkningsfullt enn informasjonsbrosjyrer.


[rediger] Annet

p-tallet kan lages på mange måter. Kaster man mynt eller krone, er p for enten mynt eller krone lik 1 for et enkelt kast, men 0,5 for et bestemt utfall. For terningkast er sannsynligheten for å få opp en side med tall/prikker = 1/6. Sannsynligheten for at 600 terningkast gir 100 med hvert tall er noe mindre (P-verdi <1).

Setter man sammen observerte frekvenser av spesifikke egenskaper sammenlignet med totalpopulasjonens, kan man lage multiplikative probabiliteter. (Eksempel: Hvis jeg ser på biler som passerer på veien, hvilken sannsynlighet er det for at neste bil er en Ford, rød, med kvinnelig fører som er rødhåret og har med seg et barn i baksetet. P-tallene her skal multipliseres, og siden alle er mindre enn 1, blir sannsynligheten mindre for hver egenskap man legger til.)

Forsikring bygger på aktuarmatematikk, der innbetalte premier skal kunne dekke de sannsynlige inntreffende omstendigheter (p-verdi nær 1), inklusive rimelige avvik. Dersom avvikene blir større enn forventet, blir premiesummene satt opp.

matematikkstubbDenne matematikkrelaterte artikkelen er dessverre kort eller mangelfull, og du kan hjelpe Wikipedia ved å utvide den. (Se stilmanual)