Statistisk feil

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

En statistisk feil innebærer at man trekker en feilaktig statistisk konklusjon fra datamaterialet man har hatt til rådighet. I og med at statistikk handler om å estimere (beregne) ukjente størrelser ut ifra en stikkprøve som er mindre enn den totale populasjonen som man ønsker å vite noe om, er alle slike beregninger beheftet med en viss sannsynlighet for feil. De mest grunnleggende statistiske feilene kalles type-I- og -II-feil:

  • En type-I-feil er en statistisk feil som består i en feilaktig avvisning av nullhypotesen. Hvis man konkluderer at nullhypotesen er falsk, selv om den egentlig er sann, har man altså gjort en type-I-feil.
  • En type-II-feil er en statistisk feil som består i en feilaktig godtakelse av nullhypotesen. Hvis man konkluderer at nullhypotesen er sann, selv om den egentlig er falsk, har man altså gjort en type-II-feil.

Vanligvis er man ikke interessert i nullhypotesen, men i en alternativ forklaring, En type-I-feil innebærer dermed at man aksepterer en alternativ forklaring som ikke stemmer («godtroenhet»). En type-II-feil betyr på den andre siden at man forkaster en alternativ forklaring, selv om den egentlig stemmer («overforsiktighet»).

Vitenskapsteoretisk sett er det viktigst å unngå type-I-feil. Derfor «foretrekker» man vanligvis type-II-feil over type-I-feil, og ved å minske sjansen for type-I-feil øker man samtidig sannsynligheten for type-II-feil. Grunnen til dette er at «bevisbyrden» vanligvis ligger ved den alternative forklaringen, ikke ved nullhypotesen. En måte å kontrollere type-I-feil på, er ved hjelp av signifikansnivå. Jo lavere signifikansnivå man velger, desto mindre er sannsynligheten for type-I-feil, men desto mindre er også sannsynligheten for å oppdage at en alternativ forklaring er sann når den faktisk er det. Dette problemet kan statistisk sett ikke unngås, slik at valg av signifikansnivå alltid er en avveining mellom disse to målsettingene. Et mye brukt signifikansnivå er 5 %. Bruker man dette signifikansnivået, må man altså regne med å gjøre én type-I-feil per 20 statistiske tester.

Det fins likevel tilfeller der det er påkrevd å minimere faren for type-II-feil. Dette kan være tilfellet hvis den alternative forklaringen krever handling for å unngå et problem eller en farlig situasjon. Når man f.eks. får mistanke om en hittil ukjent alvorlig bivirkning av et nytt medikament, har minimaliseringen av type-II-feil av etiske grunner høyere prioritet enn minimaliseringen av type-I-feil. Nullhypotesen i dette eksempelet ville lyde «Medikamentet har ingen bivirkninger.» Å forkaste denne hypotesen når den er sann (dvs. å akseptere at medikamentet har bivirkninger, når det ikke har det – en type-I-feil), er uheldig sett fra et vitenskapsteoretisk perspektiv. Men å akseptere den når den er falsk (dvs. å anta at medikamentet ikke har bivirkninger, når slike fins – en type-II-feil), kan resultere i menneskelige lidelser. Derfor kan forskningsetikken i slike tilfeller tilsi at vitenskapsteoretiske overveininger settes til side, og at en liten mistanke om fare veier mer enn «god vitenskapelig praksis» (føre-var-prinsipp).

Tabellen under oppsummerer feilmulighetene:

Nullhypotesen (resp. den alternative forklaringen) ...
... er sann (falsk) ... ... er falsk (sann) ...
... og aksepteres
(forkastes)
ok
korrekt godtakelse
type-II-feil
feilaktig godtakelse
... og forkastes
(aksepteres)
type-I-feil
feilaktig avvisning
ok
korrekt avvisning