Konfidensintervall

Fra Wikipedia, den frie encyklopedi
Hopp til navigering Hopp til søk

Et konfidensintervall er et intervall som angir grensene for hva den virkelige/reelle verdien av en måling eller beregning, sannsynligvis er. Sannsynligheten angis i prosent.[1] Når man for eksempel skriver «10 ±2 (95 % CI)», betyr det at målingen var 10, men at det er knyttet usikkerhet til den. Man er imidlertid 95 % sikker på at den reelle verdien ligger et eller annet sted mellom 8 og 12. Følgelig er det forventet at den reelle verdien ligger utenfor intervallet i 5 % av tilfellene.

I de empiriske vitenskapene er ingen verdier kjente med uendelig presisjon eller absolutt sikkerhet. Derfor er det viktig at man ikke bare angir verdien som er målt (eller beregnet), men også hvor mye tillit man har til målingen. Begrepet konfidensintervall kommer fra det latinske ordet for «tillit» (confidentia). Slikt «tillit» angis som ytterpunktene for et intervall.

Jo sikrere man vil være på at konfidensintervallet inneholder den sanne verdien, desto bredere konfidensintervaller velger man, men desto mindre informativt er intervallet. Vil man være helt sikker og velger et 100 %-konfidensintervall, vil dette vanligvis (for eksempel for normalfordelte verdier) strekke seg fra minus uendelig til pluss uendelig. Velger man smale konfidensintervaller, øker derimot sannsynligheten for at de ikke inneholder den sanne verdien.

Grunnen til at man oftest bruker 95 %-konfidensintervall, er at man i mange statistiske tester opererer med et såkalt signifikansnivå på 5 %. En verdi som ligger utenfor 95 %-konfidensintervallet kan altså sies å avvike signifikant fra forventningen. Ved normalfordelte variabler kan 95 %-konfidensintervallene nokså nøyaktig regnes om fra variablens gjennomsnitt (m), standardavvik (s) og kvadratroten ( √() ) av antall målinger (n) som:

CI = [m − 1,96 · s/√(n); m + 1,96 · s/√(n)]

I 90 %- og 99 %-konfidensintervall bytter vi ut 1,96 med henholdsvis 1,64 og 2,58.

Ved andre fordelinger kan konfidensintervallene være asymmetriske. For eksempel er den øvre grensen lenger fra gjennomsnittet enn den nedre grensen hvis variabelen kommer fra en lognormal fordeling. I så fall angis hele intervallet, f.eks. «12,34 [11,36; 13,40] (95 % CI)».

75 %-konfidensintervaller er identiske med variablenes kvartilavstand.

Måten å komme frem til konfidensintervallene på, er vanligvis ved å avlede dem fra variabelens antatte eller kjente statistiske fordeling. Er denne ukjent, kan man bruke statiske metoder som bootstrap for å estimere konfidensintervallene.

Se også[rediger | rediger kilde]

Referanser[rediger | rediger kilde]

  1. ^ A. H. Studenmund (1997). Using Econometrics: A Practical Guide. Addison-Wesley. s. 142. ISBN 0-673-52486-8.