Multikollinearitet

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

Multikollinearitet er graden av lineær sammenheng mellom flere forklaringsvariabler i en multippel regresjonsmodell. Multikollinearitet ble først beskrevet av den norske økonomen Ragnar Frisch i 1934 i en publikasjon fra Universitetet i Oslo, ved navn Statistical confluence analysis by means of complete regression systems. Kollinearitet er den tekniske betegnelsen på tilfeller hvor det eksisterer en lineær sammenheng mellom kun to forklaringsvariabler, men multikollinearitet blir ofte brukt i alle tilfeller med korrelasjon mellom forklaringsvariablene inkludert tilfeller hvor det kun eksisterer mellom to variabler.[1]

Måling av multikollinearitet[rediger | rediger kilde]

Da multikollinearitet er tilstedeværelse av perfekt korrelasjon mellom variablene så er tilstedeværelsen av perfekt multikollinearitet der hvor korrelasjonen er 1 eller -1. Oftest vises dette grafisk i en korrelasjonsmatrise for å vise korrelasjoner over mange variabler. Korrelasjoner viser bare et forhold mellom to og to variabler og tar dermed ikke for seg korrelasjoner mellom en variabel og lineær kombinasjoner av flere andre variabler. Det er blitt utarbeidet en indikator for å påvise graden av multikollinearitet hvor man ikke trenger å tenke på tilstedeværelse av lineære kombinasjoner, denne indikatoren heter VIF.

VIF[rediger | rediger kilde]

VIF er en indikator som angir grad av multikollinearitet. Indikatoren tar utgangspunkt i en multippel regresjonsmodell, estimert etter minste kvadraters metode, som omformes til å vise en forklaringsvariabel som en funksjon av alle andre forklaringsvariabler. Deretter beregnes den nye modellens determinasjonskoeffisient. VIF verdien regnes deretter ut:


VIF_j = \frac{1}{1-R_j^2}

Hvor R_j er determinasjonskoeffisient til forklaringsvariabelen j som vi ønsker å teste.

En alternativ formulering av VIF verdien er TOL, toleransen, som er den inverse til VIF verdien:


TOL_j = \frac{1}{VIF_j} = 1-R_j^2

VIF verdien er et tall fra 1 til uendelig, mens TOL verdien er et tall mellom 0 og 1. Hva som er grensen for når det eksisterer multikollinearitet er ikke gitt og er dermed utsatt for å bli skjønnsbehandlet. En tommelfingerregel sier at en variabel har stor grad av kollinearitet med flere variabler dersom VIF er større enn 10.[2] Av dette kan man utlede at variabelen har en stor grad av kollinearitet med andre variabler dersom {R^2} er større enn 0,9 eller TOL er mindre enn 0,1.

Referanser[rediger | rediger kilde]

  1. ^ Damodar Gujarati og Dawn Porter (2009). Basic Econometrics (engelsk) (5 utg.). McGraw-Hill. s. 321. 
  2. ^ Damodar Gujarati og Dawn Porter (2009). Basic Econometrics (engelsk) (5 utg.). McGraw-Hill. s. 340.