Kovarians

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

Kovarians er et mål på den lineære avhengigheten mellom to varierende størrelser.

Teoretisk kovarians[rediger | rediger kilde]

Teoretisk kovarians er et mål på den underliggende lineære avhengigheten mellom to stokastiske variabler. Kovariansen mellom X og Y noteres ofte som \sigma_{XY}. For to stokastiske variabler X og Y er kovariansen definert som

\operatorname{Cov}[X, Y] = E[(X - E[X])(Y - E[Y])]

der E[\cdot] er forventning.

Empirisk kovarians[rediger | rediger kilde]

Empirisk kovarians er et estimat av teoretisk kovarians. En estimator for den empiriske kovariansen er

\widehat{\operatorname{Cov}}[X, Y] = \frac{1}{n}\sum_{i=1}^n(x_i-\bar x_n)(y_i-\bar y_n)

der \bar x_n er gjennomsnittet av x_1,x_2,\dots,x_n og \bar y_n er gjennomsnittet av y_1,y_2,\dots,y_n.

Egenskaper[rediger | rediger kilde]

Kovariansen er avhengig av måleskalaen, slik at om skalaen endres vil kovariansen endres. Derfor er korrelasjon, som ikke er avhengig av skala, et godt alternativ til å måle lineær avhengighet.

For vilkårlige konstanter a og b og stokastiske variabler X og Y gjelder

  1. \operatorname{Cov}[X, Y] = E[XY] - E[X]E[Y]
  2. \operatorname{Cov}[aX + b, cY + d] = ac\,\operatorname{Cov}[X, Y]