Standardavvik

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

Standardavviket er et mål for spredningen av verdiene i et datasett eller av verdien av en stokastisk variabel. Den er definert som kvadratroten av variansen.

En av grunnene til at standardavviket er en viktig parameter, er Tsjebysjevs ulikhet som sier at de fleste verdiene i et datasett vil ligge i nærheten av gjennomsnittet, hvor «i nærheten» er definert ved hjelp av standardavviket.

Standardavviket ble introdusert av Francis Galton mot slutten av 1860-tallet.

Mørkeblå farge viser verdier som er under ett standardavvik fra gjennomsnittsverdien. I en normalfordeling vil 68,27 % av datasettet være under ett standardavvik fra gjennomsnittet. 95,45% er under to standardavvik fra gjennomsnittet (himmelblå farge), 99.73% under tre standardavvik og 99.994% under fire.

Definisjon[rediger | rediger kilde]

Hvis vi er gitt en populasjon x1, ..., xN av reelle tall så er gjennomsnittet gitt ved

\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i,

og standardavviket definert som

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}.

Standardavviket til en stokastisk variabel X er definert som

\sigma = \sqrt{\operatorname{E}((X-\operatorname{E}(X))^2)} = \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2},

hvor E(X) er forventningsverdien til X.

Hvis man har gitt stikkprøver x1,...,xn fra en større populasjon, defineres det empiriske standardavviket som


s = \sqrt{\frac{\sum_{i=1}^{n} (x_i-\bar x)^2}{n-1}}
.

Relativt standardavvik[rediger | rediger kilde]

Ved å dividere standardavviket med gjennomsnittsverdien får en relativt standardavvik. Dette oppgis som regel i prosent.

Måleenhet[rediger | rediger kilde]

Standardavvik har som regel samme benevning som måleenheten til verdiene i datasettet. Et unntak er for verdier som har prosent som benevning. Siden en differanse mellom to prosentmålinger har enhet prosentpoeng, vil standardavviket til slike datasett ha enhet prosentpoeng. Det gjøres likevel ofte feil med dette, og prosent brukes som benevning også for standardavviket, noe som gjør det uklart om det er snakk om et vanlig standardavvik eller et relativt standardavvik.