Sannsynlighetsfordeling

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

Sannsynlighetsfordeling anvendes innen sannsynlighetsteori og statistikk for å beskrive hvordan stokastiske variable, for eksempel tilfeldige utvalg, fordeler seg. De enkelte utfall av en tilfeldig variabel kan ikke forutsies, men sannsynlighetsfordelingen vil beskrive sannsynligheten for at hvert mulige utfall vil inntre, og hvordan verdiene i et større utvalg normalt vil fordele seg.

Disse forholdene er forskjellige avhengig av den underliggende fysiske prosess eller logiske mekanisme; Utfallet av et terningkast, en lotteritrekning, radioaktiv nedbrytning, en intelligenstest eller ventetider i fergekø vil derfor ha forskjellige sannsynlighetsfordelinger.

Formell definisjon[rediger | rediger kilde]

En sannsynlighetsfordeling tildeler en sannsynlighet til hvert intervall [a, b] av mulige reelle tall \mathbb{R} slik at forutsetningene for den aktuelle fordelingen er ivaretatt.

Alle stokastiske variabler har en sannsynlighetsfordeling som inneholder den essensielle informasjonen om denne variabelen. Hvis X er en stokastisk variabel, vil sannsynlighetfordelingen tildele en sannsynlighet P[aXb] til intervallet [a, b] som er sannsynligheten for at X har en verdi i dette intervallet. Sannsynlighetsfordelingen til X kan entydig beskrives av dens (kumulative) fordelingsfunksjon F(x) som er definert som:

 F(x) = P\left[ X \le x \right]
for alle x i \mathbb{R}.

Verdiene vil være i området 0 (ingen sannsynlighet) til 1. Dens deriverte  f(x) kalles sannsynlighetstettheten til X. Kontinuerlige sannsynlighetsfordelinger er fordelinger der sumfunksjonen også er kontinuerlig; Dette betyr også at P[ X = x ] = 0 for alle verdier x i \mathbb{R}; Fra en grenseverdibetraktning: når antallet mulige verdier for X går mot uendelig må sannsynligheten for enkeltutfall X gå mot null. Sannsynligheten for at X er i intervallet [a,b] er:

 P(a \le x \le b) = \int_a^b f(x)\,dx

En fordeling kalles diskret hvis sumfunksjonen består av en rekke endelige sprang, som betyr at variabelen X er en diskret stokastisk variabel; X kan bare anta verdier fra et endelig, høyst numererbart sett. Diskrete fordelinger beskrives ved summen av sannsynlighetene for enkeltutfall:

 F(x) = P (X \le x ) = \sum_{x_i \le x} p(x_i)
for i = 1, 2, ....
  • Støtten for en fordeling er det minste lukkede settet som har sannsynlighet 1. En fordeling har endelig støtte der sannsynlighet 1 oppnås med et endelig, høyst numererbart sett for X.
  • Sannsynlighetsfordelingen for summen av to uavhengige stokastiske variable er konvolusjonen av deres fordelinger.
  • Sannsynlighetsfordelingen for differansen mellom to uavhengige stokastiske variable er krysskorrelasjonen av deres fordelinger.

Liste over viktige sannsynlighetsfordelinger[rediger | rediger kilde]

Diskrete fordelinger[rediger | rediger kilde]

Endelig støtte[rediger | rediger kilde]

  • Bernoullis fordeling, som har verdi 1 med sannsynlighet p og verdi 0 med sannsynlighet q = 1 − p.
  • Rademachers fordeling, som har verdi 1 med sannsynlighet 1/2 og verdi −1 sannsynlighet 1/2.
  • Binomisk fordeling som gir antall treff i en rekke uavhengige Ja/Nei-tester.
  • Uniform fordeling der alle elementene i et endelig sett har samme sannsynlighet. Tilnærmet riktig for mynt og terningkast o.l.
  • Hypergeometrisk fordeling, beskriver sannsynligheten for treff i de første m tester på en serie n desom vi vet at totalt antall treff i m er n. Brukes for eksemple for å vurdere test av produkter ved utvalg fra varepartier.

Uendelig Støtte[rediger | rediger kilde]

  • Boltzmann fordeling, som brukes innen fysikk for å beskrive diskrete energinivåer i systemer i termisk likevekt.
  • Geometrisk fordeling er en diskret stokastisk sannsynlighetsfordeling hvor den stokastiske variable beskriver antall forsøk til første gang et gitt treff skjer.
  • Poissonfordeling beskriver antaller treff i en fast tidsperiode dersom treffene skjer med en kjent gjennomsnittsverdi og er uavhengig av tiden siden siste hendelse. Kan brukes for eksempel for radioaktiv nedbrytning, fødselssstatistikk og køberegninger.
  • Logaritmisk fordeling

Kontinuerlige fordelinger[rediger | rediger kilde]

Støtte på et ikke-uendelig intervall[rediger | rediger kilde]

Støtte på halvt uendelig intervall, vanligvis [0,∞)[rediger | rediger kilde]

  • Kjikvadratfordeling, som er summen av kvadrater av n uavhengige Gaussiske stokastiske variable. Er en spestemt variant av gammafordelingen som brukes til å måle godhet i tilpasning for eksempel ved minste kvadraters metode
  • Eksponentialfordeling beskriver tid mellom uavhengige på hverandre følgende stokstiske hendelser, for eksempel driftsavbrudd.
  • Gammafordelingen, beskrive tid til n uavhengige på hverandre følgende stokastiske hendelser har intruffet.
  • log-normal fordeling beskriver variable som er satt sammen av produktet av mange uavhengige positive variabler.
  • Weibull fordeling, der eksponentialfordeling er et spesialtilfelle brukes for levetidsforventningsberegninger for utstyr (en: MTBF Mean time Between Failure).

Støtte for alle intervall[rediger | rediger kilde]

  • Cauchy fordeling, er en funksjon som ikke har en forventingsverdi eller varians; forbindes med systemer som energifordeling ved resonans.
  • Laplace fordeling Som er spissere ved forventningsverdien og har bredere skuldre enn normalfordelingen.
  • Normalfordeling kalles også Gaussfordeling. Gjelder for en rekke naturlige variasjoner som fordeler seg rundt en middelverdi i en populasjon, for eksempel høyde, intelligens, naturlig variasjon i toleranse osv. – modellert som en sum av mange uavhengig variable og gir en velkjent klokkeformet kurve (eng. bell curve).

Se også[rediger | rediger kilde]