Hypergeometrisk fordeling

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

Hypergeometrisk fordeling er en diskret sannsynlighetsfordeling. Den beskriver sannsynligheten for antall "suksesser" i en sekvens av n trekninger fra en endelig populasjon uten tilbakelegging, akkurat som binomisk fordeling er antall suksesser med tilbakelegging. Anta at vi totalt har N lodd i en skål, hvor m av disse er gule (suksesser) og N-m er grønne (fiaskoer). Vi trekker så n lodd tilfeldig uten tilbakelegging, og lar k være antall av disse som er gule.

Vi kan sette opp følgende tabell:

Antall trukket Antall ikke trukket Totalt
Suksess k m-k m
Fiasko n - k N + k - n - m N - m
Totalt n N - n N

Sannsynligheten til en hypergeometrisk fordelt tilfeldig variabel X med parametre, N, m og n er gitt ved følgende formel:

P(X=k) = \frac{\binom{m}{k} \binom{N -m}{n - k}}{\binom{N}{n}}, k = 0, 1, ..., m.

Eksempel[rediger | rediger kilde]

Eksempel 1[rediger | rediger kilde]

La oss se på et klassisk eksempel. Anta at vi har en krukke med ti svarte og åtte hvite kuler.
La oss så trekke ut 5 tilfeldige kuler fra denne krukken uten å legge dem tilbake. Hva er da sannsynligheten for at vi trekker ut akkurat 3 hvite kuler?
Vi får følgende tabell:

Antall trukket Antall ikke trukket Totalt
Hvite 3 5 8
Svarte 2 8 10
Totalt 5 13 18

Vi har da sannsynligheten:

P(X=3) = \frac{\binom{8}{3} \binom{10}{2}}{\binom{18}{5}} = 0.29412

Vi har at sannsynligheten for alle mulige verdier for k, alltid vil være lik 1. I dette eksempelet har vi seks mulige utfall.
Vi kan trekke ingen, en, to, tre, fire eller fem hvite kuler. Summen av sannsynligheten for hvert utfallene er 1.
Utnytter vi denne egenskapen kan vi beregne følgende:

P(X>=1) = 1 - \frac{\binom{8}{0} \binom{10}{5}}{\binom{18}{5}} = 1 - 0.02941 = 0.97059

eller,

P(X < 5) = 1 - \frac{\binom{8}{5} \binom{10}{0}}{\binom{18}{5}} = 1 - 0.00654 = 0.99346

osv...

Eksempel 2[rediger | rediger kilde]

En skoleklasse på 20 elever, 10 jenter og 10 gutter, skal deles inn i to lag i gymtimen. Læreren trekker 10 tilfeldige elever som skal være på lag 1. Hva er sannsynligheten for at lag 1 består av kun gutter?
Vi setter da gutter som "suksesser" og får følgende tabell:

Antall trukket Antall ikke trukket Totalt
Gutter 10 0 10
Jenter 0 10 10
Totalt 10 10 20

Vi kan nå sette inn i formelen og får:
P(X=10) = \frac{\binom{10}{10} \binom{10}{0}}{\binom{20}{10}} = 5.4125 *10^{-6}

Hva er sannsynligheten for at det er like mange jenter og gutter på hvert lag?
Vi bruker fortsatt gutter som "suksesser".

Antall trukket Antall ikke trukket Totalt
Gutter 5 5 10
Jenter 5 5 10
Totalt 10 10 20

P(X=5) = \frac{\binom{10}{5} \binom{10}{5}}{\binom{20}{10}} = 0.3437


Utvidelse til flere variabler[rediger | rediger kilde]

Hypergeometrisk fordeling gjelder ikke bare for basistilfellet beskrevet over. Det kan lett utvides til å ha flere variabler. La oss igjen se på eksempelet med krukken, men la oss nå i tillegg ha gule kuler. Anta at det nå er 8 hvite, 10 svarte og 12 gule kuler i krukken,
og vi skal trekke ut 5 kuler. Hva er sannsynligheten for at vi trekker 2 hvite, 3 svarte og ingen gule?
Vi får da:

P(2 hvite, 3 svarte, 0 gule) = \frac{\binom{8}{2} \binom{10}{3}\binom{12}{0}}{\binom{30}{5}} = 0.023578