Anscombes kvartett

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk
Alle de fire datasettene fremstår som identiske ved enkel numerisk analyse, men er svært ulike når de blir fremstilt grafisk.

Anscombes kvartett er fire datasett som har like statistiske egenskaper, men som veldig ulike i i grafisk fremstilling. Hvert datasett består av elleve (x,y) punkter. Statistikeren Francis Anscombe lagde de fire datasettene i 1973 for å illustrere både verdien av grafiske fremstillinger og hvordan ekstreme enkeltdata påvirker resten av datasettet.


Alle de fire datasettene har følgende egenskaper:

Egenskap Verdi
Gjennomsnittet x 9.0
Variansen til x 11.0
Gjennomsnittet y 7.5
Variansen til y 4.12
Korrelasjonen mellom x og y 0.816
Regresjonslinjen til hvert sett y=3 + 0.5x