Histogram

Fra Wikipedia, den frie encyklopedi
Histogram med 100 normalfordelte tall.

Et histogram er en grafisk framstilling av frekvensfordelingen i kvantitativ data[1]. Histogrammer kan brukes til å analysere og presentere data. Høyden av en søyle i histogrammet er frekvensen delt på klassebredden. Et histogram skiller seg fra et søylediagram ved at det er arealet, og ikke høyden av søylen som sier noe om mengden.

Frekvensfordelingen deles inn i ulike kvantiler som for eksempel persentiler, desiler og kvartiler. Hvilke intervaller man velger å gruppere dataen i er avgjørende for hvordan dataen vil se ut; Om man velger for store intervaller vil man kanskje få én veldig høy søyle, mens resten av søylene blir veldig små. Om man velger for små intervaller vil man kanskje få et pannekakeformet histogram hvor de fleste søyler har svært få eller ingen observasjonspunkter. Man bør derfor teste med forskjellige intervaller for å se hvilke som best får frem frekvensens form, for eksempel om den er normalfordelt eller skjevfordelt, eller om det finnes ekstremverdier i frekvensen[1].

Referanser[rediger | rediger kilde]

  1. ^ a b Fligner, Moore Notz (2015). The Basic Practice of Statistics. New York: W. H. Freeman and Company. s. 21-29.