Klyngeanalyse

Fra Wikipedia, den frie encyklopedi
Klyngeanalyse av data som har resultert i tre klynger på et euklidiskt plan.

Innenfor datavitenskap og statistikk innebærer klyngeanalyse gruppering av data i delmengder kalt klynger. Andre ord for klyngeanalyse er kløsteranalyse eller klusteranalyse (fra engelsk cluster analysis). Klyngeanalyse refererer ikke til en enkelt algoritme, men er et samlenavn for analysemetoden. Klyngeanalyse er en type maskininlæing som er vanlig innenfor statistikk, informationsutvinning, mønstergjenkjenning, bildeanalyse, informasjonssøk og bioinformatikk. Teknikken skiller seg ifra klassifisering ved at klassene ikke er kjent på forhånd ved klyngeanalyse.

Klyngeanalyse gjennomføres ved at man definerer en avstandsfunksjon ut ifra de attributtene som beskriver et element. Deretter beregnes avstandene, hvilket muliggjør visualisering i eksempelvis 2D eller 3D. I så måte vises likheter mellom elementene i en klynge basert på attributtene. Gjennom kombinasjonen av moderne regnekraft og det menneskelige øyets evne til å oppdage avvikende element er klyngeanalyse et kraftig analyseverktøy.