OpenRefine

Fra Wikipedia, den frie encyklopedi
Hopp til navigering Hopp til søk

OpenRefine, tidligere kalt Google Refine og Freebase Gridworks, er et frittstående skrivebordsverktøy basert på åpen kildekode for å vaske og transformere data til andre format, det som på engelsk kalles «data wrangling».[1] Verktøyet er ligner på et regneark, og det kan da også behandle filer fra flere typer rgeark, men strukturen minner mer om en database.

Programmet opererer på rader (rows) av data som har celler med verdier organisert i kolonner (columns), som er mer likt en relasjonsdatabase enn et regneark. Et prosjekt i OpenRefine er definert som en tabell. Brukeren kan filtrere rader ved å bruke fasetter (facets) som definerer filterkriterier. Et eksempel på en slik fasett er å vise rader hvor en gitt kolonne inneholder verdier. Ulikt regneark blir de fleste operasjoner i OpenRefine gjort mot alle synlige rader under en kolonne,[2] opprettelse av en ny kolonne basert på eksisterende data fra en annen kolonne, og så videre. Alle aksjoner som blir gjort på et datasett blir lagret i et prosjekt og kan senere bli avspilt på andre tilsvarende datasett.

Referanser[rediger | rediger kilde]

Litteratur[rediger | rediger kilde]

Eksterne lenker[rediger | rediger kilde]