Data (opprinnelig betydning)
Data er betegnelsen på det som kan kalles grunnlaget for informasjon.
Innhold |
[rediger] Definisjon
Mens data kan bety datamaskin, faget data osv, er det en opprinnelig betydning som ligger til grunn for disse etymologiske nyvinningene. Data, i den "opprinnelige" betydningen, er likevel et begrep somgradvis har endret mening etterhvert som man har fått behov for et mer nyansert skille mellom informasjon og data. Data kan sies å være er «informasjonsbiter» som brukes som grunnlag for å danne informasjon. I sin abstrakte (filosofiske) betydning kan det defineres som:
- Meningsnøytrale forekomster av tekst, tall eller lignende bærere av verdier som kan inngå i eller bidra til å forme informasjon.
Denne definisjonen tar inn over seg vesensforskjellen mellom informasjon og data. Nemlig det faktum at data er meningsnøytrale mens informasjon må ha mening.
[rediger] Etymologi
Data er flertallsformen for det latinske ordet Datum (som i sin tur kan sees på som synonymt med ordet dataelement). Det betyr opprinnelig "noe som blir gitt"
Det at det er den plurale formen, som er predominant, understreker det faktum at man for å produsere (meningsfull) informasjon trenger flere dataelementer (datum). Se mer her: www.etymonline.com
[rediger] Rollen til data i dannelse av informasjon
Den virkelige betydningen av data kan ikke forstås uten at den sees sammen med rollen i det å danne informasjon. I motsetning til informasjon, som gir mening, er data i seg selv meningsnøytralt. Følgende data er helt nøytrale:
98, 90, 88, 74, 64, 67, 38, 40
For å gi dataene mening trenger vi å vite hva det er data for, eller «metadataene» for dataene. Det kan være alder, kvantum eller f.eks. årstall på 1900 tallet.
Hvis en liste med årstall skal gi mening må vi ha flere data som sier noe om hva årstallene representerer. Det kan, for eksempel, være fødselsårene til noen kjente personer.
For å danne informasjon, har vi her benyttet data av flere typer: Kvantitative, kvalitative (metadata) og relasjonelle data.
[rediger] Forskjellige måter å bruke data på
[rediger] I naturlig språk
Den mest naturlige måten å bruke data på er som opplysninger i en setning i naturlig språk:
«I 98 tjente Per Hansen 459000 kr på jobben som Tømrer i AS BYGG»
I denne setningen ligger det mange implisitte data som en person oppfatter som informasjon fordi de er satt sammen. Alene ville ordet «tømrer» eller tallet «459000» ikke gi noen informasjon, men satt sammen med en viss struktur, grammatikk og semantisk/pragmatisk oppbygning, bidrar de enkelte dataelementene til å danne informasjon. Ofte vil data ha de semantiske rollene som kvantifikatorer (mengdeangivere), objekt og subjekt i setningen.
[rediger] I IT systemer
I et IT-system ville den samme informasjonen (basert på de samme dataene) kunne hentes ut i tabularisk form:
| Beskrivelse | Data |
|---|---|
| Årstall | 1998 |
| Person | Per Hansen |
| Inntekt | 459000 |
| Valuta | NOK |
| Yrke | Tømrer |
| Selskap | AS BYGG |
| Selskapsform | Aksjeselskap |
| Tilknytning | Ansettelsesforhold |
Her vil beskrivelsen være metadata for dataene. IT har fremmet bruken av formelle språk (konstruerte språk) og andre formaliserte konstruksjoner for å forme data til informasjon.
En relasjonsdatabase bruker første ordens logikk til å kombinere relasjonelle data (relasjoner), metadata og kvantitative data. Dette slik at man dynamisk kan kombinere de samme dataene på ulike måter for å danne forskjellig informasjon.
Jo mer formalisme som brukes i systemer for å behandle data, jo større er behovet for struktur og presis beskrivelse av egenskaper ved data og relasjonene mellom dem. Eksempler på dette er relasjonsmodellen, normalisering, datastandardisering. Sistnevnte faller inn under fagfeltet datakvalitet som hovedsakelig befatter seg med det innholdsmessige.