Data

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

Data er det fysiske grunnlaget for å tilføre mennesker informasjon. Data er dermed det fysiske grunnlaget for å overføre informasjon mellom mennesker.

Data kan dessuten registreres, lagres, behandles og flyttes av menneskeskapte innretninger, slik som datasystemer. Noen av disse innretningene vil ha som formål å tilføre mennesker informasjon eller å overføre informasjon mellom mennesker, mens andre datainnretninger ikke vil ha et slikt formål, f eks et datasystem som styrer en industrirobot.

Informasjonsfilosofen Luciano Floridi definerer et datum slik:

  • x er forskjellig fra y, der x og y er to variabler vi ikke tolker og der også relasjonen "er forskjellige fra" og domenet er åpent for tolkning.

Floridi definerer altså et datum grunnleggende som en forskjell (primærdata), men fravær av en (forventet) forskjell kan også være et datum (sekundærdata).

Ordet data brukes i dag oftest som et massesubstantiv som ikke bøyes i tall, slik som «luft», «trøbbel» og «bestikk». I noen sammenhenger, sånn som i definisjonen ovenfor, kan det likevel være nyttig å benytte entallsformen datum.

Av og til beskrives data som «råinformasjon», mens «informasjon» forklares som «velorganiserte» eller «sammensatte» data. I fagområdene som studerer informasjon forsøker man imidlertid å definere de to begrepene mer presist.

Typer av data[rediger | rediger kilde]

Det finnes en rekke måter å kategorisere data på. De er alle nyttige for å avklare databegrepet ytterligere:

Numeriske og ikke-numeriske data[rediger | rediger kilde]

  • Numeriske data består av tall. De kalles også kvantitative data. Vanlige skrifttegn kan kodes som tall ved hjelp av standarder som Unicode eller dets forløpere ISO 8859-1 og ASCII.
  • Ikke-numeriske data angir andre egenskaper enn antall, størrelse eller mengde. De kalles også kvalitative eller kategoriske data.

Diskrete og analoge data[rediger | rediger kilde]

  • Diskrete data vil si data som er representert gjennom forskjellige symboler eller signaler, for eksempel tall og bokstaver. Diskrete data kan for eksempel representere type, antall og rekkefølge. Data i de sentrale delene av moderne dataystemer er for det meste diskrete.
  • Analoge data vil si data som varierer langs en trinnløs (eller kontinuerlig) skala. Analoge data kan for eksempel representere temperatur, høyde, vekt, tid og konsentrasjon av stoff. Analoge data var den vanlige datatypen i telefon, radio og TV før disse teknologiene gradvis ble digitalisert fra 1980-tallet og frem til i dag.

Binærdata og digitale data[rediger | rediger kilde]

  • Binærdata er diskrete og numeriske data som er representert i det binære tallsystem, dvs i form av biter eller av tallene "0" og "1". Data i sentralenheten i moderne dataystemer er nesten alltid binære.
  • Digitale data er i praksis et annet ord for binære data. Når vi snakker om "digitale data" tar vi det vanligvis for gitt at de også er binære, selv om digitale data strengt tatt kan representeres i andre tallsystem enn det binære.

Primære og sekundære data[rediger | rediger kilde]

  • Primære data er tilstedeværelsen av en forskjell, f eks trykksverte på et avisark som former et skrifttegn, elektrisk spenning i en kobberkabel som angir biten "1", den lysende oljevarsellampen i en bil eller en årring i en trestamme. Se også Floridis definisjon lenger oppe på siden.
  • Sekundære data er fraværet av en forskjell (som kanskje var forventet), f eks at samtalen vår ikke blir besvart når vi ringer en venn, at en lampe ikke begynner å lyse når vi slår den på, at skjermen på en mobiltelefon ikke gir respons når vi trykker på en tast eller at hunden i en kriminalroman ikke bjeffer på et bestemt punkt i fortellingen.

Siden Floridis definisjon kun dekker primærdata, kan vi definere sekundærdata slik:

  • x er ikke forskjellig fra y i en situasjon hvor vi forventer at x og y skal være forskjellige, der x og y er to variabler vi ikke tolker og der også relasjonen "er forskjellige fra" og domenet er åpent for tolkning.

Tamme og ville data[rediger | rediger kilde]

  • Tamdata er skapt av mennesker som med hensikt ønsker å overføre informasjon (kommunisere) til seg selv eller til andre mennesker. Vi sier at tamdata er intensjonelle fordi de er laget med en hensikt og at de har semantisk innhold fordi de overfører informasjon mellom mennesker. Eksempler er skrifttegnene som utgjør en avissartikkel og de digitale bitene som utgjør et program, regneark eller database.
  • Villdata er data som ikke skapt av mennesker i den hensikt å overføre informasjon. Eksempler er igjen årringene i et tre eller varsellampen som lyser når en bil snart er tom for olje. (Men når en forsker registrerer antallet årringer i et regneark eller en bileier registrerer varsellampen i bilens logg er registreringene i stedet blitt tamdata.)

Tamdata kan være representasjoner, mens villdata ikke er det. Tamdata kan altså representere villdata, men behøver ikke å gjøre det. Tamdata kan dessuten være språklige uttrykk, som ikke nødvendigvis må representere noe.

Vi kan skille mellom to typer villdata:

  • Naturlige villdata kommer fra naturen, slik som årringene i treet. Her har det ikke vært noen menneskelige intensjoner inne i bildet.
  • Kunstige villdata kommer fra menneskeskapte innretninger (eller mekanismer), slik som varsellampen i bilen. Her er innretningen skapt av mennesker med hensikt, men dataene er i sin tur laget av innretningen uten menneskelig kontroll.

Kunstige villdata grenser dermed mot tamdata som er laget ved hjelp av innretninger, som et tekstbehandlingsprogram. Tamdata skapes imidlertid mens innretningen er under kontroll av et menneske, mens kunstige villdata skapes av innretningen mens den er overlatt til seg selv. Vi kommer inn i en gråsone når tamdata i betydelig grad blir viderebehandlet av en datainnretning etter at de først er skapt av et menneske.

Av og til kan data som opprinnelig var tamdata også bli brukt som villdata, for eksempel når en stor tekstsamling blir brukt til analyse av ordforekomster eller når Google analyserer innholdet på internettet for å finne trender i ordhyppighet osv.

Metadata[rediger | rediger kilde]

  • Metadata er data om andre data. For eksempel inneholder mange vevsider, i tillegg til lesbare skrifttegn, også skjulte data om når vevsiden sist ble oppdatert osv.

Andre betydninger[rediger | rediger kilde]

Data kan også bety:

Kilder[rediger | rediger kilde]

  • Luciano Floridi. Information – A very Short Introduction. Oxford University Press (2010).
  • matematikk.org. Data. Aksessert 2013-06-18.