Data

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

Data er det materielle (eller fysiske) grunnlaget for å tilføre mennesker informasjon. Data er dermed det materielle grunnlaget for å overføre informasjon og kunnskap mellom mennesker.

Data kan registreres, lagres, behandles og flyttes av menneskeskapte innretninger, slik som datasystemer. Noen av disse innretningene vil ha som formål å tilføre mennesker informasjon eller å overføre informasjon mellom mennesker, mens andre datainnretninger ikke vil ha et slikt formål, f eks et datasystem som styrer en industrirobot.

Ordet data brukes i dag oftest som et massesubstantiv som ikke bøyes i tall, slik som «luft», «trøbbel» og «bestikk». I noen sammenhenger, sånn som i definisjonen ovenfor, kan det likevel være nyttig å benytte entallsformen datum.

Definisjon av data[rediger | rediger kilde]

Informasjonsfilosofen Luciano Floridi definerer et datum slik:

  • x er forskjellig fra y, der x og y er to variabler vi ikke tolker og der også relasjonen «er forskjellige fra» og domenet er åpent for tolkning.[1]

Floridi definerer altså et datum grunnleggende som en forskjell (primærdata), men fravær av en (forventet) forskjell kan også være et datum (sekundærdata).

Av og til beskrives data som «råinformasjon», mens «informasjon» forklares som «velorganiserte» eller «sammensatte» data. I fagområdene som studerer informasjon forsøker man imidlertid å definere de to begrepene data og informasjon mer presist.

Eksempler på data[rediger | rediger kilde]

Eksempler på data er:

Eksemplene over er alle eksempler på primærdata (materielle forskjeller). Relaterte eksempler på sekundærdata (fravær av forventet forskjell) er:

  • et mellomrom mellom skrifttegnene i en bok
  • fravær av lydbølger før eller etter at noen har snakket
  • at det refleksive materialet på undersiden av en DVD er jevnt
  • mangel på elektrisk spenning i en mikroprosessor
  • fravær av lysglimt i en fiberoptisk kabel
  • en flaggstand hvor flagget ikke er heist
  • et trafikklys som ikke lyser
  • en hund som ikke bjeffer når noen går forbi

Typer av data[rediger | rediger kilde]

Det finnes en rekke måter å kategorisere data på. De er alle nyttige for å avklare databegrepet ytterligere:

Numeriske og ikke-numeriske data[rediger | rediger kilde]

  • Numeriske data består av tall. De kalles også kvantitative data. Vanlige skrifttegn kan kodes som tall ved hjelp av standarder som Unicode eller dets forløpere ISO 8859-1 og ASCII.
  • Ikke-numeriske data angir andre egenskaper enn antall, størrelse eller mengde. De kalles også kvalitative eller kategoriske data.

Diskrete og analoge data[rediger | rediger kilde]

  • Diskrete data vil si data som er representert gjennom forskjellige symboler eller signaler, for eksempel tall og bokstaver. Diskrete data kan for eksempel representere type, antall og rekkefølge. Data i de sentrale delene av moderne dataystemer er for det meste diskrete.[2]
  • Analoge data vil si data som varierer langs en trinnløs (eller kontinuerlig) skala. Analoge data kan for eksempel representere temperatur, høyde, vekt, tid og konsentrasjon av stoff. Analoge data var den vanlige datatypen i telefon, radio og TV inntil disse teknologiene gradvis ble digitalisert fra 1980-tallet og frem til i dag.[2]

Binærdata og digitale data[rediger | rediger kilde]

  • Binærdata er diskrete og numeriske data som er representert i det binære tallsystem, dvs i form av biter eller av tallene "0" og "1". Data i sentralenheten i moderne dataystemer er nesten alltid binære.
  • Digitale data er i praksis et annet ord for binære data. Når vi snakker om "digitale data" tar vi det vanligvis for gitt at de også er binære, selv om digitale data strengt tatt kan representeres i andre tallsystem enn det binære.

Primære og sekundære data[rediger | rediger kilde]

  • Primære data er tilstedeværelsen av en forskjell, f eks trykksverte på et avisark som former et skrifttegn, elektrisk spenning i en kobberkabel som angir biten "1", den lysende oljevarsellampen i en bil eller en årring i en trestamme. Se også Floridis definisjon lenger oppe på siden.[3]
  • Sekundære data er fraværet av en forskjell (som kanskje var forventet), f eks at samtalen vår ikke blir besvart når vi ringer en venn, at en lampe ikke begynner å lyse når vi slår den på, at skjermen på en mobiltelefon ikke gir respons når vi trykker på en tast eller at hunden i en kriminalroman ikke bjeffer på et bestemt punkt i fortellingen.[3]

Siden Floridis definisjon kun dekker primærdata, kan vi definere sekundærdata slik:

  • x er ikke forskjellig fra y i en situasjon hvor vi forventer at x og y skal være forskjellige, der x og y er to variabler vi ikke tolker og der også relasjonen "er forskjellige fra" og domenet er åpent for tolkning.

Semantiske data og miljødata[rediger | rediger kilde]

  • Semantiske data er skapt av mennesker som med hensikt ønsker å overføre informasjon (kommunisere) til seg selv eller til andre mennesker.[3] Vi sier at semantiske data er intensjonelle fordi de er laget med en hensikt og at de har semantisk innhold fordi de overfører informasjon mellom mennesker. Eksempler er skrifttegnene som utgjør en avissartikkel og de digitale bitene som utgjør et program, regneark eller database.
  • Miljødata er data som ikke skapt av mennesker i den hensikt å overføre informasjon.[3] Eksempler er igjen årringene i et tre eller varsellampen som lyser når en bil snart er tom for olje. (Men når en forsker registrerer antallet årringer i et regneark eller en bileier registrerer varsellampen i bilens logg er registreringene i stedet blitt semantiske data.)

Semantiske data kan være intensjonelle representasjoner, mens miljødata ikke er det. Semantiske data kan altså representere miljødata - som når skogvoktere registrerer alderen på trærne de feller ved å telle årringene - men behøver ikke å gjøre det. Semantiskedata kan dessuten være språklige uttrykk, som ikke alltid må representere noe.

Vi kan skille mellom to typer miljødata:[3]

  • Naturlige miljødata kommer fra naturen, slik som årringene i treet. Her har det ikke vært noen menneskelige intensjoner (hensikter) inne i bildet.
  • Kunstige miljødata kommer fra menneskeskapte innretninger (eller mekanismer), slik som en varsellampen i en bil. Her er innretningen skapt av mennesker med hensikt, men dataene er i sin tur laget av innretningen uten menneskelig kontroll.

Kunstige miljødata grenser dermed mot semantiske data som er laget ved hjelp av innretninger, som et tekstbehandlingsprogram. Semantiske data skapes imidlertid mens innretningen er under kontroll av et menneske, mens kunstige miljødata skapes av innretningen mens den er overlatt til seg selv. Vi kommer inn i en gråsone når semantiske data i betydelig grad blir viderebehandlet av en datainnretning etter at de først er skapt av et menneske.

Av og til kan data som opprinnelig var semantiske siden bli brukt som miljødata, for eksempel når en stor tekstsamling blir brukt til analyse av ordforekomster eller når Google analyserer innholdet på internettet for å finne trender i ordhyppighet osv.

Metadata[rediger | rediger kilde]

  • Metadata er data om andre data.[3][4] For eksempel inneholder mange vevsider, i tillegg til lesbare skrifttegn, også skjulte data om når vevsiden sist ble oppdatert osv.

Utledede data[rediger | rediger kilde]

  • Utledede data er data som følger av andre data.[3] For eksempel kan vi bruke data om at en mobiltelefon har vært i kontakt med bestemte basestasjoner på et tidspunkt - kanskje i kombinasjon med data om geografiske forhold og værforhold - til å utlede data om at mobiltelefonen har befunnet seg i et bestemt geografisk område på dette tidspunktet.

Andre betydninger[rediger | rediger kilde]

Data kan også bety:

Referanser[rediger | rediger kilde]

  1. ^ Floridi, Luciano (2010). Information – A very Short Introduction. Oxford: Oxford University Press. s. 21. ISBN 978-0-19-955137-8. 
  2. ^ a b Knut Vedeld og Rolf Venheim. «Data». Besøkt 18. juni 2013. 
  3. ^ a b c d e f g Floridi, Luciano (2010). Information – A very Short Introduction. Oxford: Oxford University Press. s. 30–36. ISBN 978-0-19-955137-8. 
  4. ^ Snyder, Lawrence (2015). Fluency with Information Technology - Skills, Concepts & Capabilities (6 utg.). Harlow, England: Pearson. s. 214. ISBN 1-292-06124-3.