OLAP

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

OLAP er en forkortelse for "OnLine Analytical Processing" som er en "analytisk måte" å trekke ut data på. Termen ble innført, i 1993, av Edgar F. Codd, som før øvrig er mer kjent for å stå bak relasjonsmodellen.

Analysen viser hovedsakelig til evnen til å se på dataene fra mange vinkler og fleksibiliteten i sammenstillinger og datanmaniulasjon. Man bruker gjerne en såkalt rapporteringskube som er en datamodell som er satt sammen slik at man har mange dimensjoner som man kan betrakte fakta i forhold til. For eksempel kan SALG fordeles på tid, sted, kundesegment,...

Rapporteringskube m/ 3 dimensjoner
Periode 2007 2008 2009
Personmarkedet 60% 55% 50%
Offentlig sektor 15% 20% 20%
Privat sektor 25% 25% 30%


Her ser man på salg i forhold til dimensjonene kundesegment og tid (år). Gitt at grunnlagsdataene også har en stedsdimensjon, så har man her akkumulert på denne dimensjonen. Hvis man istedenfor fikserer tidsdimensjonen på 2009 og fordeler tallene på stedsdimensjonen, så kan man få noe slikt:

Område Øst Vest Nord
Personmarkedet 70% 20% 10%
Offentlig sektor 65% 25% 10%
Privat sektor 60% 25% 15%

Det er den multidimensjonale betraktningen som har blitt den dominerende egenskapen som skiller OLAP ut fra andre tilnærminger til rapportering og datauttrekk. Imidlertid ser vi nedenfor at i Codds opprinnelige spesifikasjon er dett kun punkt nr 1 av 12.

Presis spesifikasjon[rediger | rediger kilde]

Codd definerte[trenger referanse] 12 kriterier for OLAP:

1.Multidimensjonal betraktning.

2.Transparens

Det at OLAP brukes som del av sluttbrukerverktøyet, skal være synlig for brukeren. OLAP burde være del av en åpen arkitektur, slik at denne kan flettes inn hvor som helst uten at funksjonaliteten til vertsapplikasjonen endres. Kilden for dataene, og bakenforliggende kompleksitet, skal ikke eksponeres for brukeren.

3.Tilgang

OLAP verktøyet skal kunne lage sin egen logikk for å gjøre heterogene kilder tilgjengelige, og utføre konverteringer for å gjøre dataene fra de forskjellige kildene kompatible. Verktøyet og ikke brukeren skal bry seg om hvor dataene kommer fra.

4.Jevn aksesstid for dataene

Svartider for OLAP verktøyet bør ikke reduseres betydelig når antallet dimensjoner økes.

5.Klient tjener arkitektur

Tjenerkomponenten skal være tilstrekkelig intelligent, slik at klientene kan tilknyttes uten store problemer. Den burde være kapabel til å mappe og konsolidere data mellom forskjellige databaser.

6.Generisk dimensionalitet

Alle dimensjoner skal være ekvivalent i sin struktur og operasjonelle egenskaper.

7.Dynamisk glissen-matrise håndtering

OLAP tjenerens fysiske struktur burde ha optimal håndtering av glisne matriser.

8.Flerbrukerstøtte

OLAP verktøy må støtte flerbrukertilgang samtidig for spørring og oppdateringstilgang, samt integritet og sikkerhet.

9.Ubegrenset inter-dimensjonelle operasjoner

Infrastrukturen må tillate beregninger og at manipulasjon må være mulig på tvers av ubegrenset antall dimensjoner. Den må ikke legge begrensninger på relasjoner mellom data celler.

10.Intuitiv datamanipulation

Datamanipulasjon innebygget i konsolideringsløpet, slik som drill down eller zoom ut, burde gjøres direkte mot modellens celler, og ikke kreve bruk av menyer eller andre komplekse operasjoner i brukergrensesnittet.

11.Fleksibel rapportering

Rapportering burde være kapabel til å presentere informasjon på hvilken som helst måte brukeren ønsker det.

12.Ubegrenset antall dimensjoner og aggregeringsnivåer.