Ekstrapolasjon
Ekstrapolasjon er en metode innenfor matematikken for å estimere verdien av en variabel utover det opprinnelige observasjonutvalg, på grunnlag av dens forhold med en annen variabel. Metoden er lik interpolering som gir estimater mellom kjente observasjoner. Ekstrapolasjon er derfor underlagt større usikkerhet og en høyere risiko for å produsere meningsløse resultater.
Ekstrapolering kan også gjelde for menneskelig erfaring med et fenomen, for eksempel vil en sjåfør ekstrapolere veien og kjøreforholdene, utenfor hans eller hennes siktbare vei.
Metoder
[rediger | rediger kilde]Et fornuftig valg av metode for ekstrapolering er avhengig av en forutgående kunnskap om prosessen som skapte de eksisterende dataene.[1] Noen avgjørende spørsmål er for eksempel om dataene kan antas å være kontinuerlige, glatte, periodiske eller lignende.
Lineær
[rediger | rediger kilde]Lineær ekstrapolasjon betyr at det lages en tangent linje på slutten av de kjente datapunktene. Denne linjen utvider dermed datapunktene utover deres grense. Lineær ekstrapolasjon vil bare gi gode resultater når den brukes til å utvide grafen til en tilnærmet lineær funksjon, eller at linjen ikke tegnes altfor langt utover de kjente data.
Hvis de to datapunktene nærmest til punktet som ekstrapoleres er og , vil linear ekstrapolasjon gi funksjonen:
(som er identisk med lineær interpolering hvis ). Det er mulig å ta mer enn to punkter og la kurven beskrive et gjennomsnitt av den lineær interpoleringe. Dette gjøres ved regresjon, basert på datapunkter som velges ut blant de kjente punktene. Dette tilsvarende lineær prediksjon.
Polynomisk
[rediger | rediger kilde]En polynomkurve kan skapes slik at den går gjennom alle den kjente datapunkter. Den kan også konstrueres slik at den bare går gjennom punktene nær slutten (to datapunkter for lineær ekstrapolasjon, tre datapunkter for kvadratiske ekstrapolasjon og så videre). Den resulterende kurven kan deretter forlenges forbi de kjente datapunktene. Polynomisk ekstrapolasjon blir oftest utført ved hjelp av Lagrange interpolering eller ved hjelp av Newtons endelige differanse metode. Metoden går ut på at det skapes en Newton-serie som passer til dataene. Det resulterende polynomet kan brukes til å ekstrapolere data.
Høyere ordens polynomekstrapolering må brukes med forsiktighet. I datasettet og problemet i figuren ovenfor, vil alt over 1. ordens (lineær ekstrapolasjon) muligens gi ubrukelig verdier. Et feilestimat for den ekstrapolerte verdi vil øke med graden av polynomets ekstrapolasjon. Dette er i slekt Runges fenomenet.
Konisk
[rediger | rediger kilde]En kjeglesnitt kan opprettes med fem datapunkter på slutten av de kjente dataene. Hvis kjeglesnittet danner en ellipse eller sirkel når det ekstrapoleres, vil det gå i en sløyfe tilbake og legge seg over de opprinnelige dataene. En ekstrapolert parabel eller hyperbel vil ikke gå tilbake til de opprinnelige dataene, men kan gå i kurve tilbake i forhold til x-aksen. Denne typen av ekstrapolasjon kan gjøres med en mal (sjablong) for kjeglesnitt (på papir) eller med en datamaskin.
Fransk kurve
[rediger | rediger kilde]Franske kurvelinjaler kan brukes til ekstrapolasjon for alle typer distribusjoner som tenderer mot å være eksponentiell. Disse kan brukes både for økende og minkende vekstfaktorer.[2] Denne metoden har vært brukt for å gi anslag for veksten av HIV/AIDS i Storbritannia siden 1987, og Variant Creutzfeldt–Jakobs sykdom (vCJD) i flere år. En studie har vist at ekstrapolering kan produsere den samme kvaliteten for prognoser, som mer avanserte strategier.[3]
Kvalitet
[rediger | rediger kilde]Vanligvis er kvaliteten for en bestemt metode for ekstrapolasjon begrenset av de forutsetninger om funksjonen som er lag av metoden selv. Hvis metoden forutsetter at datapunktene er glatte (deriverbar i alle punkter et visst antall eller uendelig mange ganger), så vil en funksjon som ikke forutsetter en glatt funksjon blir dårlig ekstrapolert.
Selv for riktig forutsetninger om en funksjon, kan ekstrapolasjonen avvike sterkt fra funksjonen. Et klassisk eksempel er avkortet potensrekker som representasjon av sin(x) og relaterte trigonometriske funksjoner. For eksempel om en tar datapunkter bare nært til x = 0, kan vi anslå at funksjonen oppfører seg som sin(x) ~ x. I området rundt x = 0 vil dette være et godt estimat. Når en beveger seg bort fra x = 0 vil imidlertid ekstrapoleringen bevege seg bort fra x-aksen, mens sin(x) er fortsatt befinner seg i intervallet [−1, 1]. det vil med andre ord si at feilen øker uten grenser.
Tar en med flere ledd i potensrekken av sin(x) ved x = 0 vil det gi bedre samstemthet over et større intervall i nærheten x = 0, men det vil produsere ekstrapoleringer som til slutt avviker langt fra x-aksen og enda raskere enn lineær tilnærming.
Se også
[rediger | rediger kilde]Referanser
[rediger | rediger kilde]- ^ J. Scott Armstrong; Fred Collopy (1993). «Causal Forces: Structuring Knowledge for Time-series Extrapolation» (PDF). Journal of Forecasting. 12 (2): 103–115. doi:10.1002/for.3980120205. Arkivert fra originalen (PDF) . Besøkt 2. oktober 2019. «Arkivert kopi» (PDF). Arkivert fra originalen (PDF) 17. desember 2010. Besøkt 2. oktober 2019.
- ^ «AIDSCJDUK.info Main Index». Arkivert fra originalen 2. oktober 2019. Besøkt 17. mai 2021.
- ^ J. Scott Armstrong (1984). «Forecasting by Extrapolation: Conclusions from Twenty-Five Years of Research» (PDF). Interfaces. 14 (6): 52–66. doi:10.1287/inte.14.6.52. Arkivert fra originalen (PDF) 22. juni 2010. Besøkt 2. oktober 2019.
Litteratur
[rediger | rediger kilde]- Ekstrapolering Metoder. Teori og Praksis av C. Brezinski og M. Redivo Zaglia, Nord-Holland, 1991.