Variasjonsregning

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

Variasjonsregning er en matematisk metode for å løse problem som har med optimalisering å gjøre. Et klassisk eksempel er å finne formen på baugen til en båt slik at den beveger seg med minst mulig motstand gjennom vannet. Eller hva slags kurve skal en partikkel følge slik at den faller raskest mulig i tyngdefeltet? Et tilsvarende problem er å finne den korteste avstand mellom to punkt på en flate..

Løsningen som variasjonsregningen gir av disse probleme, er en videreføring av derivasjon som kan bestemme maksimum eller minimum av funksjoner. En funksjon f= f(x) har en ekstremalverdi for en viss verdi av argumentet x der den deriverte er null, det vil si hvor df/dx = 0 . Inneholder funksjonen flere variable, må den deriverte for hver av dem være null.

Et mer komplisert problem oppstår når man skal finne en funksjon y = y(x) som gir en ekstremalverdi av et bestemt integral som

 I = \int_{x_A}^{x_B} \!dx F(y,\dot{y},x)

hvor  \dot{y} = dy/dx. I endepunktene av integrasjonen antar funksjon i integranden fikserte verdier yA = y(xA) og yB = y(xB) . For hvert valg av funksjonen y vil integral I ta en ny verdi. Det er derfor en funksjon av funksjonen y(x). Man kaller integralet en funksjonal og skriver I = I[y] .

Slike problem ble først undersøkt og til en viss grad løst allerede av Isaac Newton og Jakob og Johann Bernoulli ved hjelp av geometriske betraktninger i slutten av 16-hundretallet. Analytiske metoder ble først systematisk benyttet av Leonhard Euler som i 1744 publiserte ligningen

 {\partial F\over\partial y} - {d\over dx}\Big( {\partial F\over\partial \dot{y}}\Big) = 0

som må oppfylles av funksjonen som gir en ekstremalverdi. Han kom frem til dette resultatet ved en delvis geometrisk metode som tilsvarer å splitte opp intervallet mellom xA og xB i et stort antall diskrete punkt xk slik at integralet kan skrives som en endelig sum. Det er da en vanlig funksjon av et stort antall funksjonsverdier yk = y(xk) . Dens ekstremalpunkt kan nå finnes ved vanlig derivasjon. I den kontinuerlige grensen kommer så ligningen frem. Noen få år senere viste Joseph-Louis Lagrange som da bare var 19 år gammel, at han kunne utlede den mye mer direkte ved hjelp av variasjoner rundt den søkte løsning. Euler var med en gang overbevist om metodens fortreffelighet, og det er denne rent analytiske metode som brukes i dag. Derfor kalles ligningen også for Euler-Lagrange ligningen.

Variasjonsregning spiller en viktig rolle i moderne, teoretisk fysikk hvor dynamikken for et system kan utledes fra prinsippet om minste virkning. Løsningen av den resulterende Euler-Lagrange ligningen sier hvordan systemet klassisk forandrer seg i tid og rom. Den danner også grunnlaget for å beskrive systemet kvantemekanisk.

Euler-Lagrange-ligningen[rediger | rediger kilde]

En liten variasjon δy av funksjonen y(x) tas med konstant argument x.

Hvis en funksjon f= f(x) har en ekstremalverdi i et punkt x, så er df/dx = 0 i dette punktet. Hvis vi ser på funksjonen i meget nærliggende punkt x' = x + δx hvor variasjonen δx er veldig liten, blir variasjonen av funksjonen δf = (df/dx)δx = 0.

På tilsvarende vis antok Lagrange at funksjonalen I = I[y] i forrige seksjon har en ekstremalverdi for en bestemt funksjon y= y(x) som går gjennom de to gitte endepunktene A og B ssom vist i figuren. En meget liten forandring av denne funksjonen til y'(x) = y(x) + δy(x) vil nå gi en forandring av funksjonalen som må være null hvis y(x) allerede gir en ekstremalverdi. Dette er selvfølgelig i grensen hvor variasjonen

 \delta y(x)  = y'(x) - y(x)

er neglisjerbar. Det er viktig at denne variasjonen foretas uten at argumentet x forandres. Den resulterende variasjon av funksjonalen blir dermed

 \delta I = \int_{x_A}^{x_B} \!dx \left[{\partial F\over\partial y}\delta y  + {\partial F\over\partial \dot{y}} \delta\dot{y}\right]

da vi kan derivere under integraltegnet. Men nå har vi at

 {d\over dx} \delta y(x)  = \dot{y}'(x) - \dot{y}(x) = \delta\dot{y}

som innsatt gir

 \delta I = \int_{x_A}^{x_B} \!dx \left[{\partial F\over\partial y}\delta y  + {\partial F\over\partial \dot{y}}  {d\over dx} \delta y(x)\right]

I det siste leddet kan vi nå foreta en partiell integrasjon som gir

 \delta I = \int_{x_A}^{x_B} \!dx \left[{\partial F\over\partial y} - {d\over dx}\Big( {\partial F\over\partial \dot{y}}\Big) \right] \delta y + \left|  {\partial F\over\partial \dot{y}} \delta y(x)\right|_{x_A}^{x_B}

Da endepunktene under integrasjonen ligger fast, vil δy(xA) = δy(xB) = 0 slik at den siste termen her blir null. Men i den første termen vil δy ≠ 0 under integraltegnet. Den eneste måten for at variasjonen av funksjonalen skal bli null, er derfor at firkant-parantesen der er null. Og det gir akkurat ligningen til Euler og Lagrange. Noen ganger skrives dette ved å forlange at den funksjonalderiverte definert som

  {\delta I[y]\over \delta y(x)} = {\partial F\over\partial y} - {d\over dx}\Big( {\partial F\over\partial \dot{y}}\Big),

skal være null på samme måte som at den vanlige deriverte av en funksjon er null i et ekstremalpunkt.

I det mer generelle tilfellet inneholder integranden i variasjonsproblemet flere funksjoner av den samme variable. Er disse y1(x), y2(x), .... , yN(x), kan vi betegne dem kollektivt som yi (x) hvor indeksen i går fra 1 til N. Funksjonalen kan da skrives som

 I = \int_{x_A}^{x_B} \!dx F(y_i,\dot{y_i},x)

Dens samlede variasjon av denne funksjonalen under variasjonene δyi (x) av disse funksjonene, gir nå på samme måte opphav til N Euler-Lagrange-ligninger,

 {\partial F\over\partial y_i} - {d\over dx}\Big( {\partial F\over\partial \dot{y_i}}\Big) = 0

som alle må være oppfylt. Løsningen av ligningene vil gi en ekstremalverdi for problemet under betraktning. Om dette er en minimal- eller maksimalverdi, må undersøkes nærmere ved å regne ut for denne funksjonalen det som tilsvarer den andrederiverte av en vanlig funksjon.

Samme Euler-Lagrange-ligning kan resultere fra forskjellige funksjoner F(y,y',x) som skal ekstremaliseres. De må da skilne seg fra hverandre med en totalderivert dG/dx hvor funksjonen G = G(y) er uavhengig av den deriverte y' = dy/dx. En slik term vil da gi opphav til et ekstra bidrag

 \delta I = \left|G'(y)\delta y(x)\right|_{x_A}^{x_B}

til variasjonen av funksjonalen. Men dette er null da variasjonene δy(xA) og δy(xA) begge er null i randpunktene.

Geodetisk linje[rediger | rediger kilde]

Korteste kurve mellom to punkt i en flate kalles en geodetisk kurve. Er flaten et plan med kartesiske koordinater x og y, er lengden av et lite linjestykke

 ds = \sqrt{dx^2 + dy^2} = dx\sqrt{1 + y'^2}

hvor nå y' = dy/dx. Vi vil nå finne kurven med den korteste lengden som forbinder origo (0,0) med punktet (xB = a, yB = b). En vilkårlig kurve y = y(x) som forbinder disse to punktene, har en lengde L som finnes ved å summere alle de små linjestykkene den består av. Blir disse små nok, er denne summen gitt ved integralet

 L = \int_0^a\!dx \sqrt{1 + y'^2}

I dette eksemplet er derfor F(y,y') = √(1 +y' 2). Dermed blir ∂ F/∂ y = 0 og ∂ F/∂ y' = y'/√(1 +y' 2) slik at Euler-Lagrange-ligningen tar formen

 {d\over dx}\Big( {y'\over \sqrt{1 + y'^2}}\Big)  = {y''\over (1 + y'^2)^{3/2}} = 0

For at ligningen skal være oppfylt, må derfor den andrederiverte y" = 0. Den førstederiverte y' er derfor konstant, noe som definerer en rett linje. Tar vi hensyn til de gitte grensebetingelsene, blir ligningen for denne dermed y = (b/a)x.

Dette resultatet kunne vi nesten ha skrevet ned med en gang, uten noen bruk av variasjonsregning. Men hadde vi sett på et tilsvarende problem i en krum flate, er bruk av Euler-Lagrange-ligningen nødvendig.

Integralkonstanter[rediger | rediger kilde]

I det generelle tilfellet med N ukjente funksjoner i variasjonsproblemet, kan det skje at en eller flere av disse ikke opptrer i integranden  F(y_i,\dot{y_i},x) , men kun deres deriverte. Er en av disse yk, vil derfor ∂ F/∂ yk = 0. Euler-Lagrange-ligningen for akkurat denne funksjonen blir derfor

 {d\over dx}\Big( {\partial F\over\partial \dot{y_k}}\Big) = 0

Det betyr at størrelsen

  J_k =  {\partial F\over\partial \dot{y_k}}

er uavhengig av x og kalles en integralkonstant. Den tilsvarende, variable funksjonen yk kalles ofte for en syklisk variabel.

Tilstedeværelsen av slike sykliske variable, forenkler ofte løsningen av det tilsvarende variasjonsproblemet. For eksempel, i beregningen av den geodetiske linjen ser man at y er en slik variable. Derfor vet man med en gang at ∂ F/∂ y' er en integralkonstant, det vil si at

 {y'\over \sqrt{1 + y'^2}} = konst.

Dermed må den førstederiverte y' være konstant, og man har løsningen uten mer regning.

En annen integralkonstant oppstår når integranden F inneholder ingen eksplisitt avhengighet av den variable x slik at ∂ F/∂ x = 0. Da blir

 {dF\over dx} =\sum_i \left({\part F\over \part y_i} \dot{y_i}  +  {\part F\over \part \dot{y_i}} \ddot{y_i}\right)

I det første leddet setter vi nå inn fra Euler-Lagrange-ligningen og får

 {dF\over dx} =\sum_i \left[ {d\over dx}\Big( {\partial F\over\partial \dot{y_i}}\Big)\dot{y_i}  
                                   +  {\part F\over \part \dot{y_i}} \ddot{y_i}\right]    =  {d\over dx}\sum_i \Big( {\partial F\over\partial \dot{y_i}}\dot{y_i}\Big)

når vi bruker regelen for den deriverte av et produkt. Dette betyr at størrelsen

 K = F -  \sum_i{\partial F\over\partial \dot{y_i}}\dot{y_i}

er uavhengig av x og derfor en integralkonstant i dette tilfellet. Den forbindes ofte med den italienske matematiker Beltrami.

Eksemplet med den geodetiske linjen tilhører denne klassen av variasjonsproblem. Her blir

 K = \sqrt{1 + y'^2} - {y'^2\over \sqrt{1 + y'^2}} =  {1\over \sqrt{1 + y'^2}}  = konst

som igjen betyr at den førstederiverte y' må være konstant som vi fant tidligere.

Bibetingelser[rediger | rediger kilde]

I noen variasjonsproblem er den søkte funksjonen y(x) man skal finne, ikke helt fri. Den skal oppfylle visse føringer eller bibetingelser. De tilsvarende variasjonene δy vil derfor ikke være helt uavhengig av hverandre. Denne komplikasjonen ble behandlet av Euler og Lagrange allerede i deres første arbeider med variasjonsregningen. I ettertiden er det spesielt metoden med Lagrange-multiplikator som har vist seg meget nyttig.

Det er to hovedtyper av bibetingelser. Den vanligste kan skrives på integralform av samme form som funksjonalen som skal ekstremaliseres,

 \int_{x_A}^{x_B} \!dx\, G(y,\dot{y},x)  = 0

hvor integranden er en eller annen gitt funksjon. Da betingelsen er gitt ved et integral over et visst område, er dette en global bibetingelse. Man kan enklest ta hensyn til denne ved å diskretisere det gitte variasjonsproblemet samt dette ekstra integralet. Det blir da ekvivalent med et vanlig ekstremaliseringsproblem av en funksjon med mange variable. Metoden med en Lagrange-multiplikator kan da benyttes. Da finnes løsningen ved å variere den modifiserte funksjonalen

 I^* = \int_{x_A}^{x_B} \!dx F^*(y,\dot{y},x)

hvor nå

  F^*(y,\dot{y},x) =  F(y,\dot{y},x) + \lambda G(y,\dot{y},x)

Her kan nå den ukjente variable y varieres fritt og ekstremalverdien er gitt som løsningen av Euler-Lagrange-ligningen med F * i stedet for F. Den vil i utgangspunktet inneholde den ukjente konstanten λ. Men den kan så bestemmes ved å sette inn løsningen i den opprinnelige bibetingelsen.

Den andre typen av bibetingelse er av formen

 G(y,\dot{y},x)  = 0

og må være oppfylt i hvert punkt x. Den sies derfor å være lokal. Når variajonsproblemet i dette tilfellet diskretiseres, vil betingelsen derfor gi opphav til et stort antall betingelser, gyldig i hvert diskret punkt. Hver slik bibetingelse vil da få sin egen Lagrange-multiplikator. Den modifiserte funksjonalen som skal ekstremaliseres, vil dermed inneholde en sum over alle disse diskrete betingelsene. Går man så tilbake til den kontinuerlige beskrivelsen, vil denne summen gå over til et integral som inneholder en variabel Lagrange-multiplikator λ(x). Den modifiserte funksjonalen vil i dette tilfellet dermed bli

  F^*(y,\dot{y},x) =  F(y,\dot{y},x) + \lambda(x) G(y,\dot{y},x)

Betrakter man λ(x) som en variabel, vil nå variasjonen av den gi den lokale bibetingelsen. Igjen må den ukjente funksjonen λ(x) til slutt bestemmes ved at denne oppfylles. Dette er vanligvis mer vanskelig enn i det første tilfellet.

Eksempel[rediger | rediger kilde]

Den røde linjen som forbinder punktene (-a,0) med (a,0), avgrenser et maksimalt areal mot x-aksen når den er en sirkelbue med sentrum på den negative y-aksen..

La oss tenke oss at vi har et rep med lengde L. Dette repet skal forbinde punktet (-a,0) med punktet (a,0) i et aksekors med koordinater (x,y) som vist i figuren. La oss anta at dermed er plasseringen av repet beskrevet entydig ved en kurve y = y(x). For at dette skal være praktisk mulig, må opplagt L > 2a. Spørsmålet nå er å gjøre det på en slik måte at arealet mellom denne kurven og x-aksen er størst mulig. Dette arealet A er gitt ved integralet

 A = \int_{-a}^a\!dx\, y

og kan i utgangspunktet gjøres så stort man vil. Men samtidig må bibetingelsen at lengden L av repet er en gitt størrelse, være oppfylt. På samme måte som for beregningen av den geodetiske linje, er lengden gitt ved integralet

  L =  \int_{-a}^a\!dx\,\sqrt{1 + y'^2}

hvor y' = dy/dx. Dette er en global bibetingelse. For å finne kurven som gir maksimalt areal må vi derfor bruke

 A^* = y + \lambda \sqrt{1 + y'^2}

i Euler-Lagrange-ligningen. Da blir ∂A*/∂ y = 1 og ∂A*/∂ y' = λy'/√(1 +y' 2) slik at ligningen tar formen

  {d\over dx} {\lambda y'\over\sqrt{1 + y'^2}} = 1

Denne kan direkte integreres med resulatet

  {\lambda y'\over\sqrt{1 + y'^2}} = x +b

hvor b er en integrasjonskonstant. Denne må være null utfra symmetrien i problemet. Løser man nå dette resultatet med hensyn på y', finner man lett at

  {dy\over dx} = - {x\over \sqrt{\lambda^2 - x^2}}

når man tar roten med negativt fortegn. Da den største verdien av x er a, ser vi at λ > a for å ha en ikke-triviell løsning. Enda en direkte integrasjon gir nå

  y + c = \sqrt{\lambda^2 - x^2}

Dette beskriver en sirkelbue med radius λ og med sentrum på y-aksen i y = - c. Denne sirkelbuen forbinder de to gitte punktene (-a,0) og (a,0). De bestemmer verdien av konstanten c som derfor må ha verdien c = √(λ2 - a2). Verdien av λ finnes ved å sette løsningen inn i integralet som gir repets lengde L. Legg merke til at når L = π a er sirkelbuens radius λ = a, og den har sentrum i origo. For større verdier av L gir den komplementære sirkelbuen svaret på spørsmålet.

Se også[rediger | rediger kilde]

Litteratur[rediger | rediger kilde]

R. Tambs Lyche, Matematisk Analyse, Vol. III, Gyldendal Norsk Forlag, Oslo (1959).

L.E. Elsgolc, Calculus of Variations, Addison-Wesley Publishing Company, New York (1961).

H. Goldstine, A history of the calculus of variations from the 17th through the 19th century, Springer, New York (1980).

Eksterne lenker[rediger | rediger kilde]