Hamiltons virkningsprinsipp

Fra Wikipedia, den frie encyklopedi

Hamiltons virkningsprinsipp gir en mer generell formulering av de fundamentale lovene i klassisk mekanikk enn den som ble innført av Isaac Newton. Det ble utviklet av den irske fysiker og matematiker William Rowan Hamilton rundt 1840 da han fant en ny definisjon av virkningen til et system basert på dets Lagrange-funksjon. Prinsippet sier at denne virkningen skal være minimal, og det er derfor tett knyttet opp mot variasjonsregning.

Ofte blir det omtalt som prinsippet om minste virkning selv om dette navnet i noen tilfeller kan være misvisende da den klassiske bevegelsen kan tilsvare en maksimal verdi av virkningen. Mer korrekt er å si at virkningen skal ha en ekstremalverdi som kan være et minimum eller et maksimum. Det er ekvivalent med å si at den skal være stasjonær. Prinsippet er en videreføring av Maupertuis' virkningsprinsipp som ble innført hundre år tidligere for mekaniske systemer. Dets store fordel kommer mest tydelig frem i beskrivelsen av kontinuumsmekanikk og i feltteorier.

Euler-Lagrange-ligningene som følger fra Hamiltons prinsipp, er differensialligninger av andre orden med hensyn på tiden. De sier noe om hvordan systemets energi fordeler seg mellom å være kinetisk T og potensiell V energi. Mens den totale energien for systemet er E = T + V, viste Hamilton at differensen L = T - V definerer en ny virkningen for systemets bevegelse. Den avhenger av variable som posisjon og hastighet og er Lagrange-funksjonen for systemet. For hvert tidspunkt t antar denne funksjonen en viss verdi avhengig av hvor systemet befinner seg og hvor raskt det forandrer seg. Beveger systemet seg fra et punkt A til et punkt B, er virkningen for bevegelsen gitt ved integralet

Vet man ikke nøyaktig hvordan systemet beveger seg, kan man beregne virkningen for hver tenkelig bevegelse. Av alle slike tenkelige bevegelser, velger så systemet den banen som vanligvis har den minste virkningen. Alltid skal virkningen ha en ekstremalverdi for den klassiske bevegelsen. Dette uttrykkes matematisk ved at variasjonen

Dermed er virkningen S stasjonær for små variasjoner rundt denne banen.

En dypere forståelse av dette virkningsprinsippet i klassisk fysikk kom først med formuleringen til Richard Feynman av kvantemekanikken. Denne er basert på veiintegral som er bygd opp av virkningene for hver tenkelig bevegelse. Hva som er alternative, matematiske bevegelser i den klassiske beskrivelsen går over til å bli virkelige, fysiske bevegelser i den kvantemekaniske beskrivelsen.

Hamilton viste også at Euler-Lagrange-ligningene kan erstattes med det dobbelte antall første ordens differensialligninger. Disse er basert på Hamilton-funksjonen som er definert ved H = T + V. Dette er energien for systemet slik at H også kan kalles for energifunksjonen. Denne formuleringen av klassisk mekanikk kalles Hamilton-mekanikk og danner grunnlaget for kvantemekanikken. Sammen med den ekvivalente Lagrange-mekanikken inngår Hamilton-mekanikken i det som vanligvis omtales som analytisk mekanikk.

Lagrange-mekanikk har en stor fordel fremfor Hamilton-mekanikk. Det er at den automatisk kan formuleres i overensstemmelse med Einsteins relativitetsteori og derfor også kan beskrive relativistiske systemer. Den kan også brukes til beskrivelse av kontinuerlige systemer hvor Lagrange-funksjonen er gitt som et volumintegral over en Lagrange-tetthet. Moderne kvantefeltteorier formuleres alle på denne måten.

Euler-Lagrange-likningen[rediger | rediger kilde]

En liten variasjon δq av koordinaten q(t) tas med konstant tid t.

I det enkleste tilfellet kan det mekaniske systemet vi betrakter, beskrives ved bare en koordinat q = q(t). Det kan for eksempel være en partikkel med masse m hvor q angir dens posisjon. Den kinetiske energien er da

hvor = dq/dt, mens den potensielle energien er gitt ved en funksjon V = V(q). Man kan også tenke seg at dette potensialet varierer med tiden slik at man mer generelt har at V = V(q,t). Lagrange-funksjonen for systemet er nå

For mer kompliserte situasjoner er det ikke mulig å splitte Lagrange-funksjonen slik opp i en kinetisk og en potensiell del. Hvordan Lagrange-funksjonen da ser ut, kan bli en mer vanskelig oppgave å finne ut av.[1]

For å beregne bevegelsen fra et punkt A = (tA , qA) til et punkt B = (tB , qB) fra Hamiltons virkningsprinsipp må man bestemme en stasjonær verdi for virkningen

Integralet er en funksjon av funksjonen q(t) og er derfor en funksjonal som angis ved firkantparentesen S[q].

Det gjøres systematisk ved variasjonsregning hvor man betrakter en liten variasjonen q(t) → q(t) + δq av banen som vist i figuren. Variasjonen av virkningen blir dermed

når man ser bort fra høyere ordens ledd. I siste ledd i integranden kan man nå foreta en partiell integrasjon som gir

Da alle baner skal gå gjennom endepunktene A og B, må variasjonen δq oppfylle kravene δq(tA) = δq(tB) = 0. Randleddet forsvinner derfor, og firkantparentesen i det første integralet må være null for at δS = 0. Dette gir Euler-Lagrange-ligningen

Den er den samme for alle systemer. Men Lagrange-funksjonen L vil være forskjellig fra system til system.[2]

Hvis Lagrange-funksjonen får et ekstra tillegg L → L + dG/dt som er en totalderivert med hensyn på tiden, vil det gi opphav til et ekstra bidrag

til variasjonen av virkningen. Men dette er null da variasjonene δq(tA) og δq(tB) begge er null i randpunktene. Euler-Lagrange-ligningen forblir derfor uforandret. Legg merke til at dette holder kun når funksjonen G(q,t) er uavhengig av den tidsderiverte av q(t).

Bevegelseskonstanter[rediger | rediger kilde]

Et generelt system er beskrevet ved N generelle koordinater q = (q1, q2, ... , qN). Disse behøver ikke å være komponenter av forskjellige posisjonsvektorer, men kan for eksempel oppstå ved bruk av ikke-kartesiske koordinatsystem. Begynnelsespunkt A og sluttpunkt B for bevegelsen er da begge angitt ved N slike koordinater. Virkningen må nå være stasjonær under variasjon q n(t)q n(t) + δq n(t) av alle disse koordinatene. Dermed får man en Euler-Lagrange-ligning for hver slik dynamisk variabel,

Det siste leddet i denne ligningen inneholder den tidsderiverte av hva som kalles den konjugerte impuls p n til koordinaten q n, det vil si at

Hvis Lagrange-funksjonen av en eller annen grunn ikke inneholder en koordinat q k slik at ∂ L/∂ qk = 0, så betyr det at dpk/dt = 0. Den tilhørende, konjugerte impuls er derfor uavhengig av tiden og dermed er

en bevegelseskonstant. Den tilsvarende variabel sies å være syklisk. Det kan i prinsippet være flere av dem, og de kan være til stor hjelp ved løsningen av Euler-Lagrange-ligningene for de andre koordinatene.

Fra den generelle variasjonsregningen vet man også at når tiden t ikke eksplisitt opptrer i Lagrange-funksjonen, vil størrelsen

være en bevegelseskonstant. Derfor er H = E en konstant når ∂ L/∂ t = 0. Denne bevegelseskonstanten er ikke noe annet enn energien for systemet. Uttrykker vi hastigheten ved den tilsvarende, konjugerte impulsen p n, blir da H = H(q,p) Hamilton-funksjonen for systemet.[1]

Virkningsfunksjonen[rediger | rediger kilde]

Euler-Lagrange-ligningen for en ikke-relativistisk partikkel med masse m som beveger seg fritt i en dimensjon, er . Ligningen sier altså at den har konstant hastighet. Beveger den seg fra punkt A til B, er denne = (qB - qA)/(tB - tA). Dette er hastigheten partikkelen har i klassisk mekanikk i motsetning til i kvantemekanikken. Man sier at det er dens klassiske hastighet. Virkningen for den klassiske bevegelsen er derfor

Normalt er den en funksjon av tre variable ta de to tidspunktene vil opptre sammen i differensen tB - tA . Hamilton kalte denne klassiske virkningen for den prinsipale funksjonen.[3]

Denne funksjonen har to interessante og viktige egenskaper. Tar man den deriverte med hensyn på en av koordinatene, finner man impulsen til partikkelen på samme sted,

Den deriverte med hensyn på tiden gir tilsvarende

som er energien til partikkelen, med motsatt fortegn. Selv om dette eksempelet er så enkelt at det ikke en gang er noen forskjell mellom Lagrange- og Hamilton-funksjonene, er de to resultatene for de deriverte av den klassiske virkningen eksempler på mer generelt gyldige egenskaper ved virkningsfunksjonen.

For å vise det, kan man betrakte to nærliggende klassiske baner q(t) og q'(t) = q(t) + δq(t) som begge starter i punktet A, men med litt forskjellig endepunkt B.

Hvis bevegelsene langs de to banene tar samme tid, men ankommer på litt forskjellig steder separert med δqB, vil de dermed ha litt forskjellig virkning

som utledes direkte som ved variasjonsregningen over. Det første leddet er null da begge banene er klassiske og oppfyller Euler-Lagrange-ligningen. I det siste leddet er den partiellderiverte gitt ved impulsen pB i sluttpunktet B. Resultatet δScl = pB δqB betyr at

Denne utledningen kan lett utvides til å gi et tilsvarende resultat for begynnelsepunktet A .

Alternativt kan man tenke seg at de to klassiske banene har samme endepunkt pB , men at q'(t) ankommer dette punktet δtB senere sammenlignet med q(t). Forskjellen i virkning δScl for disse to bevegelsene får da et bidrag før tiden tB av samme type pB δqB som beregnet over da de to banene ved dette tidspunktet ennå ikke er i samme punkt. For den korte tiden δtB etterpå oppstår ganske enkelt bidraget LB δtB. Her er LB verdien av Lagrange-funksjonen i sluttpunktet B. Tilsammen er dermed

I første leddet kan man skrive δqB = - δtB. Derfor er

da man finner kombinasjonen av variable pB - LB = HB som er Hamilton-funksjonen i sluttpunktet B.

Disse to generelle resultatene for de deriverte av virkningsfunksjonen spiller en sentral rolle i Hamiltons alternative formulering av Lagrange-mekanikken som naturligvis kalles Hamilton-mekanikk.

Ikke-relativistisk partikkel[rediger | rediger kilde]

La oss betrakte en ikke-relativistisk partikkel med masse m som beveger seg i tre dimensjoner hvor dens posisjon i et kartesisk koordinatsystem er angitt ved posisjonsvektoren r. Den påvirkes av et ytre potensial slik at den har en potensiell energi gitt ved en funksjon V = V(r). Partikkelens bevegelse kan nå beregnes fra Lagrange-funksjonen

Den har en kanonisk impuls

slik at Euler-Lagrange-ligningen blir

Dette er ikke noe annet enn Newtons andre lov da F = - V er kraften som virker på partikkelen.

Potensialet V er antatt å være uavhengig av tiden. Derfor er partikkelens energi

konstant, H = E. Uttrykt ved impulsen p er dette Hamilton-funksjonen for dette systemet,

I kvantemekanikken danner denne grunnlaget for å skrive ned den tilsvarende Schrödinger-ligningen for partikkelens bevegelse.

Mer interessant er dette systemet når den potensielle energien V  ikke avhenger av retningen til posisjonsvektoren r, men bare av dens lengde r = |r|. Da er V = V(r), og systemet er symmetrisk under rotasjoner. De tilsvarende rotasjonsvinklene er derfor sykliske variable som gir opphav til at den konjugerte dreieimpulsen L = r × p er konstant. En annen måte å forstå det på er at i dette tilfellet peker kraften F = -V på partikkelen i radiell retning slik at dreiemomentet r × F på den er null og lar derfor dreieimpulsen forbli konstant. Dette kan generaliseres til å gjelde for lignende situasjoner i andre system og går under navnet Noethers teorem.

Relativistisk partikkel[rediger | rediger kilde]

Fra den spesielle relativitetsteorien følger at Lagrange-funksjonen for en fri, relativistisk partikkel med masse m er

hvor c er lyshastigheten og v = dr/dt er partikkelens hastighet. Man kan nå beregne dens konjugerte impuls,

Kun i den ikke-relativistiske grensen v << c stemmer dette med det valige resulatet p = mv fra newtonsk mekanikk.[4]

Energien til partikkelen følger nå fra

Ekspanderer man kvadratroten her i den ikke-relativistiske grensen v << c, finner man at

Det første leddet tilsvarer partikkels hvileenergi E0 = mc2, mens andre leddet er den vanlige, kinetiske energien som brukes i ikke-relativistisk mekanikk. De høyere leddene blir viktige når partikkelens hastighet blir stor som man for eksempel har for elektronene i atomet.

Fra disse resultatene ser man at energi E og impuls p er forbundet ved relasjonen

i relativistisk mekanikk. Den kommer naturlig frem i den kovariante beskrivelsen av 4-dimensjonal tidrom.

Partikkel i elektromagnetiske felt[rediger | rediger kilde]

En partikkel med ladningen q påvirkes av elektriske og magnetiske krefter som er konsekvens av det elektriske Φ = Φ(r,t) og det magnetiske potensialet A = A(r,t). Disse varierer i alminnelighet med tiden t og posisjonen r til partikkelen.[5] Har partikkelen massen m og beveger seg ikke-relativistisk, er den fra klassisk elektrodynamikk beskrevet ved Lagrange-funksjonen

hvor v = dr/dt er dens hastighet. Lagrange-funksjonen er invariant under elektromagnetiske gaugetransformasjoner. Impulsen til partikkelen er dermed

Det eksisterer ikke lenger en direkte sammenheng mellom partikkelens impuls og dens hastighet. Dette kommer klarest til uttrykk når den resulterende bevegelsen blir beskrevet i kvantemekanikken.[6]

I Euler-Lagrange-ligningen dp/dt = ∂L/∂ r behøver man nå

og

Euler-Lagrange-funksjonen blir dermed

I det siste kan man nå bruke det vektorielle trippelproduktet

til å skrive bevegelsesligningen på den enklere formen

når man innfører det elektriske feltet

og det magnetiske feltet

Den totale kraften på høyresiden av denne bevegelsesligningen er Lorentz-kraften.[7]

Hamilton-funksjonen for partikkelen følger nå fra

og danner grunnlaget for beskrivelsen av hvordan atomer vekselvirker med elektromagnetiske felt og absorpsjon/emisjon av lys.

Kontinuerlig system[rediger | rediger kilde]

La oss betrakte en lang kjede av massepunkt m fordelt langs x-aksen fra x = - L/2 til x = L/2 i avstand a fra hverandre. Med elastiske fjærer er hvert massepunkt knyttet til sine to nabopunkt. Alle fjærer er antatt å ha samme fjærkonstant k. Massepunktene er nummererte fra origo x = 0 hvor massepunkt med n = 0 er plassert. Massepunkt nummer n er i posisjon xn = na når det er i ro. Indeksen n kan anta både positive og negative verdier.

Disse massepunktene kommer nå i bevegelse langs x-aksen. Dette kan for eksempel skje ved at punkt nummer n kommer ut av sin likevektsposisjon med et utslag Qn. Alle punktene kommer da i bevegelse med den kinetiske energien

og den potensielle energien

Dermed blir Lagrange-funksjonen for denne svingende kjeden

Bevegelsen til hvert massepunkt kan nå finnes ved å løse de resulterende Euler-Lagrange-ligningene.

I stedet skal vi betrakte grensen hvor massepunktene ligger veldig tett. Matematisk tilsvarer det at avstanden a → 0 slik at massepunktene danner en kontinuerlig kjede hvor hver del kan bevege seg litt langs x-aksen. Skrives Lagrange-funksjonen om på formen

kan man da innføre massetettheten ρ = m/a og elastisitetsmodulen E = ka. I denne grensen blir utslaget Qn(t) en funksjon Q(t,xn) → Q(t,x) slik at

og differensen

I stedet for en sum kan da Lagrange-funksjonen skrives som et integral

hvor Lagrange-tettheten for den kontinuerlige kjeden nå kan skrives som

Den totale virkningen over et tidsintervall fra tA = - T/2 til tB = T/2 er gitt ved integralet

hvor den tidsderiverte er skrevet som Q,t = ∂Q/∂ t og den romlige deriverte som Q,x = ∂Q/∂ x. Under variasjonen QQ + δQ forandres dermed virkningen med

Nå er igjen δQ,t = ∂δQ/∂ t og δQ,x = ∂δQ/∂ x slik at man kan foreta partielle integrasjoner i t- og x-retning. Da variasjonen δQ skal være null ved alle integrasjonsgrenser, forsvinner randleddene fra integrasjonene. På samme måte som for tilfellet med en partikkel, må den gjenværende integranden være null og man står igjen med Euler-Lagrange-ligningen

Setter man inn her for Lagrange-tettheten til den svingende kjeden, finner man lett

Dette er bølgeligningen i en dimensjon for en bølge hvor

er hastigheten som utslagene eller svingningene til kjeden brer seg utover med langs x-aksen.

Kontinuerlig felt i tre dimensjoner[rediger | rediger kilde]

Dette resultatet kan lett utvides til å gjelde for et kontinuerlig medium i tre romlige dimensjoner hvor utslaget i hvert punkt x er funksjonen Q = Q(t,x). Dette er et skalart felt med Lagrange-tettheten

Et eksempel på et slikt system er lydfeltet i luft eller et fast materiale. Beregningen av den tilsvarende Euler-Lagrange-ligningen foregår på samme måte.[3]

For å være litt mer generell kan man betrakte en virkning

Fra variasjonen QQ + δQ kommer man da frem til den generelle Euler-Lagrange-ligningen

for et skalart felt. Her i siste ledd er Q,j = ∂ Q/∂ xj og man summerer over de tre romlige retningene med koordinater xj = (x,y,z). Dette er et eksempel på bruk av Einsteins summekonvensjon. Fra Lagrange-tettheten for lydfeltet finner man ∂Q,j = - E Q,j slik at (∂/∂xj )(∂/∂Q,j) = - E ∇2Φ. Dermed resulterer Euler-Lagrange-ligningen i

som er den skalare bølgeligningen i tre dimensjoner

Klein-Gordon-feltet[rediger | rediger kilde]

I kvantefeltteori er partikler med masse m og uten spinn kvantene til et skalart felt Φ = Φ(t,x) beskrevet ved Lagrange-tettheten

hvor c er lyshastigheten og er Planck-Dirac-konstanten. Innsatt i den generelle tre-dimensjonale Euler-Lagrange-ligningen, gir denne nå bølgeligningen

Denne kalles vanligvis for Klein-Gordon-ligningen og gjelder blant annet for Higgs-partikkelen. Størrelsen som opptrer her, er Compton-bølgelengden for partikkelen med masse m.[8]

Elektromagnetiske felt[rediger | rediger kilde]

Bevegelsesligningene for det elektromagnetiske feltet er Maxwells ligninger. Disse må kunne utledes fra en Lagrange-funksjon som man a priori ikke kjenner til. De fundamentale feltene må være det elektriske potensialet Φ = Φ(r,t) og det magnetiske vektorpotensial A = A(r,t) som bestemmer både det elektriske feltet

og det magnetiske feltet

Denne siste ligningen ble innført for å oppfylle B = 0 som er Maxwells 2. ligning. Tilsvarende inneholder uttykket for det elektriske feltet Maxwells 3. ligning. Det ser man ved å ta curl av begge sider av ligningen. Det gir

Her har vi først benyttet at curl av en gradient er null, altså at ∇×∇ = 0 slik at det elektriske potensialet ikke bidrar. I leddet med det magnetiske potensialet har vi byttet om de to derivasjonene, det vil si skrevet at ×(∂A/∂t) = (∂/∂t)(×A) og brukt uttrykket for magnetfeltet. De to resterende Maxwell-ligninger er derfor Euler-Lagrange-ligninger som kan finnes fra variasjoner av den elektromagnetiske virkningen.[3]

Utledning[rediger | rediger kilde]

Virkningen er gitt ved integralet av Lagrange-tettheten till feltet. Den må inneholde den elektriske energitettheten

hvor ε0 er dielektrisitetskonstanten i vakuum. Likedan må den inneholde den magnetiske energitettheten

hvor μ0 er permeabilitetskonstanten for vakuum. Da den elektriske delen inneholder tidsderiverte av vektorpotensialet, mens den magnetiske ikke inneholder slike variable, er det naturlig å anta at den elektriske energitettheten uE gir den kinetiske energien til Lagrange-tettheten. Den magnetiske energitettheten uB kan sies å beskrive den potensielle energien til feltene.

I tillegg må man ta med leddene som beskriver koblingen til elektrisk ladete partikler. De beskrives ved en ladningstetthet ρ = ρ(r,t) og en tilsvarende J = J(r,t). Den første gir et elektrisk bidrag ρΦ til energien, mens strømtettheten bidrar -JA som finnes fra den magnetiske vekselvirkningen. Begge bidragene kan utledes fra kravet om gaugeinvarians og bidrar med motsatte fortegn i Lagrange-tettheten. Denne tar dermed formen

og vil gi de resterende Maxwell-ligningene. Det følger fra å gjøre først vi en variasjon av det skalare potensialet Φ. Det gir

Lagrange-tettheten inneholder ingen tidsderiverte av dette potensialet, men derimot de romlige deriverte Φ,j i den elektriske delen. Den bidrar med

slik at

hvor man igjen bruker Einsteins summekonvensjon og summerer over de to like indeksene i. Kombineres disse to delresultatene, finner man

som er Maxwells 1. ligning uttrykt ved forskyvningsfeltet D = ε0E.

Variasjon av vektorpotensialet gir ligninger som er litt mer komplisert å utlede. Enklest å beregne er

Likedan finner man lett fra den elektriske delen i Lagrange-tettheten at de tidsderiverte komponentene Ai ,t gir

Den magnetiske delen av Lagrange-tettheten inneholder de romlige deriverte Ai ,j. Fra den får man

når man benytter Einsteins summekonvensjon igjen og summerer over de to like indeksene k. Den deriverte av den magnetiske komponenten Bk finnes nå enklest ved å benytte formalismen med Levi-Civita-symbolet εi j k slik at man kan skrive curl på formen

Dermed er ∂ Bk/∂ Ai ,j = εk j i slik at man har

Euler-Lagrange-ligningen for denne romlige komponenten Ai  blir derfor

Det siste leddet her er i-te komponent av curl til det magnetiske feltet H = B/μ0 med et minus fortegn. Resultatet av beregningen blir dermed på vektorform

som er Maxwells 4. ligning.

Se også[rediger | rediger kilde]

Referanser[rediger | rediger kilde]

  1. ^ a b H. Goldstine: A History of the Calculus of Variations from the 17th through the 19th Century, Springer, New York (1980). ISBN 1-4613-8106-8.
  2. ^ L. N. Hand and J. D. Finch, Analytical Mechanics, Cambridge University Press, England (1998). ISBN 0-5215-7572-9
  3. ^ a b c H. Goldstein, Classical Mechanics, Addidon-Wesley Publishing Company, Reading, Massachusetts (1959).
  4. ^ L.D. Landau and E.M. Lifshitz, Merchanics, Pergamon Press, London (1959).
  5. ^ J. D. Jackson, Classical Electrodynamics, John Wiley & Sons, New York (1998). ISBN 0-4713-0932-X.
  6. ^ R.P. Feynman, The Schrödinger Equation in a Classical Context: A Seminar on Superconductivity, The Feynman Lectures on Physics, Volume III, Chapter 21.
  7. ^ L.D. Landau and E.M. Lifshitz, Classical Theory of Fields, Pergamon Press, London (1959).
  8. ^ J.J. Sakurai, Advanced Quantum Mechanics, Addison-Wesley Publishing Company, Reading, Massachusetts (1967).

Litteratur[rediger | rediger kilde]

  • A. Sommerfeld, Vorlesungen über Theoretische Physik, Band I: Mechanik, Akademische Verlagsgellschaft, Leipzig (1964).