Tensor

Fra Wikipedia, den frie encyklopedi
Hopp til: navigasjon, søk
Komponentene til spenningstensoren σij angir kraften i retning i som virker på en side med normal i retning j.

En tensor er et matematisk objekt som er sentralt i lineær algebra og differensialgeometri. Tensorer og den tilsvarende tensoranalysen var av avgjørende betydning i Einsteins formulering av den generelle relativitetsteorien. Siden har denne delen av moderne matematikk forblitt en viktig del av teoretisk fysikk.

Egenskapene til tensorer kan defineres på flere forskjellige måter. De representerer en generalisering av vanlige vektorrom, men kan også betraktes som funksjoner som har vanlige vektorer som argument. Deres bruk og egenskaper ble spesielt utviklet av de italienske matematikerne Gregorio Ricci Curbastro og hans elev Tullio Levi-Civita i forbindelse med videreutviklingen av Riemann-geometri for ikke-euklidsk rom. I denne sammenhengen blir ofte tensorregning omtalt som «Ricci-kalkulus».

Matematisk definisjon[rediger | rediger kilde]

Egenskapene til en vanlig, matematisk funksjon av en variabel kan sies å tilsvare en slags innretning f hvor man kan putte inn et tall x og få ut et annet (eller det samme) tall y = f(x). Funksjonen er lineær hvis den for vilkårlige tall a og b oppfyller f(ax1 + bx2) = af(x1) + bf(x2). En funksjon F med plass til to argument kan ta imot to tall x1 og x2 og derav produsere et nytt tall y = F(x1,x2). På tilsvarende hvis kan man definere en funksjon av et vilkårlig antall variable.

Man kan definere en tensor som en slik funksjon med plass for flere variable. Men disse må være vektorer, mens funksjonverdien skal fortsatt være et tall. I tillegg må denne generaliserte funksjonen være lineær i hvert av sine argument. Argumentene for en tensor er derfor vektorer u, v, ... som tilhører et vektorrom med et visst antall basisvektorer e1, e2, ...avhengig av dimensjonen til vektorrommet. Envilkårlig vektor u kan derfor skrives som

uttrykt ved sine kontravariante komponenter uμ og når man bruker Einsteins summekonvensjon og summerer over like indekser.

I ethvert vektorrom kan man også innføre en dual basis e1, e2, .. som gjør det mulig å definere «kovektorer» a, b, ... med den generelle formen

hvor αμ er de kovariante komponentene til denne kovektoren.[1]

Vektorer og kovektorer er forbundet via det fundamentale indreproduktet

uttrykt ved Kronecker-deltaet. Disse to settene med basisvektorer står derfor på et bestemt vis vinkelrett på hverandre.[2] Det indre produktet av en vektor og en kovektor blir dermed

Denne summasjonen over en kovariant og samme kontravariante indeks er svært vanlig i tensorregning og kalles ofte for en kontraksjon. I et kartesisk koordinatsystem behøver man ikke å skille mellom vektorer og kovektorer og derfor heller ikke mellom kovariante og kontravariante vektorkomponenter da basisvektorene sammenfaller med sine duale partnere.

Tensorer av første rang[rediger | rediger kilde]

Vanligvis kalles antall argument en tensor har plass til, dens «rang». Betegner man den med symbolet A og den kan bare ha et vektorargument, vil den være av forste rang og A(u) er et tall. Siden tensoren er lineær i dette argumentet, må derfor

for vilkårlige tall a og b. Det betyr at man kan skrive

hvor tallet Aμ = A(eμ)  er en kovariant komponent til tensoren. Den kan derfor identifiseres med en kovektor og skrives som

slik at Aμ = Aeμ. Da tensoren er av rang en og gitt ved kovariante komponenter, kalles den også for en (0,1)-tensor. Alternativet er en (1,0)-tensor V som er gitt ved kontravariante komponenter og kan derfor bare ha kovektorer som argument,

Denne (1,0)-tensoren kan derfor skrives som

og er ekvivalent med en vanlig vektor med komponenter Vμ = Veμ. Kontraksjonen av denne vektoren og en (0,1)-vektor er da VA = Vμ Aμ og er en skalar størrelse, det vil si et tall.[3]

Tensorer av høyere rang[rediger | rediger kilde]

Mens tensorer av første rang oppfører seg som vektorer, vil de med høyere rang ha nye egenskaper. Er rangen lik med to, vil det være tre typer som nå kan betegnes ved (2,0), (1,1) og (0,2) avhengig av hva slags argument de tar. Kalles tensoren T og den tar to vektorargument, er

hvor nå de kovariante komponentene er Tμν = T(eμ,eν). Den er derfor en (0,2)-tensor. Hadde den derimot vært av (2,0)-typen, ville T(a,b) = aμ bν Tμν med de kontravariante komponentene Tμν = T(eμ,eν). Den tredje typen (1,1) har komponenter med en øvre og en nedre indeks. Den tar derfor en vektor og en kovektor som argument. Betegner man den igjen med samme symbol, vil da T(a,u) = aμ uν Tμν hvor nå komponentene Tμν = T(eμ,eν)  sies å være «blandet» da de har både kovariante og kontravariante indekser.

Selv om alle tensorer kan betraktes som multilinære funksjoner, er det mest vanlig i tensorregningen å angi dem ved komponentene. En (0,2)-tensor vil da betegnes ved komponentene Tμν. I dette tilfellet med rang to, kan disse så fremstilles i en vanlig matrise

Dette er for eksempel vanlig for spenningstensoren som brukes i elastisitetsteorien. Den er eksempel på en «symmetrisk tensor» hvor komponentene oppfyller Tμν = Tνμ. I det motsatte tilfellet med en «antisymmetrisk tensor» vil Tμν = - Tνμ som for Faraday-tensoren i kovariant elektrodynamikk.

På denne måten kan man definerer tensorer av stadig høyere rang. Har komponentene p kontravariante (eller øvre) indekser og q kovariante (eller nedre) indekser, er dens rang r = p + q. I generell relativitetsteori benyttes tensorer med rang opp til fire.[4] Levi-Civita-tensoren som er antisymmetrisk i alle indeksene, kan ha vilkårlig høy rang.

Koordinattransformasjoner[rediger | rediger kilde]

Tensorkomponentene er avhengige av koordinatene som benyttes på mangfoldigheten hvor vektorrommet befinner seg. Basisvektorene er tangentvektorer til koordinatlinjene, mens de duale basisvektorene er normaler til koordinatflatene.[2] Hvis man istedetfor de opprinnelige koordinatene xμ vil benytte andre koordinater xμ' = xμ'(xν), vil basisvektorene transformere som

Det betyr at de kontravariante komponentene til vektoren u = uμeμ  må transformere på den motsatt måten

for at vektoren skal forbli uforandret. Det følger fra

når man benytter at

som er Kronecker-deltaet. En vektor er dermed et «geometrisk objekt» uavhengig av koordinatene som benyttes. Det gjelder også for tensorer. På den måten finner man at komponentene til en kovektor a = aμeμ må transformere som

Samme argumentasjon kan anvendes på tensorer. Verdien de gir som funksjoner av vektorer må være uavhengig av koordinatsystemet. Ser man for eksempel på en (0,2)-tensor som gir verdien T(u,v) = uμ vν Tμν, kan dette skrives i det nye koordinatsystemet som

der de transformerte komponentene er

På samme måte vil komponentene Tμν  for en blandet (1,1)-tensor transformere som[1]

Dette gjelder også for Kronecker-deltaet δμν  som kan betraktes som en (1,1)-tensor representert ved elementene til enhetsmatrisen. De forblir uforandret under et slikt skifte av koordinater.

Kontraksjon av tensor[rediger | rediger kilde]

Hvis man i en blandet tensor som for eksempel Tμν  setter den øvre indeksen lik med den nedre indeksen, må man summere over denne slik at størrelsen Tμμ  fremkommer. Under en koordinattransformasjon vil den transformere som

og er derfor uforandret. Fra en rang to tensor har man på denne måten fått frem en skalar størrelse som dermed kan omtales som en (0,0)-tensor eller en tensor med rang null. Det er en vanlig funksjon hvis verdier er invariante under koordinattransformasjoner

Denne operasjonen er her et eksempel på en «kontraksjon» som kan utføres på alle blandete tensorer. Den reduserer rangen til den opprinnelige tensoren med to og benyttes ofte i tensorregningen.

Tensorprodukt[rediger | rediger kilde]

Under en koordinattransformasjon vil produktet uμvν  av komponentene til to vektorer u og v forandres til

Produktet transformerer som komponentene til en (2,0)-tensor som skrives som et tensorprodukt av vektorene u og v,

Med bruk av denne notasjonen kan en (2,0)-tensor T uttrykkes ved sine komponenter som

Danner man tensorproduktet mellom denne og en kovektor a = aμeμ, fremkommer en (2,1)-tensor

En generell tensor med rang r = p + q kan nå skrives som[4]

I tensorproduktet av basisvektorer tilsvarer hver av dem en åpning for et argument som er enten en vanlig vektor eller en kovektor. Gis den p kovektorer og q vektorer som argument, blir resultatet

som er et tall. Denne funksjonsverdien er nå uavhengig av hvilket koordinatsystem som benyttes for å angi komponentene til tensoren og vektorargumentene. En kontraksjon av tensoren T fremkommer ved å gi den en basisvektor sammen med en dual basisvektor i samme retning som argument. Tensorens rang r = p + q  reduseres dermed med to slik at den resulterende tensoren bare har plass til r - 2 vektorargument.

Metriske vektorrom[rediger | rediger kilde]

I de fleste anvendelser av tensorer vil de virke i vektorrom som har en metrikk gμν = eμeν. Det betyr at det eksisterer et indreprodukt mellom to vilkårlige vektorer u og v slik at

Dette skalare produktet sies å være invariant når det er uavhengig av koordinatsystemet som blir brukt. Da må gμν  være komponentene til en (0,2)-tensor som fra definisjonen er symmetrisk. Den kalles «den metriske tensoren» og har den generelle formen

Da det skalare produktet er invariant, vil gμν vν  transformere som en (0,1)-tensor. Det er derfor konsistent å definere denne ved de kovariante komponentene

slik at den opprinnelige vektoren v gir opphav til kovektoren v = vμeμ. Tilstedeværelsen av en metrikk opphever dermed det strenge skillet mellom kontravariante og kovariante komponenter for vektorer og tensorer. Man har frihet til å selv velge hvilke man vil gjøre bruk av.

Ved å betrakte sammenhengen vμ = gμνvν som en matriseligningen, kan man invertere den og finne de kontravariante komponentene fra de kovariante,

hvor matrisen med komponentene gμν  er den inverse matrisen til matrisen med de kovariante komponentene gμν.[3] Det betyr at

På denne måten kan den metriske tensoren også skrives som å de alternative formene

Likedan kan det skalare produktet mellom to vektorer uttrykkes på den ekvivalente måten

og har samme form som det tidligere produktet mellom en vektor og en kovektor. Dette nye, metriske indreproduktet er derfor konsistent med det opprinnelige.

Ved hjelp av den metriske tensoren kan man nå heve og senke indeksene til komponentene for en vilkårlig tensor. For eksempel kan de kontravariante komponentene Tμν  til en annenrangs tensor skrives som

og på tilsvarende vis for tensorer av høyere rang og med kovariante indekser.[3] Alle tensorer med rang større enn to kan nå via kontraksjon reduseres til en ny tensor med rang to mindre. For eksempel er kontraksjonen av de kontravariante tensorkomponentene Tμν  gitt ved gμνTμν = Tμμ. I generell relativitetsteori er Ricci-tensoren med rang to en kontraksjon av Riemann-tensoren som er av fjerde rang.

Tensoranalyse[rediger | rediger kilde]

En skalar funksjon φ = φ(x)  sies å være invariant under en koordinattransformasjon xμ' = xμ'(xν). Verdien til funksjonen forblir den samme i hvert punkt selv om punktet får nye koordinater slik at φ' (x') = φ(x) hvor man skriver φ'   for den samme funksjonen uttrykt i de nye koordinatene. Funksjonsverdien er den samme, mens funksjonsformen forandres. Derimot vil den partielt deriverte eller gradienten av funksjonen forandres,

men på en slik måte at den transformerer som komponentene til en kovektor. Så i dette tilfellet kan man si at derivasjon øker rangen fra null til en når den virker på en funksjon som her kan betraktes som en (0,0)-tensor. I fysikken kalles en slik funksjon for et skalarfelt.

Kovariant derivasjon[rediger | rediger kilde]

Vektorfeltet u(x) = uμ(x) eμ(x)  har kontravariante komponenter som transformerer på den vanlige måten

med en tilsvarende transformasjon av basisvektorene. Den partielt deriverte av disse vektorkomponentene får nå to bidrag,

Det første leddet transformerer på normalt vis som en (1,1)-tensor, mens det siste leddet ikke gjør det og skaper derfor en komplikasjon. Man innfører derfor en ny derivasjonsoperator ∇μ  istedetfor den vanlige partiellderiverte operator μ = ∂/∂xμ. Den er definert ved at den deriverte ∇λuμ  av komponentene til et vektorfelt skal transformere nøyaktig som en (1,1)-tensor, det vil si

Da det kompliserende leddet i den deriverte av vektorkomponenten inneholder en lineærkombinasjon av alle komponentene, vil den nye deriverte ha formen

hvor størrelsene Γμνλ  og kalles for konneksjonskoeffisienter og kan uttrykkes ved transformasjonsmatrisene mellom de to koordinatsystemene. Da vil man se at de ikke transformerer som en tensor av tredje rang, men er derimot komponentene til et geometrisk objekt som må innføres for å kunne derivere vektorer og tensorer på en veldefinert måte. Dette kalles vanligvis for «konneksjonen» for den underliggende mangfoldigheten.[4]

Den kovariante deriverte av en kovektor a(x) = aμ(x) eμ(x)  kan finnes ved å derivere kontraksjoen aμuμ, som er en skalar størrelse, mellom a og vektoren u. Da finner man at

Utfra dette kan også beregne kovariante deriverte av høyere rangs tensor. Det er da noen ganger vanlig å skrive den på den alternative måten λaμ = aμ;λ som kalles en «semikolonderivert». Det er på samme måte som at den vanlige partielderiverte ofte skrives som en «kommaderivert» λaμ = aμ,λ. For eksempel, den kovariant deriverte av en (2,0)-tensor blir nå

som utgjør komponentene til en (2,1)-tensor. Hver kovariant derivasjon øker rangen med en.

Geometrisk formulering[rediger | rediger kilde]

Kovariant derivasjon kan også defineres på en litt annen måte slik at den virker direkte på tensoren og ikke på dens enkelte komponenter. Virkningen skal være slik at derivasjonen gir en tensor av samme rang. Den kovariant deriverte av en vektor skal derfor være en ny vektor. Betegner man denne operasjonen med symbolet λ  når det virker i retning λ, skal virkningen på et produkt av to tensorer R og S oppfylle «Leibniz' lov»

som er et vanlig krav til all derivasjon. Når den virker på en skalar funksjon f(x), har den samme effekt som vanlig partiell derivasjon. Med en tensor T(x) er da

Når man skriver en vektor u uttykt ved sine komponenter som u = uμeμ , vil disse nå opptre som skalare funksjoner, mens det er basisvektorene eμ som gir dette geometriske objektet vektorkarakter. Den kovariante deriverte av denne vektoren vil da ha formen

Overensstemmelse med den forrige definisjonen av den kovariante deriverte fåes nå ved å innføre konneksjonskoeffisientene ved den fundamentale forbindelsen

Derved blir

når man bytter om summasjonsindeksene μ og ν i det siste leddet. Uttrykt ved den tidligere deriverte, er derfor nå

På samme måte kan man nå finne den deriverte av kontravariante tensorer av høyere rang.

Ved å ta den kovariante deriverte av den fundamentale kontraksjonen , finner man at

Den deriverte av en kovektor blir derfor

mens den kovariant deriverte av en blandet tensor av andre rang blir

På denne måten kan den kovariant deriverte av en tensor med vilkårlig høy rang beregnes.

Levi-Civita-konneksjonen[rediger | rediger kilde]

Når den underliggende mangfoldigheten har en metrikk, kan kontravariante komponenter av en tensor beregnes direkte fra de kovariante og omvendt. Dette vil ha konsekvenser for hva slags konneksjonskoeffisienter som kan benyttes ved kovariant derivasjon. Betrakter man igjen en tensor av rang to, vil da

som betyr at

I dette tilfellet må derfor den kovariante deriverte kommutere med metrikken, det vil si

Denne betingelsen er ikke nok til å bestemme konneksjonskoeffisientene. Men eksistensen av en metrikk tilsier vanlivis at den underliggende geometrien til mangfoldigheten er Riemannsk. Det betyr igjen at konneksjonskoeffisientene er symmetriske i de to nedre indeksene, Γμσρ = Γμρσ. Når disse kravene er oppfylt, har man en Levi-Civita-konneksjon.[1] Den følger nå fra å skrive ut den kovariante deriverte av metrikken,

hvor den partiellderiverte er skrevet som en kommaderivasjon. Benytter man de to andre ligningene som følger ved syklisk ombytte av indeksene, følger så at

Uttrykket på høyre side kalles et Christoffel-symbol og ble først innført i forbindelse med beregning av den Riemannske krumningstensoren.

Referanser[rediger | rediger kilde]

  1. ^ a b c G.E. Hay, Vector and Tensor Analysis, Dover Publications, New York (1953). ISBN 0-486-60109-9.
  2. ^ a b M. R. Spiegel, Vector Analysis, Schaum's Outline Series, New York, (1959).
  3. ^ a b c A.J. McConnell, Applications of Tensor Analysis, Dover Publications, New York (1957). ISBN 0-486-60373-3.
  4. ^ a b c C.W. Misner, K.S. Thorne and J.A. Wheeler, Gravitation, W. H. Freeman, San Francisco (1973). ISBN 0-7167-0344-0.

Eksterne lenker[rediger | rediger kilde]