Tensor

En tensor er et matematisk objekt som er sentralt i lineær algebra og differensialgeometri. Tensorer og den tilsvarende tensoranalysen var av avgjørende betydning i Einsteins formulering av den generelle relativitetsteorien. Siden har denne delen av moderne matematikk forblitt en viktig del av teoretisk fysikk.

Egenskapene til tensorer kan defineres på flere forskjellige måter. De representerer en generalisering av vanlige vektorrom, men kan også betraktes som funksjoner som har vanlige vektorer som argument. Deres bruk og egenskaper ble spesielt utviklet av de italienske matematikerne Gregorio Ricci Curbastro og hans elev Tullio Levi-Civita i forbindelse med videreutviklingen av Riemannsk geometri for ikke-euklidsk rom. I denne sammenhengen blir ofte tensorregning omtalt som «Ricci-kalkulus».

Matematisk definisjon[rediger | rediger kilde]

Egenskapene til en vanlig, matematisk funksjon av en variabel kan sies å tilsvare en slags innretning f hvor man kan putte inn et tall x og få ut et annet (eller det samme) tall y = f(x). Funksjonen er lineær hvis den for vilkårlige tall a og b oppfyller f(ax₁ + bx₂) = af(x₁) + bf(x₂). En funksjon F med plass til to argument kan ta imot to tall x₁ og x₂ og derav produsere et nytt tall y = F(x₁,x₂). På tilsvarende vis kan man definere en funksjon av et vilkårlig antall variable.

Man kan definere en tensor som en slik funksjon med plass for flere variable. Men disse må være vektorer, mens funksjonverdien skal fortsatt være et tall. I tillegg må denne generaliserte funksjonen være lineær i hvert av sine argument. Argumentene for en tensor er derfor vektorer u, v, ... som tilhører et vektorrom med et visst antall basisvektorer e₁, e₂, ...avhengig av dimensjonen til vektorrommet. En vilkårlig vektor u kan derfor skrives som

\mathbf {u} =u^{\mu }\mathbf {e} _{\mu }=u^{1}\mathbf {e} _{1}+u^{2}\mathbf {e} _{2}+\dots

uttrykt ved sine kontravariante komponenter u^μ og når man bruker Einsteins summekonvensjon og summerer over like indekser.

I ethvert vektorrom kan man også innføre en dual basis e¹, e², .. som gjør det mulig å definere «kovektorer» a, b, ... med den generelle formen

\mathbf {a} =a_{\mu }\mathbf {e} ^{\mu }=a_{1}\mathbf {e} ^{1}+a_{2}\mathbf {e} ^{2}+\dots

hvor α_μ er de kovariante komponentene til denne kovektoren.^[1]

Vektorer og kovektorer er forbundet via det fundamentale indreproduktet

\mathbf {e} ^{\mu }\cdot \mathbf {e} _{\nu }=\delta _{\;\nu }^{\mu }

uttrykt ved Kronecker-deltaet. Disse to settene med basisvektorer står derfor på et bestemt vis vinkelrett på hverandre.^[2] Det indre produktet av en vektor og en kovektor blir dermed

\mathbf {u} \cdot \mathbf {a} =\mathbf {a} \cdot \mathbf {u} =a_{\mu }\mathbf {e} ^{\mu }\cdot u^{\nu }\mathbf {e} _{\nu }=a_{\mu }\delta _{\;\nu }^{\mu }u^{\nu }=a_{\mu }u^{\mu }

Denne summasjonen over en kovariant og samme kontravariante indeks er svært vanlig i tensorregning og kalles ofte for en kontraksjon. I et kartesisk koordinatsystem behøver man ikke å skille mellom vektorer og kovektorer og derfor heller ikke mellom kovariante og kontravariante vektorkomponenter da basisvektorene sammenfaller med sine duale partnere.

Tensorer av første rang[rediger | rediger kilde]

Vanligvis kalles antall argument en tensor har plass til, dens «rang». Betegner man den med symbolet A og den kan bare ha et vektorargument, vil den være av første rang og A(u) er et tall. Siden tensoren er lineær i dette argumentet, må derfor

\mathbf {A} (a\mathbf {u} +b\mathbf {v} )=a\mathbf {A} (\mathbf {u} )+b\mathbf {A} (\mathbf {v} )

for vilkårlige tall a og b. Det betyr at man kan skrive

\mathbf {A} (\mathbf {u} )=\mathbf {A} (u^{\mu }\mathbf {e} _{\mu })=u^{\mu }\mathbf {A} (\mathbf {e} _{\mu })=u^{\mu }A_{\mu }

hvor tallet A_μ = A(e_μ) er en kovariant komponent til tensoren. Den kan derfor identifiseres med en kovektor og skrives som

\mathbf {A} =A_{\mu }\mathbf {e} ^{\mu }

slik at A_μ = A⋅e_μ. Da tensoren er av rang en og gitt ved kovariante komponenter, kalles den også for en (0,1)-tensor. Alternativet er en (1,0)-tensor V som er gitt ved kontravariante komponenter og kan derfor bare ha kovektorer som argument,

\mathbf {V} (\mathbf {a} )=\mathbf {V} (a_{\mu }\mathbf {e} ^{\mu })=a_{\mu }\mathbf {V} (\mathbf {e} ^{\mu })=a_{\mu }V^{\mu }

Denne (1,0)-tensoren kan derfor skrives som

\mathbf {V} =V^{\mu }\mathbf {e} _{\mu }

og er ekvivalent med en vanlig vektor med komponenter V^μ = V⋅e^μ. Kontraksjonen av denne vektoren og en (0,1)-vektor er da V⋅A = V^μ A_μ og er en skalar størrelse, det vil si et tall.^[3]

Tensorer av høyere rang[rediger | rediger kilde]

Mens tensorer av første rang oppfører seg som vektorer, vil de med høyere rang ha nye egenskaper. Er rangen lik med to, vil det være tre typer som nå kan betegnes ved (2,0), (1,1) og (0,2) avhengig av hva slags argument de tar. Kalles tensoren T og den tar to vektorargument, er

\mathbf {T} (\mathbf {u} ,\mathbf {v} )=\mathbf {T} (u^{\mu }\mathbf {e} _{\mu },v^{\nu }\mathbf {e} _{\nu })=u^{\mu }v^{\nu }\mathbf {T} (\mathbf {e} _{\mu },\mathbf {e} _{\nu })=u^{\mu }v^{\nu }T_{\mu \nu }

hvor nå de kovariante komponentene er T_μν = T(e_μ,e_ν). Den er derfor en (0,2)-tensor. Hadde den derimot vært av (2,0)-typen, ville T(a,b) = a_μ b_ν T^μν med de kontravariante komponentene T^μν = T(e^μ,e^ν). Den tredje typen (1,1) har komponenter med en øvre og en nedre indeks. Den tar derfor en vektor og en kovektor som argument. Betegner man den igjen med samme symbol, vil da T(a,u) = a_μ u^ν T^μ_ν hvor nå komponentene T^μ_ν = T(e^μ,e_ν) sies å være «blandet» da de har både kovariante og kontravariante indekser.

Selv om alle tensorer kan betraktes som multilinære funksjoner, er det mest vanlig i tensorregningen å angi dem ved komponentene. En (0,2)-tensor vil da betegnes ved komponentene T_μν. I dette tilfellet med rang to, kan disse så fremstilles i en vanlig matrise

T={\begin{bmatrix}T_{11}&T_{12}&\cdots \\T_{21}&T_{22}&\cdots \\\vdots &\vdots &\ddots \\\end{bmatrix}}

Dette er for eksempel vanlig for spenningstensoren som brukes i elastisitetsteorien. Den er eksempel på en «symmetrisk tensor» hvor komponentene oppfyller T_μν = T_νμ. I det motsatte tilfellet med en «antisymmetrisk tensor» vil T_μν = - T_νμ som for Faraday-tensoren i kovariant elektrodynamikk.

På denne måten kan man definere tensorer av stadig høyere rang. Har komponentene p kontravariante (eller øvre) indekser og q kovariante (eller nedre) indekser, er dens rang r = p + q. På samme måte som at vektorer adderes sammen og at kovektorer kan legges sammen, kan også tensorer adderes sammen når de har de samme verdier for p og q. Er for eksempel R og S to kovariante tensorer med rang to og komponenter R_μν og S_μν, så er komponentene til den nye tensoreren T = R + S gitt ved den normale summen T_μν = R_μν + S_μν.

Bruken av tensorer ble viktig i forbindelse med Einsteins spesielle og generelle relativitetsteori. I disse beskrives elektromagnetiske felt ved den antisymmetriske Faraday-tensoren som har rang to, mens tyngdekraften skyldes at masser gir tidrommet en ikke-euklidsk geometri beskrevet ved en krumningstensor av fjerde rang. Levi-Civita-tensoren som er antisymmetrisk i alle indeksene, kan ha vilkårlig høy rang.^[4]

Koordinattransformasjoner[rediger | rediger kilde]

Tensorkomponentene er avhengige av koordinatene som benyttes på mangfoldigheten hvor vektorrommet befinner seg. Basisvektorene er tangentvektorer til koordinatlinjene, mens de duale basisvektorene er normaler til koordinatflatene.^[2] Hvis man i stedet for de opprinnelige koordinatene x^μ vil benytte andre koordinater x^μ' = x^μ' (x^ν ), vil basisvektorene transformere som

\mathbf {e} _{\nu }={\partial x^{\mu '} \over \partial x^{\nu }}\mathbf {e} _{\mu '},\;\;\;\mathbf {e} ^{\mu }={\partial x^{\mu } \over \partial x^{\nu '}}\mathbf {e} ^{\nu '}

Det betyr at de kontravariante komponentene til vektoren u = u^μ e_μ må transformere på den motsatt måten

u^{\mu }={\partial x^{\mu } \over \partial x^{\nu '}}u^{\nu '}

for at vektoren skal forbli uforandret. Det følger fra

\mathbf {u} =u^{\mu }\mathbf {e} _{\mu }={\partial x^{\mu } \over \partial x^{\nu '}}{\partial x^{\mu '} \over \partial x^{\mu }}u^{\nu '}\mathbf {e} _{\mu '}=u^{\mu '}\mathbf {e} _{\mu '}

når man benytter at

{\partial x^{\mu } \over \partial x^{\nu '}}{\partial x^{\mu '} \over \partial x^{\mu }}={\partial x^{\mu '} \over \partial x^{\nu '}}=\delta _{\;\nu '}^{\mu '}

som er Kronecker-deltaet. En vektor er dermed et «geometrisk objekt» uavhengig av koordinatene som benyttes. Det gjelder også for tensorer. På den måten finner man at komponentene til en kovektor a = a_μ e^μ må transformere som

a_{\mu }={\partial x^{\nu '} \over \partial x^{\mu }}a_{\nu '}

Samme argumentasjon kan anvendes på tensorer. Verdien de gir som funksjoner av vektorer må være uavhengig av koordinatsystemet. Ser man for eksempel på en (0,2)-tensor som gir verdien T(u,v) = u^μ v^ν T_μν , kan dette skrives i det nye koordinatsystemet som

u^{\mu }v^{\nu }T_{\mu \nu }={\partial x^{\mu } \over \partial x^{\mu '}}{\partial x^{\nu } \over \partial x^{\nu '}}u^{\mu '}v^{\nu '}T_{\mu \nu }=u^{\mu '}v^{\nu '}T_{\mu '\nu '}

der de transformerte komponentene er

T_{\mu '\nu '}={\partial x^{\mu } \over \partial x^{\mu '}}{\partial x^{\nu } \over \partial x^{\nu '}}T_{\mu \nu }

På samme måte vil komponentene T^μ_ν for en blandet (1,1)-tensor transformere som^[1]

T_{\;\;\nu '}^{\mu '}={\partial x^{\mu '} \over \partial x^{\mu }}{\partial x^{\nu } \over \partial x^{\nu '}}T_{\;\;\nu }^{\mu }

Dette gjelder også for Kronecker-deltaet δ^μ_ν som kan betraktes som en (1,1)-tensor representert ved elementene til enhetsmatrisen. De forblir uforandret under et slikt skifte av koordinater.

Kontraksjon av tensor[rediger | rediger kilde]

Hvis man i en blandet tensor som for eksempel T^μ_ν setter den øvre indeksen lik med den nedre indeksen, må man summere over denne slik at størrelsen T^μ_μ fremkommer. Under en koordinattransformasjon vil den transformere som

T_{\;\;\mu '}^{\mu '}={\partial x^{\mu '} \over \partial x^{\mu }}{\partial x^{\nu } \over \partial x^{\mu '}}T_{\;\;\nu }^{\mu }={\partial x^{\nu } \over \partial x^{\mu }}T_{\;\;\nu }^{\mu }=\delta _{\;\mu }^{\nu }T_{\;\;\nu }^{\mu }=T_{\;\;\mu }^{\mu }

og er derfor uforandret. Fra en rang to tensor har man på denne måten fått frem en skalar størrelse som dermed kan omtales som en (0,0)-tensor eller en tensor med rang null. Det er en vanlig funksjon hvis verdier er invariante under koordinattransformasjoner

Denne operasjonen er her et eksempel på en «kontraksjon» som kan utføres på alle blandete tensorer. Den reduserer rangen til den opprinnelige tensoren med to og benyttes ofte i tensorregningen.

Tensorprodukt[rediger | rediger kilde]

Under en koordinattransformasjon vil produktet u^μv^ν av komponentene til to vektorer u og v forandres til

u^{\mu }v^{\nu }={\partial x^{\mu } \over \partial x^{\mu '}}{\partial x^{\nu } \over \partial x^{\nu '}}u^{\mu '}v^{\nu '}

Produktet transformerer som komponentene til en (2,0)-tensor som skrives som et tensorprodukt av vektorene u og v,

\mathbf {u} \otimes \mathbf {v} =u^{\mu }v^{\nu }\mathbf {e} _{\mu }\otimes \mathbf {e} _{\nu }

Med bruk av denne notasjonen kan en (2,0)-tensor T uttrykkes ved sine komponenter som

\mathbf {T} =T^{\mu \nu }\mathbf {e} _{\mu }\otimes \mathbf {e} _{\nu }

Danner man tensorproduktet mellom denne og en kovektor a = a_μ e^μ, fremkommer en (2,1)-tensor

\mathbf {T} \otimes \mathbf {a} =T^{\mu \nu }a_{\lambda }\mathbf {e} _{\mu }\otimes \mathbf {e} _{\nu }\otimes \mathbf {e} ^{\lambda }

En generell tensor med rang r = p + q kan nå skrives som^[4]

\mathbf {T} =T_{\nu _{1}\nu _{2}\dots \nu _{q}}^{\mu _{1}\mu _{2}\dots \mu _{p}}\mathbf {e} _{\mu _{1}}\otimes \mathbf {e} _{\mu _{2}}\otimes \cdots \otimes \mathbf {e} _{\mu _{p}}\otimes \mathbf {e} ^{\nu _{1}}\otimes \mathbf {e} ^{\nu _{2}}\otimes \cdots \otimes \mathbf {e} ^{\nu _{q}}

I tensorproduktet av basisvektorer tilsvarer hver av dem en åpning for et argument som er enten en vanlig vektor eller en kovektor. Gis den p kovektorer og q vektorer som argument, blir resultatet

\mathbf {T} (\mathbf {a} ,\mathbf {b} ,\cdots ,\mathbf {c} ,\mathbf {u} ,\mathbf {v} ,\cdots ,\mathbf {w} )=T_{\nu _{1}\nu _{2}\dots \nu _{q}}^{\mu _{1}\mu _{2}\dots \mu _{p}}a_{\mu _{1}}b_{\mu _{2}}\cdots a_{\mu _{p}}u^{\nu _{1}}v^{\nu _{2}}\cdots w^{\nu _{q}}

som er et tall. Denne funksjonsverdien er nå uavhengig av hvilket koordinatsystem som benyttes for å angi komponentene til tensoren og vektorargumentene. En kontraksjon av tensoren T fremkommer ved å gi den en basisvektor sammen med en dual basisvektor i samme retning som argument. Tensorens rang r = p + q reduseres dermed med to slik at den resulterende tensoren bare har plass til r - 2 vektorargument.

Metriske vektorrom[rediger | rediger kilde]

I de fleste anvendelser av tensorer vil de virke i vektorrom som har en metrikk g_μν = e_μ⋅e_ν. Det betyr at det eksisterer et indreprodukt mellom to vilkårlige vektorer u og v slik at

\mathbf {u} \cdot \mathbf {v} =g_{\mu \nu }u^{\mu }v^{\nu }

Dette skalare produktet sies å være invariant når det er uavhengig av koordinatsystemet som blir brukt. Da må g_μν være komponentene til en (0,2)-tensor som fra definisjonen er symmetrisk. Den kalles «den metriske tensoren» og har den generelle formen

\mathbf {g} =g_{\mu \nu }\mathbf {e} ^{\mu }\otimes \mathbf {e} ^{\nu }

Da det skalare produktet er invariant, vil g_μν v^ν transformere som en (0,1)-tensor. Det er derfor konsistent å definere denne ved de kovariante komponentene

v_{\mu }=g_{\mu \nu }v^{\nu }

slik at den opprinnelige vektoren v gir opphav til kovektoren v = v_μ e^μ. Tilstedeværelsen av en metrikk opphever dermed det strenge skillet mellom kontravariante og kovariante komponenter for vektorer og tensorer. Man har frihet til å selv velge hvilke man vil gjøre bruk av.

Ved å betrakte sammenhengen v_μ = g_μνv^ν som en matriseligningen, kan man invertere den og finne de kontravariante komponentene fra de kovariante,

v^{\mu }=g^{\mu \nu }v_{\nu }

hvor matrisen med komponentene g^μν er den inverse matrisen til matrisen med de kovariante komponentene g_μν.^[3] Det betyr at

g^{\mu \nu }g_{\nu \lambda }=\delta _{\;\lambda }^{\mu }

På denne måten kan den metriske tensoren også skrives som å de alternative formene

\mathbf {g} =g^{\mu \nu }\mathbf {e} _{\mu }\otimes \mathbf {e} _{\nu }=\mathbf {e} _{\mu }\otimes \mathbf {e} ^{\mu }

Likedan kan det skalare produktet mellom to vektorer uttrykkes på den ekvivalente måten

\mathbf {u} \cdot \mathbf {v} =u^{\mu }v_{\nu }

og har samme form som det tidligere produktet mellom en vektor og en kovektor. Dette nye, metriske indreproduktet er derfor konsistent med det opprinnelige.

Ved hjelp av den metriske tensoren kan man nå heve og senke indeksene til komponentene for en vilkårlig tensor. For eksempel kan de kontravariante komponentene T^μν til en annenrangs tensor skrives som

T^{\mu \nu }=g^{\mu \rho }g^{\nu \sigma }T_{\rho \sigma }

og på tilsvarende vis for tensorer av høyere rang og med kovariante indekser.^[3] Alle tensorer med rang større enn to kan nå via kontraksjon reduseres til en ny tensor med rang to mindre. For eksempel er kontraksjonen av de kontravariante tensorkomponentene T^μν gitt ved g_μνT^μν = T^μ_μ. I generell relativitetsteori er Ricci-tensoren med rang to en kontraksjon av Riemanns krumningstensor som er av fjerde rang.

Tensoranalyse[rediger | rediger kilde]

En skalar funksjon φ = φ(x) sies å være invariant under en koordinattransformasjon x^μ' = x^μ' (x^ν ). Verdien til funksjonen forblir den samme i hvert punkt selv om punktet får nye koordinater slik at φ' (x') = φ(x) hvor man skriver φ' for den samme funksjonen uttrykt i de nye koordinatene. Funksjonsverdien er den samme, mens funksjonsformen forandres. Derimot vil den partielt deriverte eller gradienten av funksjonen forandres,

{\partial \phi (x) \over \partial x^{\lambda }}={\partial x^{\mu '} \over \partial x^{\lambda }}{\partial \phi '(x') \over \partial x^{\mu '}}

men på en slik måte at den transformerer som komponentene til en kovektor. Så i dette tilfellet kan man si at derivasjon øker rangen fra null til en når den virker på en funksjon som her kan betraktes som en (0,0)-tensor. I fysikken kalles en slik funksjon for et skalarfelt.

Kovariant derivasjon[rediger | rediger kilde]

Vektorfeltet u(x) = u^μ(x) e_μ(x) har kontravariante komponenter som transformerer på den vanlige måten

u^{\mu }(x)={\partial x^{\mu } \over \partial x^{\nu '}}u^{\nu '}(x')

med en tilsvarende transformasjon av basisvektorene. Den partielt deriverte av disse vektorkomponentene får nå to bidrag,

{\partial u^{\mu } \over \partial x^{\lambda }}={\partial x^{\mu } \over \partial x^{\nu '}}{\partial x^{\mu '} \over \partial x^{\lambda }}{\partial u^{\nu '} \over \partial x^{\mu '}}+{\partial ^{2}x^{\mu } \over \partial x^{\nu '}\partial x^{\mu '}}{\partial x^{\mu '} \over \partial x^{\lambda }}u^{\nu '}

Det første leddet transformerer på normalt vis som en (1,1)-tensor, mens det siste leddet ikke gjør det og skaper derfor en komplikasjon. Man innfører derfor en ny derivasjonsoperator ∇_μ i stedet for den vanlige partiellderiverte operator ∂_μ = ∂/∂x^μ. Den er definert ved at den deriverte ∇_λu^μ av komponentene til et vektorfelt skal transformere nøyaktig som en (1,1)-tensor, det vil si

\nabla _{\lambda }u^{\mu }(x)={\partial x^{\mu } \over \partial x^{\nu '}}{\partial x^{\mu '} \over \partial x^{\lambda }}\nabla _{\mu '}u^{\nu '}(x')

Da det kompliserende leddet i den deriverte av vektorkomponenten inneholder en lineærkombinasjon av alle komponentene, vil den nye deriverte ha formen

\nabla _{\lambda }u^{\mu }=\partial _{\lambda }u^{\mu }+u^{\nu }\Gamma _{\;\nu \lambda }^{\mu }

hvor størrelsene Γ^μ_νλ og kalles for konneksjonskoeffisienter og kan uttrykkes ved transformasjonsmatrisene mellom de to koordinatsystemene. Da vil man se at de ikke transformerer som en tensor av tredje rang, men er derimot komponentene til et geometrisk objekt som må innføres for å kunne derivere vektorer og tensorer på en veldefinert måte. Dette kalles vanligvis for «konneksjonen» for den underliggende mangfoldigheten.^[4]

Den kovariante deriverte av en kovektor a(x) = a_μ(x) e^μ(x) kan finnes ved å derivere kontraksjoen a_μu^μ , som er en skalar størrelse, mellom a og vektoren u. Da finner man at

\nabla _{\lambda }a_{\mu }=\partial _{\lambda }a_{\mu }-a_{\nu }\Gamma _{\;\mu \lambda }^{\nu }

Utfra dette kan også beregne kovariante deriverte av høyere rangs tensor. Det er da noen ganger vanlig å skrive den på den alternative måten ∇_λa_μ = a_μ;λ som kalles en «semikolonderivert». Det er på samme måte som at den vanlige partielderiverte ofte skrives som en «kommaderivert» ∂_λa_μ = a_μ,λ. For eksempel, den kovariant deriverte av en (2,0)-tensor blir nå

T_{\;\;\;;\lambda }^{\mu \nu }=\nabla _{\lambda }T^{\mu \nu }=\partial _{\lambda }T^{\mu \nu }+T^{\mu \rho }\Gamma _{\;\rho \lambda }^{\nu }+T^{\sigma \nu }\Gamma _{\;\sigma \lambda }^{\mu }

som utgjør komponentene til en (2,1)-tensor. Hver kovariant derivasjon øker rangen med en.

Geometrisk formulering[rediger | rediger kilde]

Kovariant derivasjon kan også defineres på en litt annen måte slik at den virker direkte på tensoren og ikke på dens enkelte komponenter. Virkningen skal være slik at derivasjonen gir en tensor av samme rang. Den kovariant deriverte av en vektor skal derfor være en ny vektor. Betegner man denne operasjonen med symbolet ∇_λ når det virker i retning λ, skal virkningen på et produkt av to tensorer R og S oppfylle «Leibniz' lov»

{\boldsymbol {\nabla }}_{\lambda }(\mathbf {R} \otimes \mathbf {S} )=({\boldsymbol {\nabla }}_{\lambda }\mathbf {R} )\otimes \mathbf {S} +\mathbf {R} \otimes ({\boldsymbol {\nabla }}_{\lambda }\mathbf {S} )

som er et vanlig krav til all derivasjon. Når den virker på en skalar funksjon f(x), har den samme effekt som vanlig partiell derivasjon. Med en tensor T(x) er da

{\boldsymbol {\nabla }}_{\lambda }(f\mathbf {T} )=(\partial _{\lambda }f)\mathbf {T} +f({\boldsymbol {\nabla }}_{\lambda }\mathbf {T} )

Når man skriver en vektor u uttrykt ved sine komponenter som u = u^μ e_μ , vil disse nå opptre som skalare funksjoner, mens det er basisvektorene e_μ som gir dette geometriske objektet vektorkarakter. Den kovariante deriverte av denne vektoren vil da ha formen

{\boldsymbol {\nabla }}_{\lambda }\mathbf {u} =(\partial _{\lambda }u^{\mu })\mathbf {e} _{\mu }+u^{\mu }({\boldsymbol {\nabla }}_{\lambda }\mathbf {e} _{\mu })

Overensstemmelse med den forrige definisjonen av den kovariante deriverte fås nå ved å innføre konneksjonskoeffisientene ved den fundamentale forbindelsen

{\boldsymbol {\nabla }}_{\lambda }\mathbf {e} _{\mu }=\mathbf {e} _{\nu }\Gamma _{\;\mu \lambda }^{\nu }

Derved blir

{\boldsymbol {\nabla }}_{\lambda }\mathbf {u} =(\partial _{\lambda }u^{\mu })\mathbf {e} _{\mu }+u^{\mu }\mathbf {e} _{\nu }\Gamma _{\;\mu \lambda }^{\nu }=(\partial _{\lambda }u^{\mu }+u^{\nu }\Gamma _{\;\nu \lambda }^{\mu })\mathbf {e} _{\mu }

når man bytter om summasjonsindeksene μ og ν i det siste leddet. Uttrykt ved den tidligere deriverte, er derfor nå

{\boldsymbol {\nabla }}_{\lambda }\mathbf {u} =({\boldsymbol {\nabla }}_{\lambda }\mathbf {u} )^{\mu }\mathbf {e} _{\mu }=(\nabla _{\lambda }u^{\mu })\mathbf {e} _{\mu }

På samme måte kan man nå finne den deriverte av kontravariante tensorer av høyere rang.

Ved å ta den kovariante deriverte av den fundamentale kontraksjonen $\mathbf {e} ^{\mu }\cdot \mathbf {e} _{\nu }=\delta _{\;\nu }^{\mu }$ , finner man at

{\boldsymbol {\nabla }}_{\lambda }\mathbf {e} ^{\mu }=-\mathbf {e} ^{\nu }\Gamma _{\;\nu \lambda }^{\mu }

Den deriverte av en kovektor blir derfor

{\boldsymbol {\nabla }}_{\lambda }\mathbf {a} ={\boldsymbol {\nabla }}_{\lambda }(a_{\mu }\mathbf {e} ^{\mu })=(\partial _{\lambda }a_{\mu }-a_{\nu }\Gamma _{\;\mu \lambda }^{\nu })\mathbf {e} ^{\mu }=(\nabla _{\lambda }a_{\mu })\mathbf {e} ^{\mu },

mens den kovariant deriverte av en blandet tensor av andre rang blir

{\begin{aligned}{\boldsymbol {\nabla }}_{\lambda }\mathbf {T} &={\boldsymbol {\nabla }}_{\lambda }(T_{\;\;\nu }^{\mu }\mathbf {e} _{\mu }\otimes \mathbf {e} ^{\nu })=(\partial _{\lambda }T_{\;\;\nu }^{\mu })\mathbf {e} _{\mu }\otimes \mathbf {e} ^{\nu }+T_{\;\;\nu }^{\mu }({\boldsymbol {\nabla }}_{\lambda }\mathbf {e} _{\mu })\otimes \mathbf {e} ^{\nu }+T_{\;\;\nu }^{\mu }\mathbf {e} _{\mu }\otimes ({\boldsymbol {\nabla }}_{\lambda }\mathbf {e} ^{\nu })\\&=(\partial _{\lambda }T_{\;\;\nu }^{\mu }+T_{\;\;\nu }^{\sigma }\Gamma _{\;\sigma \lambda }^{\mu }-T_{\;\;\rho }^{\mu }\Gamma _{\;\nu \lambda }^{\rho })\mathbf {e} _{\mu }\otimes \mathbf {e} ^{\nu }\\&=({\boldsymbol {\nabla }}_{\lambda }\mathbf {T} )_{\;\;\nu }^{\mu }\,\mathbf {e} _{\mu }\otimes \mathbf {e} ^{\nu }=(\nabla _{\lambda }T_{\;\;\nu }^{\mu })\,\mathbf {e} _{\mu }\otimes \mathbf {e} ^{\nu }\end{aligned}}

På denne måten kan den kovariant deriverte av en tensor med vilkårlig høy rang beregnes.

Levi-Civita-konneksjonen[rediger | rediger kilde]

Når den underliggende mangfoldigheten har en metrikk, kan kontravariante komponenter av en tensor beregnes direkte fra de kovariante og omvendt. Dette vil ha konsekvenser for hva slags konneksjonskoeffisienter som kan benyttes ved kovariant derivasjon. Betrakter man igjen en tensor av rang to, vil da

{\boldsymbol {\nabla }}_{\lambda }\mathbf {T} =(\nabla _{\lambda }T_{\;\;\sigma }^{\rho })\,\mathbf {e} _{\rho }\otimes \mathbf {e} ^{\sigma }=(\nabla _{\lambda }T^{\rho \nu })\,\mathbf {e} _{\rho }\otimes \mathbf {e} _{\nu }

som betyr at

\nabla _{\lambda }T_{\;\;\sigma }^{\rho }=\nabla _{\lambda }(g_{\sigma \nu }T^{\rho \nu })=g_{\sigma \nu }\nabla _{\lambda }T^{\rho \nu }

I dette tilfellet må derfor den kovariante deriverte kommutere med metrikken, det vil si

\nabla _{\lambda }g_{\sigma \nu }=0

Denne betingelsen er ikke nok til å bestemme konneksjonskoeffisientene. Men eksistensen av en metrikk tilsier vanligvis at den underliggende geometrien til mangfoldigheten er riemannsk. Det betyr igjen at konneksjonskoeffisientene er symmetriske i de to nedre indeksene, Γ^μ_σρ = Γ^μ_ρσ . Når disse kravene er oppfylt, har man en Levi-Civita-konneksjon.^[1] Den følger nå fra å skrive ut den kovariante deriverte av metrikken,

\nabla _{\lambda }g_{\sigma \nu }=g_{\sigma \nu ,\lambda }-g_{\sigma \mu }\Gamma _{\;\nu \lambda }^{\mu }-g_{\rho \nu }\Gamma _{\;\sigma \lambda }^{\rho }

hvor den partiellderiverte er skrevet som en kommaderivasjon. Benytter man de to andre ligningene som følger ved syklisk ombytte av indeksene, følger så at Γ^λ_μν = g^λσ Γ_σμν hvor

\Gamma _{\sigma \mu \nu }={1 \over 2}{\Big (}g_{\sigma \mu ,\nu }+g_{\sigma \nu ,\mu }-g_{\mu \nu ,\sigma }{\Big )}

kalles et Christoffel-symbol av første sort. Tilsvarende er Γ^λ_μν et slikt symbol av andre sort. De er begge symmetriske i de to siste indeksene og ble først innført i forbindelse med beregning av Riemanns krumningstensor som dermed lot seg gjøre å skrive på en mer kompakt måte.

Kovariant divergens[rediger | rediger kilde]

Divergensen av en vektor u er en skalar størrelse som i tensoranalysen er definert som kontraksjonen til den kovariante deriverte til vektoren,

{\boldsymbol {\nabla }}\cdot \mathbf {u} =\nabla _{\mu }u^{\mu }=u_{\;;\mu }^{\mu }=\partial _{\mu }u^{\mu }+u^{\lambda }\Gamma _{\;\;\lambda \mu }^{\mu }

Fra definisjonen av dette Christoffel-symbolet ser man at de to siste leddene kansellerer da metrikken er symmetrisk. Dermed blir det

\Gamma _{\;\;\lambda \mu }^{\mu }={1 \over 2}g^{\mu \nu }g_{\mu \nu ,\lambda }

Dette kan forenkles ytterligere ved å benytte at de kontravariante komponentene g^μν er definert å være elementene i en matrise som er invers til matrisen med komponentene g_μν. Determinanten til denne matrisen kan skrives som

g=\det(g_{\mu \nu })=\sum _{\nu }g_{\mu \nu }\gamma ^{\mu \nu }

hvor γ^μν er kofaktoren til elementet g_μν. Her er indeksen μ vilkårlig, men skal ikke summeres over. Sammenlignes denne summen med definisjonen av g^μν, ser man at

\gamma ^{\mu \nu }={\partial g \over \partial g_{\mu \nu }}=gg^{\mu \nu }

Dermed er

\partial _{\lambda }g={\partial g \over \partial g_{\mu \nu }}g_{\mu \nu ,\lambda }=gg^{\mu \nu }g_{\mu \nu ,\lambda }

slik at

\Gamma _{\;\;\lambda \mu }^{\mu }={1 \over 2g}\partial _{\lambda }g={1 \over 2}{\partial \ln g \over \partial x^{\lambda }}=(\ln {\sqrt {g}})_{,\lambda }

Benyttes nå dette resultatet i divergensen, tar denne den mer kompakte formen^[2]

\nabla _{\lambda }u^{\lambda }=\partial _{\lambda }u^{\lambda }+u^{\lambda }(\ln {\sqrt {g}})_{,\lambda }={1 \over {\sqrt {g}}}\partial _{\mu }({\sqrt {g}}u^{\mu })

Når metrikken g_μν er diagonal, er dette i overensstemmelse med hva som kommer frem ved en tilsvarende beregning i krumlinjete koordinater.

Laplace-operatoren[rediger | rediger kilde]

Laplace-operatoren ∇² er definert som divergensen til gradienten til en skalar funksjon. Kalles denne Φ(x), er gradienten gitt ved kovektoren u = e^μ∂_μΦ som har de kontravariante komponentene u^λ = g^λμ∂_μΦ. Dermed tar Laplace-operatoren i tensoranalysen den generelle formen

\nabla ^{2}\Phi =\nabla _{\lambda }(g^{\lambda \mu }\nabla _{\mu }\Phi )={1 \over {\sqrt {g}}}\partial _{\lambda }({\sqrt {g}}g^{\lambda \mu }\partial _{\mu }\Phi )

som kan benyttes i alle koordinatsystem og ble først funnet av Eugenio Beltrami. I slike sammenhenger blir den da noen ganger angitt ved symbolet Δ.

Et typisk eksempel er bruk av kulekoordinater (r,θ,φ). De kovariante komponentene av metrikken er da

g_{\mu \nu }={\begin{bmatrix}1&0&0\\0&r^{2}&0\\0&0&r^{2}\sin ^{2}\theta \end{bmatrix}}

Da denne matrisen er diagonal med √g = r²sinθ, finnes de kontravariante komponentene direkte fra de inverse elementene som g^rr = 1, g^θθ = 1/r² og g^φφ = 1/r²sin²θ. Den generelle formen for Laplace-operatoren gir dermed

\nabla ^{2}\Phi ={1 \over r^{2}}{\partial  \over \partial r}\left(r^{2}{\partial \Phi  \over \partial r}\right)+{1 \over r^{2}\sin \theta }{\partial  \over \partial \theta }\left(\sin \theta {\partial \Phi  \over \partial \theta }\right)+{1 \over r^{2}\sin ^{2}\theta }{\partial ^{2}\Phi  \over \partial \phi ^{2}}

i dette koordinatsystemet.

Historie[rediger | rediger kilde]

Innføring av tensorer kan føres tilbake til Bernhard Riemann og hans etablering av en generell beskrivelse av ikke-euklidske rom som han i 1854 fremla i et Habilitasjonsforedrag. Det ble publisert i 1868 og dermed kjent for et videre publikum. Den matematiske formalismen som han hadde bygd opp i denne forbindelsen, ble presentert i en avhandling på latin om varmeledning han skrev i 1861 i en priskonkurranse utlyst av det franske vitenskapsakademiet, men som først ble offentliggjort i 1876 etter hans død. På den måten var grunnlaget for hva som i dag omtales som Riemanns differensialgeometri, ferdig oppstilt.^[5]

Det sentrale objektet i Riemanns geometri var en kvadratisk form som i dag omtales som den metriske tensor. Selve begrepet «tensor» kom ikke i bruk før helt på slutten av det århundret, og da i forbindelse med de fysiske egenskapene til krystaller. Riemann hadde vist at et rom eller generell mangfoldighet kunne beskrives ved euklidsk geometri bare når visse størrelser som han betegnet med symbolet $(\iota \,\iota ',\iota ''\iota ''')$ , var null. Innholdet i parentesen bestod av fire arabiske bokstaver som kunne ta verdiene 1,2,...,n hvor n er dimensjonen til rommet. Disse størrelsene sier man i dag er komponentene til krumningstensor. Han kom frem til dette resultatet ved å benytte hjelpestørrelsene $p_{\iota ,\iota ',\iota ''}$ som tilsvarer det første Christoffel-symbolet.^[6]

Beltrami og Christoffel[rediger | rediger kilde]

En av de første matematikere som tok opp Riemanns nye idéer, var Eugenio Beltrami. Han studerte spesielt de mangfoldighetene som er beskrevet ved Riemann-geometri som har konstant krumning. Det ga en bedre forståelse av hyperbolsk geometri i høyere dimensjoner. Omtrent samtidig i 1869 publiserte Elwin Bruno Christoffel to arbeid hvor han undersøkte hvordan Riemanns resultat forandret seg under koordinattransformasjoner. Det er akkurat denne oppførselen som senere skulle vise seg å karakterisere tensorer. Det var også her han innførte sine nye symbol for de størrelsene Riemann hadde brukt.^[5] I stedet for $p_{\iota ,\iota ',\iota ''}$ definerte han

{\begin{bmatrix}\mu \nu \\\alpha \end{bmatrix}}={1 \over 2}{\Big (}g_{\alpha \mu ,\nu }+g_{\alpha \nu ,\mu }-g_{\mu \nu ,\alpha }{\Big )}

hvor indeksene nå er greske i stedet for arabiske. Senere ble dette også skrevet som $[\mu \nu ,\alpha ]$ , kanskje ut fra typografiske hensyn. Dette er Christoffels første symbol og tilsvarer $\Gamma _{\alpha \mu \nu }$ i moderne notasjon. Hans andre symbol er

{\begin{Bmatrix}\mu \nu \\\alpha \end{Bmatrix}}=g^{\alpha \beta }{\begin{bmatrix}\mu \nu \\\beta \end{bmatrix}}

og tilsvarer $\Gamma _{\;\mu \nu }^{\alpha }$ . Alternativt kan man i eldre litteratur se dette symbolet skrevet som $\{\mu \nu ,\alpha \}$ .^[7] Komponentene til Riemanns krumningstensor ble i samme notasjon skrevet som $\{\mu \nu ,\alpha \beta \}$ .

Ricci-kalkulus[rediger | rediger kilde]

Etter bidragene til Beltrami ble Riemannsk geometri videre utforsket spesielt ved Scuola Normale Superiore i Pisa. Her hadde Gregorio Ricci Curbastro studert og etter at han ble ansatt ved universitetet i Padova, bidro han med flere viktige arbeid angående bruk av tensorer i differensialgeometri. Det ble etterhvert navnet for denne mer generelle geometrien. Ricci utvidet forståelsen av kovariant derivasjon og spesielt dennes virkning på komponentene til en tensor. Da resultatene var gyldig i alle koordinatsystem, ble denne nye matematikken kalt for «absolutt differensialregning» eller Ricci-kalkulus.^[8] I flere arbeid viste han den praktiske nytte av tensoranalysen og hvordan fysiske lover kunne skrives på en koordinat-uavhengig måte ved bruk av tensorer.

Sammen med sin tidligere student Tullio Levi-Civita, ble alt dette samlet i en større verk som kom ut i 1900.^[9] I de følgende årene fikk det stor betydning og gjorde tensoranalysen kjent. Det er også her at den moderne notasjonen stammer med øvre indekser for kontravariante og nedre indekser for de kovariante tensorkomponentene.

Senere viste Levi-Civita hvordan kovariant derivasjon er forbundet med muligheten for å definere parallelle vektorer i krumme rom. Dette førte i sin tur til en mer generell forståelse av «konneksjon» på en mangfoldighet, noe som i ettertid har knyttet Levi-Civitas navn til dette begrepet. I moderne elementærpartikkelfysikk tilsvarer en konneksjon et «gaugefelt», mens en koordinattransformasjon spiller samme rolle som en gaugetransformasjon.

Einstein og Grossmann[rediger | rediger kilde]

Da Einstein arbeidet med å utvikle sin generelle relativitetsteori, manglet han i begynnelsen et matematisk begrepsapparat som kunne sammenfatte hans idéer. Men da han i 1912 ble ansatt ved den tekniske høyskolen ETH i Zürich, fikk han hjelp av Marcel Grossmann som var matematiker ved samme institusjon. Deres samarbeid viste etter kort tid at tensoranalysen som utviklet av Christoffel, Ricci og Levi-Civita, var ideell for dette formålet. Det var også de som i sine arbeid gjorde navnet tensor kjent i stedet for det mer almene ordet system som var brukt av de italienske matematikerne. Den fundamentale størrelsen både i Riemannsk geometri og generell relativitetsteori er den metriske tensoren g_μν. Også denne betegnelsen ble innført av Einstein og Grossmann.^[10] Med Einsteins summekonvensjon fra denne tiden ble også all annen notasjon gjort mer kompakt og oversiktlig. For eksempel, komponentene til Riemanns krumningstensor er gitt ved

R_{\;\nu \alpha \beta }^{\mu }=\partial _{\alpha }\Gamma _{\;\nu \beta }^{\mu }-\partial _{\beta }\Gamma _{\;\nu \alpha }^{\mu }+\Gamma _{\;\lambda \alpha }^{\mu }\Gamma _{\;\nu \beta }^{\lambda }-\Gamma _{\;\lambda \beta }^{\mu }\Gamma _{\;\nu \alpha }^{\lambda }

som er den notasjon som brukes i dag.

Differensielle former[rediger | rediger kilde]

Gjennom sine arbeid hadde Ricci og Levi-Civita vist at man i hvert punkt på en krum mangfoldighet kunne opprette et ortogonalt aksekors. På tysk omtales det som et vielbein eller vierbein hvis dimensjonen er fire som i generell relativitetsteori. Ved å benytte tensorkomponentene utregnet i slike aksekors kunne ofte beregninger forenkles og knyttes tettere til fysiske størrelser.

Med et litt annet utgangspunkt ble noe tilsvarende lansert av den franske matematiker Élie Cartan rundt århundreskiftet. Han undersøkte hvordan slike aksekors forandret seg fra punkt til punkt og kalte dem for repère mobile. Dette var en generalisering av lignende aksekors som tidligere var benyttet av Frenet og Serret for beskrivelse av kurver i det euklidske rommet. I utgangspunktet er denne betraktningsmåten uavhengig av metrikken til mangfoldigheten og derfor mer generell enn tidligere formuleringer. I stedet for kovariant derivasjon opptrer nå «ytre derivasjon» som virker på differensielle former. Disse er nye, geometriske objekt med komponenter som tilsvarer antisymmetriske tensorer.^[11]

Den nye differensialgeometrien til Cartan er mer abstrakt og derfor også mer kompakt enn den vanlige bekrivelsen med bruk av tensorer. Men beregningsmessig er den ofte mer effektiv og er idag en sentral del av moderne matematikk og teoretisk fysikk.^[4]

Se også[rediger | rediger kilde]

Referanser[rediger | rediger kilde]

^ ^a ^b ^c G.E. Hay, Vector and Tensor Analysis, Dover Publications, New York (1953). ISBN 0-486-60109-9.
^ ^a ^b ^c M. R. Spiegel, Vector Analysis, Schaum's Outline Series, New York, (1959).
^ ^a ^b ^c A.J. McConnell, Applications of Tensor Analysis, Dover Publications, New York (1957). ISBN 0-486-60373-3.
^ ^a ^b ^c ^d C.W. Misner, K.S. Thorne and J.A. Wheeler, Gravitation, W. H. Freeman, San Francisco (1973). ISBN 0-7167-0344-0.
^ ^a ^b M. Kline, Mathematical Thought from Ancient to Modern Times, Volume 3, Oxford University Press, Oxford (1972). ISBN 978-0-19-506137-6.
^ R. Farwell and C. Knee, The Missing Link: Riemann’s Commentatio, Differential Geometry and Tensor Analysis, Historia Mathematica 17, 223 - 255 (1990).
^ A.E. Eddington, The Mathematical Theory of Relativity, Cambridge University Press, Cambridge (1924).
^ J.A. Schouten, Der Ricci-Kalkül: Eine Einführing in die neueren Methoden und Probleme der mehrdimensionalen Differentialgeometrie, Verlag von Julius Springer , Berlin (1924).
^ G. Ricci et T. Levi-Civita, Méthodes de calcul différentiel absolu et leurs applications, Mathematische Annalen, 54 (1–2), 125–201 (1900).
^ H. Gutfreund and J. Renn, The Road to Relativity, Princeton University Press, Princeton, New Jersey (2015). ISBN 978-0-691-16253-9.
^ P.G. Frè, Gravity, a Geometrical Course, Springer, Heidelberg (2013). ISBN 978-94-007-5360-0.

Litteratur[rediger | rediger kilde]

K. Reich, Die Entwicklung des Tensorkalküls: Vom absoluten Differentialkalkül zur Relativitätstheorie, Springer, Basel (1994). ISBN 978-3-0348-9643-6.

Eksterne lenker[rediger | rediger kilde]

G. Berge, Vektor og tensoranalyse Arkivert 23. mars 2017 hos Wayback Machine., forelesninger ved Universitetet i Bergen (2004).
E. Bertschinger, Introduction to Tensor Calculus for General Relativity, forelesning ved MIT.
MacTutor, Biography of Elwin Bruno Christoffel, University of St. Andrews, Scotland.

[Hay-1] G.E. Hay, Vector and Tensor Analysis, Dover Publications, New York (1953). ISBN 0-486-60109-9.

[Spiegel-2] M. R. Spiegel, Vector Analysis, Schaum's Outline Series, New York, (1959).

[McConnell-3] A.J. McConnell, Applications of Tensor Analysis, Dover Publications, New York (1957). ISBN 0-486-60373-3.

[MTW-4] C.W. Misner, K.S. Thorne and J.A. Wheeler, Gravitation, W. H. Freeman, San Francisco (1973). ISBN 0-7167-0344-0.

[Kline_3-5] M. Kline, Mathematical Thought from Ancient to Modern Times, Volume 3, Oxford University Press, Oxford (1972). ISBN 978-0-19-506137-6.

[FK-6] R. Farwell and C. Knee, The Missing Link: Riemann’s Commentatio, Differential Geometry and Tensor Analysis, Historia Mathematica 17, 223 - 255 (1990).

[Eddington-7] A.E. Eddington, The Mathematical Theory of Relativity, Cambridge University Press, Cambridge (1924).

[Schouten-8] J.A. Schouten, Der Ricci-Kalkül: Eine Einführing in die neueren Methoden und Probleme der mehrdimensionalen Differentialgeometrie, Verlag von Julius Springer , Berlin (1924).

[9] G. Ricci et T. Levi-Civita, Méthodes de calcul différentiel absolu et leurs applications, Mathematische Annalen, 54 (1–2), 125–201 (1900).

[10] H. Gutfreund and J. Renn, The Road to Relativity, Princeton University Press, Princeton, New Jersey (2015). ISBN 978-0-691-16253-9.

[Fre-11] P.G. Frè, Gravity, a Geometrical Course, Springer, Heidelberg (2013). ISBN 978-94-007-5360-0.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]