Lambdakalkyle

Lambdakalkulus eller lambdakalkylen^{[trenger referanse]} (også kjent som $\lambda$ -kalkylen) er et formelt system innenfor informatikk, logikk og matematikk utviklet av Alonzo Church i 1930-årene. Formålet var å undersøke fundamentet for matematikk, men Stephen Kleene og J.B. Rosser viste i 1935 at systemet er, logisk sett, inkonsistent. I 1940 presenterte Alonzo Church et typesystem for lambdakalkylen som gir opphav til et konsistent system, men som begrenser beregnbarhetsstryket betraktelig.

Senere ble systemet forsket med som et fundament for beregninger, og Alan Turing viste i 1937 at lambdakalkylen er turingkomplett. I dag er det i denne forbindelse den utypete lambdakalkylen er mest kjent. Se typeteori for typede varianter av lambdakalkylen.

Formell definisjon av termer[rediger | rediger kilde]

Termene til lambdakalkylen, i sin rene form, veldig enkle. Det er tre former for uttrykk: (1) variabler, (2) funksjoner, og (3) funksjonskall. Termene kan beskrives med en grammatikk som:

N,M::=x\mid N\,M\mid \lambda x.\,M

.

Hvor variablene $x$ hentes fra mengden $\mathbb {V} =\{x_{1},x_{2},\ldots \}$ , og mengden av alle termer kalles $\Lambda$ . Termen $N\,M$ representerer funksjonskall, hvor $N$ er funksjonen, og $M$ er argumentet. Dette skrives gjerne som $N(M)$ i konvensjonell matte. Termen $\lambda x.\,M$ representerer en funksjon som tar ett argument og binder det til $x$ , for så å regne ut verdien til kroppen $M$ . I konvensjonell matte kan man skrive dette som $x\mapsto M$ . Termen $\lambda x.\,M$ kalles ofte abstraksjon eller lambda-abstraksjon.

I utgangspunktet kan en term $M_{1}\,M_{2}\,M_{3}$ tolkes på to måter, $(M_{1}\,M_{2})M_{3}$ og $M_{1}\,(M_{2}\,M_{3})$ . Men det er standard konvensjoner som sier:

Applikasjon binder mot venstre, altså skal $M_{1}\,M_{2}\,M_{3}$ tolkes som $(M_{1}\,M_{2})\,M_{3}$ .
Skopet for abstraksjon binder så langt til høyre som mulig. For eksempel skal $\lambda x.\,M\,N$ tolkes som $\lambda x.\,(M\,N)$ .
Flere etterfølgende $\lambda$ -abstraksjoner slås sammen: f.eks. er $\lambda x\,y.M$ en forkortelse for $\lambda x.\lambda y.\;M$ .

Eksempler[rediger | rediger kilde]

Noen eksempler vi nå kan definere i den rene lambdakalkylen er:

$\mathrm {id} \equiv \lambda x.\,x$ , identitesfunksjonen
$\mathrm {K} \equiv \lambda x\,y.\;x$ og $\mathrm {S} \equiv \lambda x\,y\,z.\;xz(yz)$ fra kombinatorisk logikk.
$\mathrm {to-ganger} \equiv \lambda f\,x.\;f(fx)$ som tar en funksjon og et argument, og sender argumentet to ganger gjennom funksjonen.

Hvis vi beveger oss bort fra den rene lambdakalkylen og godtar konstanter for tall og operasjoner som pluss, kan vi definere funksjoner slik som:

$\mathrm {f} \equiv \lambda x.\;x*2$ , som er funksjonen som tar et tall og ganger med to.
$\mathrm {kvadrer} \equiv \lambda x.\;x*x$ , som kvadrere et tall.

Det er viktig å merke seg at $\equiv$ ikke er en del av den rene lambdakalkylen, men er bare ment for gi navn til termer i metaspråket.

Fri- og bundede variable[rediger | rediger kilde]

Lambda-abstraksjoner binder en variabel i skopet sitt. F.eks. i $(\lambda x.\,x+1)(x+4)$ , så bindes variablen $x$ i termen $x+1$ , men den bindes ikke i deltermen $(x+4)$ . En variabel kan også forekommer fritt i en term: variabelen $y$ er fri i termen $\lambda x.\;x+y$ . En variabel kan både forekomme som bundet og fri i en term, men en gitt variabel på en gitt lokasjon i en gitt term er enten fri eller bundet, ikke begge deler.

Funksjonen ${\textrm {FV}}:\Lambda \to 2^{\mathbb {V} }$ gir mengden av frie variabler som forekommer i en term, og er definert rekursivt over strukturen til termer, som:

${\textrm {FV}}(x)=\{x\}$
${\textrm {FV}}(N\,M)={\textrm {FV}}(N)\cup {\textrm {FV}}(M)$
${\textrm {FV}}(\lambda x.\,M)={\textrm {FV}}(M)\setminus \{x\}$

Substitusjon[rediger | rediger kilde]

Substitusjon (eng: capture-avoiding substitution) er et viktig begrep i lambdakalkylen. Formålet med substitusjon er å bytte ut en variabel i en term med en annen term. For eksempel ønsker vi at det å bytte ut $x$ med $10$ i uttrykket $x+y$ skal gi uttrykket $10+y$ . I lambdakalkylen ønsker vi derfor å definere en funksjon $M[N/x]$ , som leses som bytt ut alle forekomster av $x$ i $M$ med $N$ .

En naiv, tekstelig substitusjon vil bli feil, fordi variabler som forekommer fritt i $N$ kan bli bundet hvis $N$ settes rett inn i $M$ . F.eks. vil $(\lambda x.y)[fx/y]\equiv \lambda x.f\,x$ være feil, siden den tidligere frie variabelen $x$ i $f\,x$ er blitt bundet i $\lambda x.\,f\,x$ .

I litteraturen beskrives flere måter å håndtere dette på. Den letteste måten er å definere substitusjon som en partiell funksjon som ikke gir noe svar dersom det blir navnekræsj, på følgende måte:

$x[N/x]\equiv N$
$y[N/x]\equiv x$ når $x$ og $y$ er forskjellige
$(M_{1}\,M_{2})[N/x]\equiv M_{1}[N/x]\;M_{2}[N/x]$
$(\lambda x.\,M)[N/x]=\lambda x.\,M$
$(\lambda y.\,M)[N/x]=\lambda y.M[N/x]$ gitt at $y\not \in {\textrm {FV}}(N)$

En korrekt, total funksjon, endrer den siste regelen til:

$(\lambda y.\,M)[N/x]=\lambda y'.M[y'/y][N/x]$ hvor $x$ , $y$ og $y'$ er forskjellige, og $y'\not \in \mathrm {FV} (M)\cup \mathrm {FV} (N)$ .

Omskrivningsregler[rediger | rediger kilde]

Termene vi definerte over har ikke blitt gitt noen formell mening. Historisk sett, så har det vært tre hovedregler som forteller hvordan man kan evaluere en term: alpha-konvertering ( $\alpha$ ), beta-konvertering ( $\beta$ ) og eta-ekspansjon ( $\eta$ ).

Nedenfor vil forskjellige relasjoner bli definert, men disse vil kun gjelde for toppen av en term, og kan ikke brukes på deltermer. Anta derfor at vi har en relasjon $\rightarrow _{R}$ på termer, og vi kan så definere relasjonen $N\Rightarrow _{R}M$ som følger:

hvis $N\rightarrow _{R}M$ , så $N\Rightarrow _{R}M$
hvis $N\Rightarrow _{R}M$ , så $\lambda x.\,N\Rightarrow _{R}\lambda x.\,M$
hvis $M_{1}\Rightarrow _{R}M_{2}$ , så $N\,M_{1}\Rightarrow _{R}N\,M_{2}$
hvis $N_{1}\Rightarrow _{R}N_{2}$ , så $N_{1}\,M\Rightarrow _{R}N_{2}\,M$

Relasjonen $N\Rightarrow _{R}M$ er dermed relasjonen som gjør ett $R$ -steg på en del-term av $N$ .

Fra en relasjon $M\Rightarrow _{R}$ kan man definere relasjonen $M\Rightarrow _{R}^{*}N$ som gjør null eller flere R-steg, som er den refleksive og transitive tillukningen av $\Rightarrow _{R}$ . Og videre kan man definere $M=_{R}N$ , som er den refleksive, symmetriske, transitive tillukningen av $M\Rightarrow _{R}^{*}N$ .

Alpha-konvertering[rediger | rediger kilde]

Intuisjonen vår rundt variabler er at navnet til en lokal variabel er irrelevant, funksjonene $x\mapsto x+2$ og $y\mapsto y+2$ representerer samme funksjon. Alpha-regelen gjør det at man kan bytte om lokale navn formelt.

\lambda x.\,M\to _{\alpha }\lambda y.\,M[y/x]

gitt at $y$ ikke forekommer fritt i $M$ .

Med unntak av noen få, især de som jobber med implementasjoner av programmeringspråk, så er det vanlig å alltid jobbe med lambda-termer modulo alpha-ekvivalens, altså på ekvivalensklasser av relasjonen $=_{\rightarrow \alpha }$ .

Beta-reduksjon[rediger | rediger kilde]

Den viktigste regelen for lambdakalkylen er beta-reduksjon ( $\beta$ -redkusjon), som forteller hvordan en funksjon samhandler med et funksjonskall. Å kalle på en funksjon $\lambda x.\,M$ med et argument $N$ betyr at man setter inn argumentet $N$ for variabelen $x$ i kroppen, $M$ , til funksjonen. Formelt skrives dette som:

(\lambda x.\,M)N\to _{\beta }M[N/x]

hvor $M[N/x]$ er substitusjon av $N$ for $x$ i $M$ .

En term $M$ er på beta normalform hvis det ikke finnes noen $N$ slik at $M\Rightarrow _{\beta }N$ , og to termer $M$ og $N$ er beta-ekvivalente hvis $M=_{\beta }N$ .

Eta-ekspansjon[rediger | rediger kilde]

Eta-ekspansjon handler om ekstensionalitet, og sier at alle funksjoner beskrives ved hjelp av lambda-abstraksjon og applikasjon. Formelt er regelen

M\to _{\eta }\lambda x.\,Mx

hvor $x$ ikke forekommer fritt i $M$ .

Egenskaper ved lambdakalkylen[rediger | rediger kilde]

Lambdakalkylen er konfluent under beta-reduksjon. Mer presist: for alle $M$ , $M_{1}$ og $M_{2}$ , hvis $M\Rightarrow _{\beta }^{*}M_{1}$ og $M\Rightarrow _{\beta }^{*}M_{2}$ , så eksisterer en $N$ slik at $M_{1}\Rightarrow _{\beta }^{*}N$ og $M_{2}\Rightarrow _{\beta }^{*}N$

Lambdakalkylen er hverken svakt eller sterkt normaliserende (eng: weakly og strongly normalizing), ettersom f.eks. termen $(\lambda x.\,x\,x)(\lambda x.\,x\,x)$ ikke har noen beta normalform.

Koding av data[rediger | rediger kilde]

I den rene lambdakalkylen er det ingen data bortsett fra funksjoner. Det er likevel mulig å kode forskjellige datatyper som lambdatermer.

Sannhetsverdier[rediger | rediger kilde]

De bolske verdiene sann og usann kan kodes som følger:

$\mathrm {SANN} \equiv \lambda x\,y.\;x$
$\mathrm {USANN} \equiv \lambda x\,y.\;y$
$\mathrm {IF} \equiv \lambda b\,c\,a.\;b\;c\;a$

Vi kan se at dette fungerer ved å se på hvordan ${\textrm {IF}}\;{\textrm {SANN}}\;x\;y$ reduserer til $x$ :

{\textrm {IF}}\;{\textrm {SANN}}\;x\;y\Rightarrow _{\beta }^{3}{\textrm {SANN}}\;x\;y\Rightarrow _{\beta }^{2}x

.

Ordnede par[rediger | rediger kilde]

Et par $\langle M,N\rangle$ sammen med to projeksjoner $\pi _{1}$ og $\pi _{2}$ kan defineres slik at $\pi _{1}\langle M,N\rangle =_{\beta }M$ og $\pi _{2}\langle M,N\rangle =_{\beta }N$ .

$\mathrm {PAIR} \equiv \lambda \,x\,y\,f.\;f\;x\;y$ , hvor $\langle M,N\rangle$ er en forkortelse for $\mathrm {PAIR} \;M\;N$ .
$\mathrm {\pi _{1}} \equiv \lambda p.\;(\lambda \;x\;y.\;x)\;p$
$\mathrm {\pi _{2}} \equiv \lambda p.\;(\lambda \;x\;y.\;y)\;p$

Naturlige tall[rediger | rediger kilde]

I Churchs koding av naturlige tall, så representeres et tall $n$ som termen $\lambda \;f\;x.\;f^{n}x$ , hvor $f^{n}$ er definert som $f^{0}x=x$ og $f^{n+1}x=f(f^{n}x)$ . Intuisjonen er at tall $n$ representeres ved en iterator som gitt en funksjon og et startverdi vil kalle på funksjonen $n$ ganger med startverdien.