Apertium
Apertium er et maskinoversettelsessystem som blir utviklet med støtte fra den spanske regjeringa, regjeringa i Catalonia, og Universitetet i Alicante. Det er fri programvare, publisert under GNU GPL.
Apertium startet som et av maskinoversettelsesssystemen i prosjektet OpenTrad og var opprinnelig laget for å oversette mellom språk som var nært i slekt, men det har senere blitt utvidet til å behandle språk med større forskjeller, som for eksempel baskisk→spansk. Systemet er modulært, og for å legge til et nytt språkpar er det nok å legge til språklige data (oversettelsesordbok, regler) i et veldefinert format (XML).
Apertium fungerer nå for de romanske språka i Spania, kastillansk, katalansk og galisisk, og for engelsk, portugisisk, fransk, oksitansk og rumensk.
Maskinoversettelsen i Apertium er basert på overfladisk overføring av grammatisk struktur, og bruker endelige tilstandsautomater for alle leksikalske transformasjoner og ordklassetagging, og en skjult Markov-modell for disambiguering. En del av språkpara i Apertium benytter i tillegg føringsgrammatikk for regelbasert ordklassedisambiguering og leksikalsk seleksjon (dvs enkel betydningsdisambiguering hvor det eneste formålet er å bedre oversettelsen).
Innhold |
[rediger] Maskinoversettelse mellom nynorsk og bokmål
Innenfor Apertium-ramma er det satt i gang arbeid med maskinoversettelse mellom nynorsk og bokmål, apertium-nn-nb.[1] Versjon 0.6.5 kan testes på hjemmesiden deres.
[rediger] Språkoversettingspar
Liste over språk som lar seg oversette med Apertium.
| Aragonesisk an | Asturiansk ast | Baskisk eu | Breton br | Bulgarsk bg | Katalansk ca | Dansk da | Engelsk en | Esperanto eo | Fransk fr | Galisisk gl | Islandsk is | Italiensk it | Makedonsk mk | Bokmål nb | Nynorsk nn | Occitan oc | Portugisisk pt | Rumensk ro | Spansk es | Svensk sv | Walisisk cy | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Aragonesisk | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei |
| Asturiansk | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei |
| Baskisk | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei |
| Bretonsk | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
| Bulgarsk | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
| Katalansk | Nei | Nei | Nei | Nei | Nei | — | Nei | Ja (⇄) | Ja (→) | Ja (⇄) | Nei | Nei | Ja (←) | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Nei | Ja (⇄) | Nei | Nei |
| Dansk | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (←) | Nei |
| Engelsk | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | — | Ja (⇄) | Nei | Ja (⇄) | Ja (←) | Nei | Ja (←) | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Ja (←) |
| Esperanto | Nei | Nei | Nei | Nei | Nei | Ja (←) | Nei | Ja (⇄) | — | Ja (←) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (←) | Nei | Nei |
| Fransk | Nei | Nei | Nei | Ja (←) | Nei | Ja (⇄) | Nei | Nei | Ja (→) | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei |
| Galisisk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Ja (⇄) | Nei | Nei |
| Islandsk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
| Italiensk | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
| Makedonsk | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
| Bokmål | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei |
| Nynorsk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | — | Nei | Nei | Nei | Nei | Nei | Nei |
| Oksitansk | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Ja (⇄) | Nei | Nei |
| Portugisisk | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Ja (⇄) | Nei | Nei |
| Rumensk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Ja (←) | Nei | Nei |
| Spansk | Ja (⇄) | Ja (⇄) | Ja (←) | Nei | Nei | Ja (⇄) | Nei | Ja (⇄) | Ja (→) | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Ja (←) | — | Nei | Nei |
| Svensk | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei |
| Walisisk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — |
[rediger] Litteratur
- Corbí-Bellot, M. et al. (2005): «An open-source shallow-transfer machine translation engine for the romance languages of Spain» i Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, ss. 79-86
- Armentano-Oller, C. et al. (2006): «Open-source Portuguese-Spanish machine translation» i Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], ss. 50-59.
[rediger] Eksterne lenker
- Apertium.org – hjemmeside (hvor man kan prøve en enkel utgave av nynorsk–bokmål)
- Testversjoner av mange ulike språkpar (dvs. nyeste utviklingsversjoner)
- Testversjoner av samiske/norske/finske språkpar utviklet i samarbeid med Sámi Giellatekno
- Apertium Wiki
- Norske språkpar i Apertium (utviklingsinformasjon)