Apertium
Apertium er et maskinoversettelsessystem som blir utviklet med støtte fra den spanske regjeringa, regjeringa i Catalonia, og Universitetet i Alicante. Det er fri programvare, publisert under GNU GPL.
Apertium startet som et av maskinoversettelsessystemene i prosjektet OpenTrad og var opprinnelig laget for å oversette mellom språk som var nært i slekt, men det har senere blitt utvidet til å behandle språk med større forskjeller, som for eksempel baskisk→spansk. Systemet er modulært, og for å legge til et nytt språkpar er det nok å legge til språklige data (oversettelsesordbok, regler) i et veldefinert format (XML).
Apertium fungerer nå for de romanske språka i Spania, kastillansk, katalansk og galisisk, og for engelsk, portugisisk, fransk, oksitansk og rumensk.
Maskinoversettelsen i Apertium er basert på overfladisk overføring av grammatisk struktur, og bruker endelige tilstandsautomater for alle leksikalske transformasjoner og ordklassetagging, og en skjult Markov-modell for disambiguering. En del av språkpara i Apertium benytter i tillegg føringsgrammatikk for regelbasert ordklassedisambiguering og leksikalsk seleksjon (dvs enkel betydningsdisambiguering hvor det eneste formålet er å bedre oversettelsen).
Maskinoversettelse mellom nynorsk og bokmål[rediger | rediger kilde]
Innenfor Apertium-ramma er det satt i gang arbeid med maskinoversettelse mellom nynorsk og bokmål, apertium-nn-nb.[1] Versjon 0.6.5 kan testes på hjemmesiden deres.
Språkoversettingspar[rediger | rediger kilde]
Liste over noen av språkene som lar seg oversette med Apertium (oppdatert liste på http://wiki.apertium.org/wiki/Main_Page ).
Aragonesisk an | Asturiansk ast | Baskisk eu | Breton br | Bulgarsk bg | Katalansk ca | Dansk da | Engelsk en | Esperanto eo | Fransk fr | Galisisk gl | Islandsk is | Italiensk it | Makedonsk mk | Bokmål nb | Nynorsk nn | Occitan oc | Portugisisk pt | Rumensk ro | Spansk es | Svensk sv | Walisisk cy | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Aragonesisk | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei |
Asturiansk | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei |
Baskisk | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei |
Bretonsk | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Bulgarsk | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Katalansk | Nei | Nei | Nei | Nei | Nei | — | Nei | Ja (⇄) | Ja (→) | Ja (⇄) | Nei | Nei | Ja (←) | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Nei | Ja (⇄) | Nei | Nei |
Dansk | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Nei | Nei | Nei | Nei | Ja (←) | Nei |
Engelsk | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | — | Ja (⇄) | Nei | Ja (⇄) | Ja (←) | Nei | Ja (←) | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Ja (←) |
Esperanto | Nei | Nei | Nei | Nei | Nei | Ja (←) | Nei | Ja (⇄) | — | Ja (←) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (←) | Nei | Nei |
Fransk | Nei | Nei | Nei | Ja (←) | Nei | Ja (⇄) | Nei | Nei | Ja (→) | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei |
Galisisk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Ja (⇄) | Nei | Nei |
Islandsk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Italiensk | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Makedonsk | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Bokmål | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei |
Nynorsk | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | — | Nei | Nei | Nei | Nei | Nei | Nei |
Oksitansk | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Ja (⇄) | Nei | Nei |
Portugisisk | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Ja (⇄) | Nei | Nei |
Rumensk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Ja (←) | Nei | Nei |
Spansk | Ja (⇄) | Ja (⇄) | Ja (←) | Nei | Nei | Ja (⇄) | Nei | Ja (⇄) | Ja (→) | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Ja (←) | — | Nei | Nei |
Svensk | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Nei | Nei | Nei | Nei | — | Nei |
Walisisk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — |
Fotnoter[rediger | rediger kilde]
Litteratur[rediger | rediger kilde]
- Corbí-Bellot, M. et al. (2005): «An open-source shallow-transfer machine translation engine for the romance languages of Spain» i Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, ss. 79-86
- Armentano-Oller, C. et al. (2006): «Open-source Portuguese-Spanish machine translation» i Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], ss. 50-59.
Eksterne lenker[rediger | rediger kilde]
- (mul) Offisielt nettsted
- (en) Apertium – kategori av bilder, video eller lyd på Commons
- nordsamisk→bokmål (nyeste "SVN"-utgave) utviklet i samarbeid med Sámi Giellatekno
- Testversjoner av andre samiske/norske/finske språkpar utviklet i samarbeid med Sámi Giellatekno
- Apertium intern-Wiki
- Norske språkpar i Apertium (utviklingsinformasjon)