Apertium

Fra Wikipedia, den frie encyklopedi
Apertium
Distributør(er)Google Play
Nyeste versjon3.8.3 (1. november 2022)[1]
Kodelagerhttps://github.com/apertium
Skrevet iC++,[2] Java
TypeRegel-baseret maskinoversettelse
LisensGPLv2[3]
Nettstedwww.apertium.org (mul)

Apertium er et maskinoversettelsessystem som blir utviklet med støtte fra den spanske regjeringa, regjeringa i Catalonia, og Universitetet i Alicante. Det er fri programvare, publisert under GNU GPL.

Apertium startet som et av maskinoversettelsessystemene i prosjektet OpenTrad og var opprinnelig laget for å oversette mellom språk som var nært i slekt, men det har senere blitt utvidet til å behandle språk med større forskjeller, som for eksempel baskiskspansk. Systemet er modulært, og for å legge til et nytt språkpar er det nok å legge til språklige data (oversettelsesordbok, regler) i et veldefinert format (XML).

Apertium fungerer nå for de romanske språka i Spania, kastillansk, katalansk og galisisk, og for engelsk, portugisisk, fransk, oksitansk og rumensk.

Maskinoversettelsen i Apertium er basert på overføring av grammatisk struktur, og bruker endelige tilstandsautomater for alle leksikalske transformasjoner og ordklassetagging, og føringsgrammatikk for regelbasert ordklassedisambiguering en skjult Markov-modell for statistisk disambiguering. Regler blir også brukt for leksikalsk seleksjon, dvs. betydningsdisambiguering for valg av beste oversettelse etter at den morfologisk analysen er utvetydig, og for oversetting av idiomatiske uttrykk.[4]

Maskinoversettelse mellom nynorsk og bokmål[rediger | rediger kilde]

Innenfor Apertium-ramma er det satt i gang arbeid med maskinoversettelse mellom nynorsk og bokmål, apertium-nno-nob.[5] Versjon 1.5.0 kan testes på hjemmesiden deres.

Språkoversettingspar[rediger | rediger kilde]

Liste over noen av språkene som lar seg oversette med Apertium (oppdatert liste på http://wiki.apertium.org/wiki/Main_Page ).

Aragonesisk an Asturiansk ast Baskisk eu Breton br Bulgarsk bg Katalansk ca Dansk da Engelsk en Esperanto eo Fransk fr Galisisk gl Islandsk is Italiensk it Makedonsk mk Bokmål nb Nynorsk nn Occitan oc Portugisisk pt Rumensk ro Spansk es Svensk sv Walisisk cy
Aragonesisk Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei
Asturiansk Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei
Baskisk Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Ja (→) Nei Nei
Bretonsk Nei Nei Nei Nei Nei Nei Nei Nei Ja (→) Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei
Bulgarsk Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei Nei Nei Nei Nei Nei Nei
Katalansk Nei Nei Nei Nei Nei Nei Ja (⇄) Ja (→) Ja (⇄) Nei Nei Ja (←) Nei Nei Nei Ja (⇄) Ja (⇄) Nei Ja (⇄) Nei Nei
Dansk Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Ja (⇄) Nei Nei Nei Nei Ja (←) Nei
Engelsk Nei Nei Nei Nei Nei Ja (⇄) Nei Ja (⇄) Nei Ja (⇄) Ja (←) Nei Ja (←) Nei Nei Nei Nei Nei Ja (⇄) Nei Ja (←)
Esperanto Nei Nei Nei Nei Nei Ja (←) Nei Ja (⇄) Ja (←) Nei Nei Nei Nei Nei Nei Nei Nei Nei Ja (←) Nei Nei
Fransk Nei Nei Nei Ja (←) Nei Ja (⇄) Nei Nei Ja (→) Nei Nei Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei
Galisisk Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Ja (⇄) Nei Nei
Islandsk Nei Nei Nei Nei Nei Nei Nei Ja (→) Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei
Italiensk Nei Nei Nei Nei Nei Ja (→) Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei
Makedonsk Nei Nei Nei Nei Ja (⇄) Nei Nei Ja (→) Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei
Bokmål Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei Nei Nei Nei Nei
Nynorsk Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei Nei Nei Nei Nei
Oksitansk Nei Nei Nei Nei Nei Ja (⇄) Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei
Portugisisk Nei Nei Nei Nei Nei Ja (⇄) Nei Nei Nei Nei Ja (⇄) Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Nei Nei
Rumensk Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Ja (←) Nei Nei
Spansk Ja (⇄) Ja (⇄) Ja (←) Nei Nei Ja (⇄) Nei Ja (⇄) Ja (→) Ja (⇄) Nei Nei Nei Nei Nei Nei Ja (⇄) Ja (⇄) Ja (←) Nei Nei
Svensk Nei Nei Nei Nei Nei Nei Ja (→) Nei Nei Nei Nei Nei Nei Nei Ja (⇄) Ja (⇄) Nei Nei Nei Nei Nei
Walisisk Nei Nei Nei Nei Nei Nei Nei Ja (→) Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei Nei

Fotnoter[rediger | rediger kilde]

  1. ^ «Release 3.8.3 Latest». 1. november 2022. Besøkt 2. mars 2023. 
  2. ^ «The apertium Open Source Project on Open Hub: Languages Page». Open Hub. Besøkt 18. juli 2018. 
  3. ^ https://sourceforge.net/projects/apertium/; SourceForge; besøksdato: 24. september 2016.
  4. ^ Khanna, Tanmai; Washington, Jonathan N.; Tyers, Francis M.; Bayatlı, Sevilay; Swanson, Daniel G.; Pirinen, Tommi A.; Tang, Irene; Alòs i Font, Hèctor (1. desember 2021). «Recent advances in Apertium, a free/open-source rule-based machine translation platform for low-resource languages». Machine Translation. 4 (engelsk). 35: 475–502. ISSN 1573-0573. doi:10.1007/s10590-021-09260-6. Besøkt 16. oktober 2023. 
  5. ^ [1]

Litteratur[rediger | rediger kilde]

  • Corbí-Bellot, M. et al. (2005): «An open-source shallow-transfer machine translation engine for the romance languages of Spain» i Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, ss. 79-86
  • Armentano-Oller, C. et al. (2006): «Open-source Portuguese-Spanish machine translation» i Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], ss. 50-59.

Eksterne lenker[rediger | rediger kilde]