Wikipedia:Tinget/Arkiv/2017/desember

Fra Wikipedia, den frie encyklopedi
Arkiv
Arkiv
Dette er et arkiv over inaktive diskusjoner fra Wikipedia:Tinget/Arkiv. Vennligst ikke gjør endringer her. Ønsker du å fortsette en gammel diskusjon, ta det opp på den aktive diskusjonssiden.

Stans maskinoversettelsene![rediger kilde]

De maskinoversatte tekstene holder et så absurd lavt nivå at de utelukkende er til skade for norske Wikipedia, se f.eks. Laura Mancinelli, som selvsagt burde vært hurtigslettet, men får tjene som et eksempel på hvor horribel Wikimedias oversettelsesfunksjon er. Vi har ikke kapasitet til å rette opp denne type ubehjelpelig, knapt forståelig og svært ofte direkte feiloversatt kaudervelsk. (Mancinelli har blant annet skiftet kjønn.) Før eller siden vil denne teknologien bli moden nok til at den kan brukes, men der er vi på langt nær, og norske Wikimedia skal ikke være et laboratorium for dette vrøvlet. Hva er det som må til for å få nøytralisert denne tjenesten? En avstemning? Asav (diskusjon) 29. nov. 2017 kl. 12:37 (CET)

Dette har ikke noe med verktøyet for oversettelse, det har med sloppy håndverk. Noen har oversatt overskrifter og enkelte setninger, og deretter publisert. Dette kan de gjøre uavhengig av hvilken publiseringsløsning som blir brukt. (Forøvrig, grammatisk kjønn er ikke det samme som biologisk kjønn, og det var noen som insisterte på at vi skulle slutte å bruke biologisk kjønn i omtaler. Tror den diskusjonen gikk mens du var fraværende, du får ta en omstart på den om du mener den er viktig. Diskusjonen er på Wikipedia:Torget/Arkiv/2015/juli#Forfatterinne.) — Jeblad 29. nov. 2017 kl. 12:55 (CET)
Dette er jo helt absurd! For det første er det Wikimedias eget oversettelsesverkøy som har vært tatt i bruk. Selvfølgelig fører dette til at oversettelsene blir «sloppy»! Det skyldes at selve verktøyet ikke er brukbart! (Hva angår kjønn, er svaret enda mer absurd. Dette har selvsagt ingenting med biologisk kjønn å gjøre, men at oversettelsesverktøyet svikter her også og oversetter «hun» med «han».) Og for det tredje er «publiseringsløsningen» i dette tilfellet norske Wikipedia, som altså må lide under denne vederstyggeligheten.
Jeg gjentar altså spørsmålet: Hva skal til for å få slått av denne funksjonen? Asav (diskusjon) 29. nov. 2017 kl. 13:08 (CET)
Oppunder 6500 oversettelser på dette prosjektet. Det er rundt 20% av en årsproduksjon. Virker ikke som en fornuftig tilnærming!
Verktøyet er en hjelp i oversettelse av artikler, det gir ikke ferdige artikler, og har aldri gitt noen lovnad om å gi ferdige artikler. Det kommer opp advarsler i verktøyet om å påse at oversettelsen holder tilstrekkelig kvalitet, men hvis en overser disse så tror jeg ikke mer advarsler er veien å gå.
Det er mulig å legge inn flere og bedre tester før artikler publiseres på alle måter, og mer testing av grammatikk og formatering, men det forutsetter at noen gjør jobben. Slik tonen er på dette prosjektet så tror jeg ikke noen vil gjøre det. — Jeblad 29. nov. 2017 kl. 13:38 (CET)

Dette er fremmedspråklig tekstdump. Forfatteren kan åpenbart ikke lese norsk. Bidragsyteren har spammet 20 wikipediaer med artikler om «Laura Mancinelli», har blitt kritisert for språket sitt på tysk WP. Her er vel ganske mange artikler hvor språket ikke har overlevd maskinoversettelse. Dette er ikke en aktivitet vi trenger eller bør oppmundre til, men vi får bare gjort noe med norsk WP, de andre språkene må ordne opp hos seg selv. --ツDyveldi☯ prat ✉ post 29. nov. 2017 kl. 14:09 (CET)

Det er jo ikke slik at Wikipedia går glipp av sentrale artikler fordi de ikke er oversatt, og per idag gjør denne funksjonen adskillig mer skade enn nytte.
Så igjen: Hva er det som skal til for å få blokkert automatisk innholdsoversettelse? Asav (diskusjon) 29. nov. 2017 kl. 14:30 (CET)
Og kan man få stoppet bare Yandex? Det er Yandex som skaper problemene, fordi Yandex ikke er i nærheten når de publiseres. For dansk og nynorsk fungerer det bedre, og er artikler som etter oversettelse trenger lite arbeid. Så stopp Yandex. --- Løken (diskusjon) 29. nov. 2017 kl. 14:39 (CET)
To much errors from the Yandex-engine (possibly other engines too), Invites to translate articles should not include low-quality ml-engines, og Assign a right for direct posting to the main space. — Jeblad 29. nov. 2017 kl. 18:06 (CET)
Der er fra før av klart, at flere etablerte brukere ikke vil være med på å stoppe oversettermaskiner (hva gjør vi i så fall med Google Translate?). Dette prosjektet er i seg selv ustoppelig, og vi må tenke utenom.
Alternativene blir derfor enten brutal sletting, eller – slik det ikke sjelden skjer nå: Flytt «produktet» til brukerens diskusjons- eller annen brukerunderside med beskjed om at denne bare er velkommen i hovedrommet når der er oppnådd rimelig kvalitet.
Å begynne å flikke på slike i hovedrommet er trolig en oppmuntring for vedkommende til å levere flere lignende halvfabrikata, og bør nok unngås – spesielt ved interwiki-leveranser som ikke alltid er spam. --Bjørn som tegner (diskusjon) 29. nov. 2017 kl. 15:20 (CET)
Jeg er ikke så sikker på at særlig mange brukere ønsker å ha denne «tjenesten» ombord, og det er da også en svært stor forskjell mellom Google Translate og Wikipedia-programvaren: Slik det er nå, oppfordrer nemlig Wikipedia faktisk bidragsydere til å benytte denne ubrukelige funksjonen; det er bare å klikke på en knapp! Da er det tross alt ikke rart at den blir (mis)brukt, heller.
Men jeg har fortsatt ikke sett noe svar på hvordan vi får eliminert maskinoversetterfunksjonen i norske Wikipedia. Må det stemmes over? Asav (diskusjon) 29. nov. 2017 kl. 15:30 (CET)
Oversettelsesverktøyet bruker ikke Google Translate. — Jeblad 29. nov. 2017 kl. 18:12 (CET)

Det er en del bidragsytere som bruker dette verktøyet på legitimt vis, så jeg synes ikke det å skru det helt av er noen god løsning. Samtidig må vi innse at det er veldig farlig for leksikonets kvalitet å la verktøyet bli misbrukt slikt enkelte gjør; hvis andre bidragsytere tar en overfladisk språkvask uten å sammenligne nøye med originalteksten blir det lett til at man introduserer store mengder feil.

Hvis man kommer over tekster som er maskinoversatt og ikke bearbeidet godt nok til norsk anbefaler jeg at man merker dem med {{hurtigslett}}, for så å legge en melding på Wikipedia:Administratorenes oppslagstavle. En administrator bør deretter hurtigslette artikkelen, og forklare til brukeren som maskinoversatte og dumpet teksten inn at slikt ikke er akseptabelt. Dersom brukeren ikke tar dette til seg men derimot fortsetter innlegging av maskinoversatte lavkvalitetstekster er det forstyrrelse av Wikipedia, noe som gjør at administratorene kan og bør blokkere brukeren. Hilsen Kjetil_r 29. nov. 2017 kl. 15:26 (CET)

Tar man jobben med å redde artikkelen må jo det være lov, men jeg ser problemet med at det kan oppfordre til misbruk eller latskap ved artiklene blir stående og arbeidet overlatt til andre. --Vennlig hilsen Erik d.y. 1. des. 2017 kl. 23:30 (CET)

God ettermiddag! Jeg bruker Oversettelsesverkøyet og synest det er et godt verktøy og ser ingen grunn til at det skal slåes av. Mvh Pmt (diskusjon) 29. nov. 2017 kl. 16:11 (CET)

Ser vi hva som er maskinoversatt i «siste endringer»? Nå er det bare en enerverende tagg «visuell redigering», såvidt jeg kan se. Dersom det tagges med maskinoversettelse kan patruljører være på vakt. --Vennlig hilsen Erik d.y. 1. des. 2017 kl. 23:21 (CET)

Mener de er merket med en etikett (eller label/tag på norwenglish) som er noe sånt som "innholdsoversettelse". Vet ikke om alle babbel-artiklene blir merket slik, men jeg tror merket blir værende dersom det er snakk om ren tekst-dumping (brukeren har ikke giddet å bearbeide resultatet før publisering). --- Aldebaran (diskusjon) 2. des. 2017 kl. 00:20 (CET)
Taggen «visuell redigering» er ikke relevant for patruljering og kan skjules for min del. --Vennlig hilsen Erik d.y. 2. des. 2017 kl. 00:27 (CET)
Oversettelser (ved hjelp av "Content translation") merkes "Innholdsoversettelse". Dette er uavhengig av hvor mye oversettelsen har blitt bearbeidet i verktøyet før publisering. Taggen forsvinner imidlertid hvis man flytter teksten med klipp-og-lim-metoden, f.eks. fra kladdeside til hovedrommet eller vice versa. - 4ing (diskusjon) 2. des. 2017 kl. 10:10 (CET)
Språkvaskkategorien inneholder flere tusen artikler som språkmessig er av en vanvittig dårlig kvalitet. Ofte er det slik at når jeg prøver å språkvaske må jeg gi opp fordi jeg rett og slett ikke greier å forstå hva man prøver å si i setningen. Manglende punktum og komma gjør også sitt til å gjøre teksten uforståelig. Med engelsk syntaks og tegnsetting direkte overført fra engelsk, står man igjen med noe som er uleselig for noen som ellers forstår norsk 100%. I tillegg er en rekke av artiklene om emner som gjør det ekstra vanskelig å språkvaske. Jeg kikket innom den svenske språkvaskkategorien for et par uker siden. Til sammenligning innholdt den noen få hundre artikler, mens bokmål har 6-7 tusen, hvorav de eldste har stått mer eller mindre urørt i 8-10 år! Kan man enten få slike artikler slettet, eller få aksept på at man kutter dem ned til en ingress-stubb med det aller viktigste? WP på bokmål har ikke, og vil aldri få, ressurser til å få språkvasket dette store antallet artikler. Dette usignerte innlegget ble skrevet av TorbjørnS (diskusjon · bidrag) (Husk å signere dine innlegg!)


Ben Lamar Gay, Theodore Darst og Mike Pride figurerer nå som Ben Lamar Homofile, Theodore Representerer og Mike Stolthet både på norsk og engelsk wikipedia takket være ukritisk bruk av oversettelsesverktøyet og det er mer der det kommer fra. --Avilena (diskusjon) 4. des. 2017 kl. 21:55 (CET)

Jeg må le, men vi burde egentlig gråte (kollektivt) når vi ser slikt (og dette er ikke unikt!). Å prøve å avfeie kritikk av slikt babbel som "enkelte skjønnhetsfeil" blir jo helt tragisk! Hvorfor mener enkelte at det er greit at Wikipedia "driter seg ut" på denne måten? De som ivrer etter å latterliggjøre Wikipedia - og det er mange - får jo servert tung ammunisjon på et sølvfat. Vi kan ikke akseptere slikt baby-språk og jalla-oversettelser hvis vi ønsker at dette dugnadsprosjektet skal bli tatt på alvor. Med mindre en administrator tar ansvar og sletter slikt søppel, kommer jeg fra nå av til å fjerne babbel-tekster og erstatte dem med en substubb - og merke dem som sådan. Håper andre gjør det samme, siden det er helt urealistisk at vi noen gang skal klare å oversette dette manuelt. --- Aldebaran (diskusjon) 4. des. 2017 kl. 22:21 (CET)
Ja, jeg har også sett slike oversettelser av egennavn; resultatet er at artiklene blir hysterisk morsomme, og norsk Wikipedia blir gradvis omgjort til en stor vits... Slike funn bidro til at jeg konkluderte med at oversettelsesverktøyet bør rulles tilbake. Det er som regel ikke smertefritt å endre tilbake til en tidligere versjon av en nettløsning, men min mening er at her bør det definitivt gjøres. Mvh Annelingua (diskusjon) 5. des. 2017 kl. 00:08 (CET)
Jeg støtter Aldebaran, Annelingua og andre som ønsker å stoppe denne galskapen.--Ezzex (diskusjon) 5. des. 2017 kl. 00:26 (CET)

Nå tillater jeg meg å redde tråden fra arkivaren. Jeg tror her trengs et (eller noen alternativer) som det kan stemmes over. Vi trenger å forsøke å finne frem til en beslutning. Jeg har vært temmelig usikker og har ikke utformet noe avstemmingsforslag riktig enda. Håper vi klarer å finne fram til noe her. --ツDyveldi☯ prat ✉ post 18. des. 2017 kl. 21:41 (CET)

Med all overbyråkratisering som presses inn, når skal vi få fred og mulighet til å jobbe med leksikonet (som jeg håper er grunnen til at de fleste er her, og ikke primært å forbedre Wikipedia gjennom diskusjoner(og avstemninger, skaping av tvangstrøye)?). Gode juledager, med lav diskusjonstetthet ønskes dere alle av 85.19.87.50 22. des. 2017 kl. 14:27 (CET)

Begrens til autopatruljerte brukere[rediger kilde]

Hvis det faktisk er slik at seriøse bidragsydere benytter seg av maskinoversettelse, får man i det minste begrense adgangen til den, slik at bare autopatruljerte brukere har tilgang til funksjonen og at den er slått av for alle andre. Det vil begrense skadevirkningene noe. Asav (diskusjon) 29. nov. 2017 kl. 16:52 (CET)

Det kan være lurt å ha et korrekt bilde av hvem som faktisk bruker innholdsoversettelse. [Og at det i dag er oversatt én (1) artikkel på 1995 tegn, og at denne har produsert en diskusjon på 7664 tegn…] — Jeblad 29. nov. 2017 kl. 17:17 (CET)
Merk at dette berører phab:T162410, og dermed phab:T162522 og phab:T162521. — Jeblad 29. nov. 2017 kl. 18:16 (CET)
Jeg er nysgjerrig av natur, så jeg gikk inn og kikket på de 40 seneste artiklene som har blitt opprettet ved hjelp av innholdsoversettelsesprogrammet. (Innimellom de 40 var det endel "rødlenkede artikler", dem har jeg naturlig nok ikke tittet på.) Og da ble jeg ganske forbløffet og litt bestyrtet - for med unntak av kanskje seks-syv artikler var det "språkrariteter" i dem alle sammen.
Det var gradsforskjeller i problemene, absolutt - men i sum ligger det ganske mange timers språkvask-behov bare i de artiklene. I noen av artiklene er det absurde "ny-ord" og ditto setningskonstruksjoner - i andre er det umusikalsk gjengivelse av engelsk originaltekst (en norsk leksikonartikkel bør f.eks. ikke dure i vei om alle de ulike "rasene" (!) som er representert i befolkningen i et geografisk område) - mens for den tredje gruppen artikler er det mest unorske (og laaaange og innfløkte) setningskonstruksjoner, store bokstaver i ord som "amerikansk", "nederlandsk", "sør-amerikansk", og tilsvarende språkfeil.
Så jeg må nok si at Asav har ropt varsko med god grunn. Det blir ikke god språklig (leksikon-)standard på norsk Wikipedia, dersom det er for fort og lettvint å masseprodusere "oversettelser". Det har definitivt skjedd en revolusjon innen maskinoversettelser i de senere år - og for all del, selv bruker jeg Google Translate (og jeg er klar over at dét er et annet verktøy enn det som er tilgjengelig på Wikipedia) til eget bruk for å få en viss peiling på hva en tekst dreier seg om, når det dreier seg om språk jeg ikke er særlig sterk i. Men før en tekst havner i en leksikonartikkel, den oppom et hode, og ikke bare "droppes" i et artikkelrom. Og derfor er jeg nå blitt tilhenger av restriksjoner i tilgangen til oversettelsesverktøyet.
I forlengelsen av dette: det er da ikke noe mål i seg selv at vi skal reprodusere på norsk Wikipedia, "alskens" artikler fra andre språkversjoner, bare for å "ha noe der"? For meg ser det ut til at det langt på vei er dét som blir resultatet av at alle kan benytte maskinoversettelsesverktøyet. Jeg ble rett og slett litt nedblåst og demotivert av totaliteten i det jeg så i disse artiklene! Innimellom at jeg skriver nytt og videreutvikler "gammelt" stoff, har jeg nemlig brukt endel tid på ren språkpuss og korrektur her inne. Slik mange andre har. Men her vokser visst språkblomstene så raskt og så vilt, at det er fåfengt å fortsette å luke i artikkelbedene...? Mistrøstig hilsen Annelingua (diskusjon) 30. nov. 2017 kl. 22:18 (CET)
Støttes--Ezzex (diskusjon) 1. des. 2017 kl. 00:17 (CET)

Jeg har ikke brukt verktøyet noe særlig, syntes det virket klumsete. Råoversettelse av ren tekst synes jeg er enklest med Google Translate. Men jeg opplever behov for oversettelse av en del kode særlig maler for kilder, dette er veldig kjedelig å gjøre for hånd og burde vel ligge til rette for automatisering. Vennlig hilsen Erik d.y. 1. des. 2017 kl. 23:44 (CET)

Kan støtte for andre (kilde)språk enn svensk, dansk og nynorsk deaktiveres? Uansett: Generelt mener jeg at terskelen for å slette artikler med "baby-språk" gulpet opp av dette verktøyet bør være LAV. SVÆRT lav. Helt enig med Annelingua i at dette er veldig demotiverende for oss som tar oss tid til å skrive på et språk som er forståelig (norsk, som vi liker å kalle det). Mvh --- Aldebaran (diskusjon) 2. des. 2017 kl. 00:20 (CET)
Jeg hører ikke til de flittige og viktig patruljører eller slettere, og skal ikke ta noen endelig stilling til spørsmålet. Det er gode argumenter for å ikke å bruke oversettelsesverktøy som satsplanke for å publisere artikler direkte. Da kommer de ofte uferdig ut. Dersom man ikke er en seriøs bruker, blir resultatet en uferdig artikkel. Jeg har brukt det noen ganger, men det har som oftest vært på språk jeg kan «litt», altså tysk, fransk og engelsk. Da kan jeg kontrollere oversettelsen, og endre språket før den publiseres. Og viktigere enda: da kan jeg kontrollere referansene! For russisk ville jeg aldri kunnet føre en slik kontroll, hverken av den oversatte tekst eller av referansene. Dansk og svensk leser jeg like godt som norsk, så da har jeg ikke følt det så nødvendig å bruke verktøyet, med mindre jeg har vært overmåte lat den dagen! For hovedregelen må jo være at man alltid har lest kildene som artikkelen er forankret i. Oversettelse uten å ha lest kildene kan man kanskje tenke seg dersom det dreier seg en kvalitetstestet artikkel på det fremmede språk, de som har fått vurderinger tilsvarende våre AA eller UA. Men også da vil man møte på problemer i oversettelsen av selve teksten. Hvordan kan man vite hva idiomatiske uttrykk på litauisk blir på norsk, dersom man ikke kan litauisk? Verktøyet må brukes med forsiktighet, men det må kniver også. Vi forbyr ikke brødkniver selv om de kan brukes vettlaust. Det er vanskelig å se noen vei tilbake. Inntil verktøyet forbedres ytterligere, må man bare slette og tagge med hard hånd. --Trygve Nodeland (diskusjon) 2. des. 2017 kl. 10:43 (CET)
Det er en dårlig analogi, syns jeg. Hvis det var slik at man konsekvent skar seg til blods med kjøkkenkniver, ville de muligens vært forbudt; om ikke annet ville nok bruken vært underlagt ganske strenge begrensninger! Og siden Wikipedia nå tilbyr automatisk oversettelse, som altså konsekvent gir skjærende resultater, bør tjenesten underlegges strenge begrensninger, mener jeg. Som foreslått bør adgangen avgrenses til autopatruljerte brukere, som må antas å ha en viss evne til å frembringe akseptable norske setninger. Asav (diskusjon) 2. des. 2017 kl. 11:14 (CET)
Begrensing til autopatruljerte brukere kan være et fornuftig tiltak, det vil trolig utelukke de verste tilfellene samtidig som rutinerte bidragsytere får tilgang til et nyttig verktøy. En slik forsiktig begrensning kombinert med våkne patruljører er trolig bedre enn å stenge verktøyet helt --Vennlig hilsen Erik d.y. 2. des. 2017 kl. 11:39 (CET)

Jeg har lagt en melding på patruljeringsforum og oppfordret patruljører om å være oppmerksomme på maskinoversettelser som er dumpet og ikke bearbeidet. --Vennlig hilsen Erik d.y. 2. des. 2017 kl. 11:41 (CET)

Jeg gikk gjennom en del artikler for en tid siden for å finne ut hvordan det lå an med kvalitet. Det jeg fant var at artiklene med grovest feil aldri var innom hverken Innholdsoversettelse eller VisualEditor. Faktisk er det slik at artikler via Innholdsoversettelse har færre grove faktafeil enn andre artikler. Det er også slik at grove faktafeil i artikler som er merket som «anbefalte» og «utmerkede» er tilnærmet umulig å få rettet. Prøv å ta en runde uten å logge inn, og rett rene faktafeil. Sjansen for å bli tilbakestilt er veldig stor. Forsøk å oversette en artikkel i Innholdsoversettelse, og legg inn et par språkfeil – artikkelen blir slettet uten spørsmål. Det spiller ingen rolle om den ellers er korrekt.
Vi er kommet i en situasjon hvor en pen og ordentlig artikkel blir beholdt, selv om den er stappfull av faktafeil, mens en med overfladiske skjønnhetsfeil blir slettet. Joda, vi har et kvalitetsproblem, men oversatte artikler er ikke den reelle risikoen. Den reelle risikoen er skribenter med manglende kunnskaper om det de skriver om. (Åpen kritikk av artikler med faktafeil er forøvrig en risikosport på dette prosjektet!) — Jeblad 2. des. 2017 kl. 12:02 (CET)
Som enhver skrevet tekst består et leksikon av to aspekter, form og innhold. Begge deler er viktige for å formidle et budskap. At det i dette tilfelle dreier seg om kunnskapsformidling betyr ikke at det formale blir mindre viktig. Det er her maskinoversatte tekster kommer til kort, og det forårsaker at det almene nivået på Wikipedia – og derved tilliten til dette lekiskonet – blir senket. Dette fører på sin side til at potensielle godt kvalifiserte bidragsydere blir mindre interessert i å bidra.
Det dreier seg altså ikke bare om det rent innholdsmessige; det finnes lingvistiske forskjeller disse programmene (ennå) ikke er istand til å fange opp, for eksempel er dobbel nektelse (slik som aldri ... hverken) ikke korrekt på norsk eller engelsk, men tillatt på fransk.
Derfor bør det altså være en forutsetning at de som benytter dette verktøyet har et noenlunde velutviklet begrepsapparat. Og den eneste måten Wikipedia kan håndtere dette på er såvidt meg bekjent å tildele slike brukere autopatruljert-status.
Med andre ord vil det være ønskelig om bare autopatruljerte brukere får tilgang til oversettelsesvertøyet, enda jeg personlig mener det burde vært slått helt av. Asav (diskusjon) 2. des. 2017 kl. 12:59 (CET)
Wikipedia på norsk skal spre kunnskap på et godt norsk. Maskinoversettelser vil i utgangspunktet ikke være tilstrekkelig for å oppnå det målet. Men disse programmene er kommet for å bli. Det taler for at programmene bør utvikles, og ikke stanses. En artikkel på et dårlig norsk, inngir ingen tillit. På den annen side kan det kanskje være like bra at den blir skrevet så dårlig, for da er det tydelig at den må bli raskt slettet! Jeg er redd for at den største risiko knyttet til maskinoversettelse, ligger i at disse blir kontrollert for godt språk, men deretter postes uten at kildene er sjekket, og gitt referanse. «Oversetteren» stoler på at den sjekken er gjort på den språkversjonen det er oversatt fra. Selv i vår utmerkede serie «Gode nye» ser jeg at det kommer artikler - på et godt norsk - som mangler individuelt innførte referanser. Dette er bidragsytere som forlengst har kvalifisert seg for autopatruljering. Jeg er usikker på om en artikkel egentlig er «god», dersom den helt mangler individuelle referanser. Det er mulig at det vil avhjelpe et ordensproblem å heve terskelen for å bruke verktøyet, men problemet bør vel være av en viss størrelse før slike regler innføres. Alle verktøyere bør i utgangspunktet være fritt tilgjengelig, synes nå jeg. Jeg har ikke nok oversikt til å si noe om «tålegrensen» er passert. Jeblad er ikke bekymret forstår jeg, og det sier jo noe. --Trygve Nodeland (diskusjon) 2. des. 2017 kl. 13:47 (CET)
Jeg liker å sjekke kildene selv når jeg oversetter stoff fra andre WPs, dessverre er det ikke alltid mulig og da skjer det jeg jukser og bare kopierer henvisningen. Trygve har rett i at det er en og annen "god ny" som ikke har spesifikke referanser, dette er ikke ideelt og det er mulig jeg har bidratt til å senke terskelen der - så langt jeg gidder og husker prøver jeg å utfordre hovedforfatter til å påføre refs slik at vi er sikre på at artikkelen holder "godt nytt" nivå. Vennlig hilsen Erik d.y. 2. des. 2017 kl. 14:30 (CET)
Foresvever meg at enkelte typer argumenter som brukes her er listet på tankefeil… — Jeblad 2. des. 2017 kl. 14:50 (CET)
Nei Jeblad, nå må du snart slutte å strø rundt påstander om «tankefeil». --Vennlig hilsen Erik d.y. 2. des. 2017 kl. 17:03 (CET)
Bare å sjekke ut under «relevansfeil». — Jeblad 2. des. 2017 kl. 18:21 (CET)
Spar oss for tøys. --Vennlig hilsen Erik d.y. 2. des. 2017 kl. 18:29 (CET)
Hvis du må ha det inn med teskje; i dette tilfellet var det Trygve som kom med et tøvete utsagn, og som han har korrigert. — Jeblad 2. des. 2017 kl. 18:55 (CET)
Jeg vil verken ha nedlatende kommentarer om teskje eller dulgte påstander om andres «tankefeil». Dersom du mener andre tar feil, så vil jeg oppfordre deg til å komme med konkrete motargumenter eller fakta. Hele denne avsporingen kan slettes. --Vennlig hilsen Erik d.y. 2. des. 2017 kl. 19:27 (CET)
Brukeren det gjaldt har selv moderert seg, på tide at andre følger etter! — Jeblad 3. des. 2017 kl. 20:27 (CET)
Det er nok nå Jeblad. --Vennlig hilsen Erik d.y. 3. des. 2017 kl. 21:38 (CET)
Nei selvfølgelig, du har nok rett! — Jeblad 3. des. 2017 kl. 22:11 (CET)

Problemet Trygve Nodeland påpeker er selvsagt reelt; det knytter imidlertid seg ikke til oversettelsesverktøyet, men er et generelt problem. (Jeg vil minne om at det tok en ganske opphetet og langvarig kamp for i det hele tatt å få aksept for at bruken av referanser er grunnleggende her i Wikipedia!) Men at det eksisterer et problem med hensyn til dette, påvirker såvidt jeg kan skjønne ikke et helt annet problem, nemlig kvaliteten på teksten som ramler ut av oversettelsesfunksjonen.

Og den ligger fortsatt på et svært bedrøvelig nivå. Jeg er, i likhet med Nodeland og flere andre her, ikke i tvil om at det er et tidsspørsmål før automatiserte, AI-drevne oversettelser når en akseptabel standard. Men så langt er vi altså på langt nær kommet, til tross for at Google og andre investerer bokstavelig talt milliarder i teknologien, som jeg av forskjellige yrkesrelaterte grunner har fulgt på ganske nært hold gjennom endel år. Så når det sies at «programmene bør utvikles, og ikke stanses,» er jeg helt enig i dét. Men det skal skje hos Google, og ikke her. Norske Wikipedia skal ikke være et testlaboratorium for denne type programvare! De eneste effektene dette har, er at kvantiteten øker, kvaliteten faller og nye bidragsydere (med god grunn) tror at tekster av lav sproglig kvalitet er akseptable – litt efter prinsippet «tåler du den, tåler du denne også.» Asav (diskusjon) 2. des. 2017 kl. 15:11 (CET)

Den enkleste måten å få bedre språk i artiklene er å kutte ut riksmål. Da kan det tas ibruk obligatorisk stave- og grammatikksjekk, og publisering kan stoppes om det er for mye feil. Vi kan ikke bruke slike verktøy på grunn av noen få brukere som insisterer på en arkaisk form for riksmål. Det beste vi kan oppnå nå er frivillig bruk av slike verktøy. Hvor mange av dere har slått på stavesjekk? Hvor langt tilbake i denne tråden må en gå før første arkaiske feilen dukker opp? Asav har en arkaisk feil («efter»), Trygve har en skrivefeil («verktøyere»), så har Asav flere («lekiskonet»), osv. Joda, vi kan få bedre sjekk av skrivefeil, men da kommer det nok til å bli en god del klaging. (Hvordan dere slår på stavesjekk finnes på Hjelp:Stavesjekk.) — Jeblad 2. des. 2017 kl. 16:26 (CET)
La meg bare før lørdagskvelden rinner ut, si at min henvisning til Jeblads bekymring var en spøk i all vennlighet. Jeg setter stor pris på Jeblad og hans engasjement og arbeid for dette prosjektet. Om det nå skulle ha festnet sig indtrykk av noget annet. Han har også rett i at det blir for mange skrivefeil. Vi behøver flere norsklærere til å bidra! Det får bli efterhvert. --Trygve Nodeland (diskusjon) 2. des. 2017 kl. 16:41 (CET)
At Jeblad misliker riksmålsformer er ingen hemmelighet. Men det er også fullstendig irrelevant i denne sammenhengen, rent bortsett fra at riksmål-og nynorskbrukere vanligvis har et mer bevisst forhold til korrekt norsk enn bokmålsbrukere, siden de nok generelt er mer opptatt av sprog- og stilspørsmål. Det er heller ikke slik at jeg for min del korrekturleser innleggene her like nøyaktig som artikkelbidrag, og jeg håper inderlig det samme gjelder for Jeblad!
Hva angår selve kjernespørsmålet her, er det fortsatt ubesvart – og jeg håper ikke forsøkene på digresjon fører til at denne tråden sporer helt av. Bør man altså stemme over hvorvidt oversettelsesverktøyet skal forbeholdes autopatruljerte brukere? Asav (diskusjon) 2. des. 2017 kl. 17:06 (CET)
For meg er det helt greit å forbeholde verktøyet autopatruljerte, men mulig at dette er inngrepende endring som krever avstemning? Vennlig hilsen Erik d.y. 2. des. 2017 kl. 17:15 (CET)
Hva nytter det å begrense bruken av verktøyet til autopatruljerte brukere, når det er nettopp et lite knippe autopatruljerte brukere som står for de fleste artiklene? TorbjørnS (ʦ) 2. des. 2017 kl. 17:31 (CET)
Jeg var en av de som var for at riksmål skulle bli akseptert målform på dette prosjektet, var faktisk en av de som drev det gjennom, noe jeg nå mener er feil. Vi har nå fått en situasjon hvor vi har unødig mye skrivefeil på grunn av arkaiske riksmålsformer. Det er litt betegnende at ordlista for bokmål har ord som er skrivefeil… Og joda, jeg har slått på stavesjekk. (Sjekk Hjelp:Stavesjekk!) — Jeblad 2. des. 2017 kl. 18:18 (CET)

Jeg likte knivanalogien til Trygve Nodeland. Det er riktig at brødkniver ikke er forbudt og ikke kommer til å bli det, men det er straffbart å bære dem på offentlig sted uten et aktverdig formål, jf straffeloven 2005 § 189 2. og 3. ledd. Ikke dermed sagt at det skal være straffbart for nybegynnere å bruke oversettelsesverktøyet, men bidragene er ikke verneverdige og bør fjernes.
-- Jeg ser ingen grunn til at dette verktøyet skal kunne brukes av andre enn autopatruljerte brukere. Vi har hatt nok misforståelser om hva verktøyet er og hvordan vi ønsker at det skal brukes. Vi hadde en velrennomert svensk bruker som trodde vi ønsket at det skulle brukes. Dette til tross for at vedkommende ikke kunne skrive norsk. Vi har hatt en rekke nybegynnere som bruker verktøyet og det er åpenbart at de ikke kan lese norsk. Verktøyet er ikke leveringsdyktig på korrekt norsk, verken bokmål, nynorsk eller riksmål og egner seg ikke til å kontrollere om teksten er blitt noen som helst form for norsk. Verktøyet leverer ukontrollert tekster som ofte ligner mest på Kaudervelsk.
-- En grunnforutsetning for å bruke det er å kunne både lese og skrive norsk og å kunne lese det språket det oversettes fra. Brukere som er autopatruljert kan vi i alle fall gå ut fra at fyller kravene til å kunne lese og skrive norsk og reserverer vi verktøyet for disse så slipper vi i alle fall fremmedlandske brukere som kanskje kan lese sitt eget språk, men som ikke behersker norsk verken på den ene eller andre måten. ツDyveldi☯ prat ✉ post 2. des. 2017 kl. 20:23 (CET)

Hvem bruker Innholdsoversettelse[rediger kilde]

I løpet av en måned blir det oversatt omtrent 50 artikler. Av disse blir omtrent 10 slettet. Brukere med autopatruljør eller mer som gruppetilhørighet oversetter omtrent 35 artikler, resten er skribenter med lavere gruppetilhørighet. Antall artikler oversatt av sysops er omtrent lik antall med lavere gruppetilhørighet.

[Lagt til pga redkol: Det vil si at rundt regnet 70% av artiklene er publisert av brukere med autopatroller eller høyere. Det betyr også at det ikke er slik at noen få nye brukere publiserer et stort antall oversatte artikler. Normalt er det under ti artikler publisert av nye brukere hver måned, og ofte ned mot fem.]

Kort sagt, det som omtales som «kaudervelsk» er oversatt av slike som 4ing (4), Jpfagerback (6), Knuand (7), og Annikdance (8). Sist måned sto de for halvparten av de oversatte artiklene, og er autopatruljør eller høyere.

Det som kan fungere er å begrense publisering direkte til hovedrommet for de som ikke er autobekreftede brukere, slik at de må publisere til eget brukerrom. De kan heller ikke flytte artikler, så de vil ikke kunne flytte artikler ut av eget brukerrom, men må be andre brukere om hjelp til dette. — Jeblad 3. des. 2017 kl. 20:09 (CET)

Men @Jeblad:, du har jo selv en meget sikker språkføring. Samtidig tror jeg ikke at du bruker tiden din på å rydde i "kaudervelske" artikler - nå gjetter jeg bare, men jeg har ikke sett deg i artikkelhistorikk på slike ting, og jeg observerer jo at du konsentrerer deg om teknisk utvikling av Wiki-prosjektene. Og det er jo et arbeid som trengs, det også, så den prioriteringen er fullt forståelig. Det jeg da lurer på, er om du undervurderer hva som skal til for å produsere en språklig god artikkel - og hvor tidkrevende det er for andre å rydde opp når brukere av innholdsoversettelsesverktøyet etterlater seg kaudervelske artikler? (Det er ofte sånn at folk som har en ferdighet "innebygget", glemmer at den ikke er innebygget hos alle...) Jeg synes statistikken du presenterer er det beste argumentet jeg har sett til nå, for at det overveiende flertall av norsk Wikipedias bidragsytere ikke er modne for å ha tilgang på innholdsoversettelsesverktøyet. Det koster rett og slett mer enn det smaker å beholde det i dets nåværende stand. Beklageligvis - men når det er videreutviklet, kan man jo forsøke igjen? Annelingua (diskusjon) 3. des. 2017 kl. 20:33 (CET)
Hvis du mener at de som står for 70% av de oversatte artiklene gjør en for dårlig jobb så tror jeg du bør ta det opp med dem, jeg er ikke riktig mottaker. Hør med de fire jeg listet ovenfor, uten at jeg vil si det er noe galt med deres artikler. Jeg har imidlertid en en viss idé om at enkelte reagerer på oversatte artikler fordi de oversettes til «feil» skriftmålsnormal. Hadde oversettingene inneholdt litt mer «efter» så hadde det blitt mindre bråk.
Tror ikke jeg vil diskutere hva jeg bruker tid på, men joda, jeg har nok ryddet i oversatte artikler. Jeg har også brukt tid på å se om vi kan få til fungerende korrektursystemer. — Jeblad 3. des. 2017 kl. 21:02 (CET)
Du må lese det andre skriver Jeblad før du kommenterer det andre har skrevet. Verktøyet leverer kaudervelsk og det er et problem når kaudervelsken blir stående. Ingen av 4ing (4), Jpfagerback (6), Knuand (7), eller Annikdance (8) etterlater oversatte artikler i en slik tilstand. De jobber med oversettelsen, i motsetning til det de uerfarne brukerne gjør. --ツDyveldi☯ prat ✉ post 3. des. 2017 kl. 21:41 (CET)
Inntil du presenterer en gyldig og holdbar kvalitativ analyse så mener jeg min overfladiske kvantitative analyse gir et gyldig og tilstrekkelig diskusjonsgrunnlag. (Joda, jeg vet hvordan resultatet vil bli.) — Jeblad 3. des. 2017 kl. 22:03 (CET)
Uff, du tilla meg visst en tone som ikke var tilsiktet, Jeblad. For å ta det siste i ditt svar til meg først: jeg mente på ingen måte å innlede en polemikk om hva du bruker tiden din til - meningen min var fullt og helt å si at det var forståelig dersom det var slik at du ikke hadde brukt så meget tid på å rydde opp i artikler med mye kaudervelsk (din karakteristikk, men den er treffende for mye av det vi ser), som det en del av oss andre har.
Når det gjelder din oppfordring til meg om å gå i rette med individuelle bidragsytere, så er det sikkert ment som en spøk? (Det var du som introduserte at 70 % av "verktøyets produkter" er kaudervelske artikler, men la nå dét fare.) Her er det softwaren som er rullet ut prematurt, og det kan ikke avhjelpes ved at Wikipedia-kolleger i etterkant skal løpe etter hverandre og påpeke at "softwaren resulterer i mangelfulle ut-data, og kan de vennligst jobbe mer med ut-data?" Det er fint at tekniske utviklermiljøer er veldig fornøyd med alt de har fått til med verktøyet - men det er fremdeles å regne som en beta-versjon. All ekstrajobben som verktøyet genererer tilsier at det må rulles tilbake, og re-lanseres først når det foreligger i en ny og forbedret versjon.
Og da lurer jeg på om noen kan opplyse hvem som beslutter tilbakerulling av tekniske løsninger som ikke klarer jobben de skal gjøre? OG: hvem er det rent praktisk som "slår på tilbakerullingsbryteren"? De to tingene kunne vært greit å få avklart, i stedet for at vi fortsetter å synse i vei i stedet for å få en beslutning (hvilken vei nå enn den beslutningen måtte gå). Mvh Annelingua (diskusjon) 3. des. 2017 kl. 22:51 (CET)
Nei, det jeg skrev var «rundt regnet 70% av artiklene er publisert av brukere med autopatroller eller høyere» og «det som omtales som «kaudervelsk» er oversatt av…» Det er ikke uten grunn at «kaudervelsk» står i hermetegn, du bør ta dette med brukere som kommer med slike påstander. Jeg mener omtaler med «kaudervelsk» er feil og insinuerende. — Jeblad 4. des. 2017 kl. 13:14 (CET)
Når vi bortser fra at en av brukerne misbruker denne tråden til å hetse dem som bruker riksmålsformer på Wikipedia – hva som er like irrelevant som det er absurd – synes det å være enighet om å begrense adgangen til automatiske oversettelser til autopatruljerte brukere. Det vil om ikke annet redusere problemet noe, enda tekster som bygger på maskinoversettelser fortsatt ikke holder samme formale standard som nyskrevne bidrag av erfarne, altså autopatruljerte, brukere. Dette har også vært påpekt av flere skribenter tidligere i tråden. Det er ikke noe ukjent fenomen (og begrenser seg på ingen måte til Wikipedia.) Det er blant annet vanskelig å få øye på anglisismer i ordvalg og syntaks, hva som ytterligere forsterkes ved at man helst ikke skal lese korrektur på skjerm. Men hva skal til for å innføre denne begrensningen? Asav (diskusjon) 3. des. 2017 kl. 23:39 (CET)
Min oppriktige mening er at riksmål burde vært hivd ut av denne utgaven, det er en eneste lang arkaisk skrivefeil. Jeg var med å fikk aksept for at riksmål ble akseptert på dette prosjektet, jeg startet til og med et par av diskusjonene, og det beklager jeg. Det var en feil. — Jeblad 4. des. 2017 kl. 13:02 (CET)
Ja, nå har du vel gjentatt det et halvt dusin ganger, men det blir ikke mer relevant for denne diskusjonen av den grunn. Tvertimot skaper det bare støy og avleder fra hva dette tråden faktisk dreier seg som, nemlig hvordan vi skal håndtere maskinoversatt tekst som ikke holder mål. Asav (diskusjon) 4. des. 2017 kl. 13:12 (CET)
Antallet artikler vi snakker om som potensielt kan være et problem (gitt at autopatrollere kun skriver gode artikler) er over en måned normalt i størrelsesorden fem (5) artikler. Dagsproduksjonen på dette prosjektet er på over 50 artikler, med topper over 100 artikler. I disse tilfellene snakker vi da om å flytte artikler ut av hovedrommet eller slette dem. Hvor mye innsats krever det? Sett det opp mot at vi har artikler hvor alminnelig stavesjekk ikke fungerer på grunn av en håndfull brukere som nekter å bruke normert språk. Vi har noen få titalls artikler skrevet på rent riksmål, – og et par tusen med en lapskaus av riksmål og bokmål. Det er et reelt problem. — Jeblad 4. des. 2017 kl. 13:31 (CET)

Yandex[rediger kilde]

flyttet til eget avsnitt

Nå må vi telle til ti her. Det er noen fakta som er helt klare i denne saken og det er at 1) Innholdsoversettelse skaper gode artikler og dårlige artikler, og 2) Disse gode og dårlige artiklene skapes av alle grupper, både autobekreftede, autopatruljere og andre. Diskusjonen om hvilke grupper som skal ha tilgang vil dermed ikke ha noe å si uansett. Men hvis vi først skal gjøre innholdsoversettelse bedre er det som sagt å slå av Yandex! Oversettelse med Yandex er ikke noe særlig annerledes enn å oversette med Google Translate eller andre oversettelsesverktøy, og omtrent det eneste gode med Yandex er at man i første redigeringsforklaring gir en lenke til hvor det er oversatt fra. Jeg vil tro at i 99 % av tilfellene der det er snakk om «kaudervelsk» så er dette oversettelser fra engelsk med Yandex, og ikke oversettelse fra nynorsk og dansk med Apertium. Dette har det jo også egentlig blitt enighet om i tidligere diskusjoner, og jeg tror vi løser mye av problemene vi snakker om hvis vi bare bruker Apertium. Yandex har sikkert sine styrker, men de er ikke gode nok per dags dato. --- Løken (diskusjon) 3. des. 2017 kl. 22:41 (CET)
Har tatt opp tidligere at Yandex-motoren er for dårlig, men så lenge det bare er noe jeg sier så blir jeg ikke hørt. (phab:T162524, phab:T176582) — Jeblad 4. des. 2017 kl. 13:08 (CET)
Jeblad: Det er ingen tvil om at motoren er for dårlig for norsk-engelsk-norsk, men kan man fjerne den fra CT på dette prosjektet? Når vi stemte inn CT for å prøve det ut var det kun Apertium som ble nevnt, Yandex og støtte for engelsk ble lagt til senere uten informasjon. Hvis dette går an vil jeg påstå at det løser de problemene vi har diskutert i årevis snart. --- Løken (diskusjon) 5. des. 2017 kl. 01:14 (CET)
Nå har jeg rotet meg inn på Phabricator (som nevnt tidligere er jeg en nysgjerrig sjel...), og jeg ser der at Jeblad tidlig ropte varsku om at Yandex ikke taklet oversettelser til norsk, og neppe hadde potensial til å klare det i overskuelig fremtid, heller. Så da lurer jeg på, Mal:Ping:Jeblad: når du skriver rett ovenfor her at "Har tatt opp tidligere at Yandex-motoren er for dårlig, men så lenge det bare er noe jeg sier så blir jeg ikke hørt" - anser du at det ville hjelpe om flere brukere av de norske Wikipediaene ga sitt besyv med i laget inne på Phabricator? Eller er det ikke derfor du ikke blir hørt, tror du? Trengs det flere konkrete eksempler som utviklerne vil kunne forstå? Dersom du har noen synspunkter på hva som trengs, ville det være flott.
Jeg ble nysgjerrig på å teste Yandex-verktøyet direkte, så jeg laget meg en tulletekst som jeg kjørte gjennom Yandex-kvernen (på denne siden her: https://translate.yandex.com/?lang=en-no). Dette var tulleteksten min - jeg la inn endel egennavn som også er "vanlige substantiver":
Else Fagerstrand is a Norwegian actress famous for portraying Grace Goodwill on the big screen in the play 'Nutcrackers are nuts', originally written as a sit-com spoof by Melody Heart. Fagerstrand was born and raised in Hell in the county of Nord-Trøndelag in the 1950s. Upon her marriage to Earnest Carpenter in 1972 she was whirled into a jetset lifestyle which was eventually to become her downfall.
Dette var "oversettelsen" jeg mottok fra Yandex:
Andre Fagerstrand er en norsk skuespiller kjent for å portrettere Nåde Goodwill på den store skjermen i play 'Nutcrackers er nøtter', opprinnelig skrevet som en sit-com parodi av Melodi Hjertet. Fagerstrand var født og oppvokst i Helvete i fylket i Nord-Trøndelag på 1950-tallet. Ved sitt ekteskap med Alvor Snekker i 1972 ble hun virvlet inn i en jetset livsstil som til slutt ble til å bli hennes undergang.
Jeg teller fjorten direkte feiloversettelser i det avsnittet - og da har jeg ikke tellet syntaksfeil. Selv en som ikke behersker norsk vil kunne se at egennavnene har blitt helt endret etter å ha vært i kontakt med Yandex... Annelingua (diskusjon) 6. des. 2017 kl. 00:57 (CET)
w:Yandex Translate er basert på en statistikk-motor. Slike motorer kan lage en forståelig tekst, på språk som er svært forskjellige. Da kan en omskrive denne teksten slik at den blir forståelig for andre. Den er ikke god nok for direkte gjenbruk. Yandex kjører også våre oversettelser tilbake i motoren, den trenes på våre rettinger, slik at den blir bedre desto mer vi bruker den. Jeg gjorde for en tid siden noen forsøk med denne motoren, og ble overrasket når mine skrekk-eksempler ble borte noen dager senere. Folka som lager innholdsoversettelsesverktøyet fortalte da at Yandex-folka oppdaterte motoren med våre oversettelser.
w:Apertium er derimot en regelbasert motor. Den fungerer godt mellom språk som er like, en sier at oversettelsesmotoren er grunn. Denne motoren lærer ikke av tidligere feil, det må skrives nye regler eller gamle må rettes for at feil skal fanges opp. Kvaliteten på nob-nno paret er svært god, nob-dan er ikke fullt så god, og nob-swe er litt bob-bob. Største problemet med nob-dan er at dansk mangler hunnkjønn, og ord på norsk får dermed feil kjønn. Største problemet med nob-swe er at tempus er annerledes, ord på norsk kan da få feil tid. For alle gjelder det at ordbøkene er mangelfulle, dermed blir ikke ord oversatt. Fra nynorsk går det ofte bra, men ikke fra dansk og svensk.
Jeg ønsker at vi får på plass verktøyet w:LanguageTool. Dette vil merke en del opplagte skrivefeil som andre verktøy lar passere. En god del av jobben er allerede gjort i et GsoC-prosjekt, men vi mangler en god måte å få merkingen inn i våre redigeringsverktøy. Det er mulig å få til dette i VisualEditor og WikitextEditor, men i den gamle redigeringsruta er det vanskelig.
Problemet med dårlige tekstdump er nokså trivielt. En ting er at det nesten ikke forekommer, en annen ting er at det eneste som trengs er en mekanisme for å stoppe direktepublisering til hovedrommet for brukere som mangler gitte rettigheter. Dette er ikke annet enn en rettighet for å opprette nye artikler, og det har vi diskutert tidligere. Såvidt jeg husker ble det avvist, men det kan sikkert diskuteres på nytt.
I vår var det to tråder på wikimedia-l om dette, Turn the extension for ContentTranslation off? og machine translation. Det kan være lurt å lese alle innleggene, spesielt svarene til Amir E. Aharoni. — Jeblad 6. des. 2017 kl. 15:23 (CET)
Re: «Største problemet med nob-dan er at dansk mangler hunnkjønn, og ord på norsk får dermed feil kjønn» Både riksmål og «moderat bokmål» benytter felleskjønn (Utrum istedenfor femininum, bortsett fra noen særtilfeller, som det vil gå for å langt å komme inn på her. Men nettopp dette viser at teknologien ennå ikke er moden til å bli tatt i bruk! Som flere andre har påpekt allerede, har maskinoversettelser gjort betydelige fremskritt de siste ti til tyve årene, men de er ennå på langt nær gode nok til å kunne tas i bruk.
Det er fullt forståelig at programmere ønsker å benytte Wikimedia som laboratorium for denne type programvare, siden det gir en rik og variert tilstrømning, både med tanke på semantikk, vokabular og syntaks. Men jeg mener fortsatt at det ikke er vår oppgave å være testobjekt for dette, så vi bør begrense adgangen til tjenesten mest mulig.
Maskinoversettelser resulterer gjerne i hva jeg vil kalle «kvasi-norsk», dvs. tekster som ligger mer eller mindre nært opptil korrekt norsk. men ikke er det. Derfor kan det være vanskelig for brukeren å få øye på hvor teksten må rettes opp for å bli passabel. (Dette er forresten ikke noe som bare plager Wikipedia; om man er på norske dagsaviser, oppdager man ganske raskt hvile journalister som bruker maskinoversettelser som grunnlag. Det er slik «kropp» har sneket seg inn der det egentlig skal stå «lik» pga. det engelske body eller «annonsere» (announce) erstatter «kunngjøre». Asav (diskusjon) 8. des. 2017 kl. 11:53 (CET)
Det er en vesentlig forskjell på no-nn/no-da kontra no-en eller andre språk, og den går på hvilket produkt du får uten å gjøre noe med teksten i etterkant. Ingen av de er gode nok til å gå rett til hovedrommet, men arbeidet du må gjøre med en oversatt artikkel fra dansk og nynorsk er vesentlig mindre enn fra engelsk via Yandex. Dermed vil det endelige produktet bli tett opp mot godt nok for dansk/nynorsk, men ikke i nærheten av godt nok på engelsk hvis du gjør samme innsats. Vi har brukere som klarer å gjøre en innsats for å kjøre gode oversettelser også via engelsk, men der det er snakk om "dårlig produkt" er det utelukkende Yandex som er brukt. Altså: Ja til Apertium, nei til Yandex. --- Løken (diskusjon) 8. des. 2017 kl. 13:31 (CET)
Artikkelen Utrum er feil, men jeg har ikke ork til å gå løs på den. Norsk bokmål har både et tokjønnssystem og et trekjønnssystem, nynorsk har et trekjønnssystem. En omtrentlig grense mellom trekjønnet og tokjønnet går omtrent mellom radikalt og konservativt bokmål. Riksmål har et bein i begge leire, men uten at det er klart hvor grensene går. En kan nok si at å skrive riksmål med trekjønnsystem er en anakronisme, men noen vil sikkert protestere. (Før noen protesterer, les Kulbrandstads Språkets mønstre, den brukes på UiO.) (Joda, oversettelse fra dansk og til riksmål vil gi færre feil.)
Mye av det som skrives ovenfor er ikke riktig. (Egentlig er det kav gale…) Ingen bruker «Wikipedia som laboratorium», noe slikt ville nok ganske raskt utløst reaksjoner fra sentralt hold. Innholdsoversettelse er et sentralt støttet verktøy som det er lagt mye ressurser i å få til å fungere. Det er vi som lager verktøyet, og for å få det til bruker vi noen eksterne motorer. . Det er nokså tydelig av eksempler som brukes at folk ikke har satt seg inn i hva verktøyet gjør eller hva slags resultater en kan oppnå. Når folk ikke engang gidder lese de forklaringene som blir gitt, så vet jeg ikke om det gir mening å skrive noe mer. — Jeblad 9. des. 2017 kl. 00:13 (CET)

Re: «Innholdsoversettelse er et sentralt støttet verktøy som det er lagt mye ressurser i å få til å fungere.» Jeg er redd for at en slik uttalelse er symptomatisk for deler av IT-sektoren. Men løsninger er til for brukerne, i dette tilfellet leserne av Wikipedia, hverken skribentene eller programmererne!

Kan man nå i det minste bli enig om å

  • kutte ut Yandex fullstendig fra norske Wikipedia?
  • begrense bruken av automatisk oversettelse til autopatruljerte bidragsydere for å redusere skadevirkningene noe?

Må det en avstemning til? Det har jeg ennå ikke fått svar på. Asav (diskusjon) 9. des. 2017 kl. 12:10 (CET)

Min kjennskap til verktøyene som er integrert i (norsk) Wikipedia er fortsatt svært begrenset. Men jeg leste denne tråden nå: https://meta.wikimedia.org/wiki/2017_Community_Wishlist_Survey/Editing#ContentTranslation_extension_for_others_wikis - og så ser jeg at en haug med folk har gitt sin støtte til å innføre "Content Translation" på flere wikier, ikke bare på Wikipedia som nå. Så da lurer jeg veldig på 1) hvorvidt det er Yandex de snakker om? 2) hvorvidt alle de motforestillingene en rekke av oss har luftet her i denne tråden på no:wiki/Tinget, burde luftes også inne på Community Wishlist før avstemningsfristen i morgen (11.12.2017) utløper? (Jeg gikk inn på Wishlist for første gang nå, så nå forholder jeg meg til mye ukjent på en gang...) Annelingua (diskusjon) 10. des. 2017 kl. 23:11 (CET)

Call for Wikimania 2018 Scholarships[rediger kilde]

Hi all,

We wanted to inform you that scholarship applications for Wikimania 2018 which is being held in Cape Town, South Africa on July 18–22, 2018 are now being accepted. Applications are open until Monday, 22 January 2018 23:59 UTC.

Applicants will be able to apply for a partial or full scholarship. A full scholarship will cover the cost of an individual's round-trip travel, shared accommodation, and conference registration fees as arranged by the Wikimedia Foundation. A partial scholarship will cover conference registration fees and shared accommodation. Applicants will be rated using a pre-determined selection process and selection criteria established by the Scholarship Committee and the Wikimedia Foundation, who will determine which applications are successful. To learn more about Wikimania 2018 scholarships, please visit: wm2018:Scholarships.

To apply for a scholarship, fill out the multi-language application form on: https://scholarships.wikimedia.org/apply

It is highly recommended that applicants review all the material on the Scholarships page and the associated FAQ before submitting an application. If you have any questions, please contact: wikimania-scholarships at wikimedia.org or leave a message at: wm2018:Talk:Scholarships. Please help us spread the word and translate pages!

Best regards, David Richfield and Martin Rulsch for the Scholarship Committee 20. des. 2017 kl. 20:24 (CET)

User group for Military Historians[rediger kilde]

Greetings,

"Military history" is one of the most important subjects when speak of sum of all human knowledge. To support contributors interested in the area over various language Wikipedias, we intend to form a user group. It also provides a platform to share the best practices between military historians, and various military related projects on Wikipedias. An initial discussion was has been done between the coordinators and members of WikiProject Military History on English Wikipedia. Now this discussion has been taken to Meta-Wiki. Contributors intrested in the area of military history are requested to share their feedback and give suggestions at Talk:Discussion to incubate a user group for Wikipedia Military Historians.

MediaWiki message delivery (diskusjon) 21. des. 2017 kl. 11:46 (CET)

En synlig forbedring: Visual Editor![rediger kilde]

Bruken av referanser, altså kildehenvisninger, er noe av det som skiller Wikipedia fra andre leksika, for eksempel Store Norske Leksikon. Et eksempel er vår egen artikkel om høyreradikalisme, og den til SNL. SNLs artikkel er egenproduksjon av godt merke, vår egen artikkel holder også en god standard. Og vår artikkel har i hvert fall det som er et krav i vårt prosjekt: det er gitt henvisning til de kilder som er anvendt, det vi kaller referanser. SNLs forfattere nøyer seg med det de selv har skrevet, som er meget bra, men det finnes jo også andre som har interessert seg for dette. Les denne sammenlikningen som et forsøk på å illustrere at to artikler, den ene i et ordinært leksikon og den andre på Wikipdia, som i tekstinnhold er like gode, alltid være best på Wikipedia. Det skyldes at Wikipedia med sine referanser viser veien videre. En annen leksikon-artikkel blir stående som en blank påstand, underbygget av forfatternes autoritet.

I vår artikkel denne gang, kunne det vært enda bedre, slik det alltid kan. En av referansene lyder nemlig slik: «Norris, Pippa (2004). The Right in Elections (engelsk). Chicago: Annual Meeting of the American Political Science Association. s. 2. [Upublisert paper].» Bakgrunnen for å vise til denne kilden er en interessant refleksjon som fremgår av artikkelen. Mest sannsynlig er det dekning i kilden for det som står i vår artikkel, men kan vi være helt sikre på det? Og dessuten, ville det ikke vært det beste, kanskje til og med høfligst overfor leseren å sitere kilden? Ordet sitering er her brukt i alminnelig språklig forstand, nemlig gjengivelse av tekst ord for ord.

Når du bruker kilder som er vanskelig tilgjengelig for godtfolk, er det min oppfordring at du bør sitere kildene - ord for ord. Mange bøker som finnes i bokhyllene rundt omkring i de norske wikipediahjem, finnes bare der. Pippa Norris ble aldri noen bestselger, men hun eller han var nok likevel verdt å sitere - ord for ord. Det samme gjelder mange gamle bøker, og de på utenlandsk språk, og som ennå ikke er kommet i google books.

Så vil noen innvende at i akademia gjør de de ikke slik. Der nøyer de seg med å angi forfatter, ISBN, og sidetall. I tillegg har de flotte latinske forkortelser som vi ikke bruker. Da må det være nok også for oss. For det første er jeg ikke så sikker på at professorene alltid siterer korrekt, selv om det bør være slik. Men i vårt prosjekt oppstår det særlige behov, fordi vi er så mange forfattere på hver enkelt artikkel. Hver enkelt faktaopplysning som vår egen tekst bygger på, kommer fra et sted. Den blir satt inn av én, og siden flyttet av en annen som gjør artikkelen bedre. Da bør etterfølgeren vite nøyaktig hvilken opprinnelig tekst som den første forfatteren bygde på, for ellers er grunnteksten ikke tilgjengelig. Og for deg som liker å skrive lange artikler over tid: Dette er en god måte å huske hvor du avsluttet sist gang! Er dette fremtidsmusikk?

Fremtiden er her! Den kalles Visual Editor. Gå inn på Visual Editor, trykk på «Angi kilde», fyll ut alle rubrikker, og så, helt nederst, skriv inn hva du fant av interessant tekst i den kilden du viser til. Så kan leseren bedømme selv. Og vi som kommer etter, kan bygge artikkelen videre ut. Moderne mennesker bruker Visual Editor!--Trygve Nodeland (diskusjon) 27. des. 2017 kl. 10:50 (CET)