Wikipedia-diskusjon:AutoWikiBrowser/Typos

Sideinnholdet støttes ikke på andre språk.
Fra Wikipedia, den frie encyklopedi

Hva skal med og hva skal ikke med[rediger kilde]

Circa spytter ut «$1irka». TorbjørnS-AWB (diskusjon) 20. mar. 2016 kl. 06:15 (CET)[svar]
Prøv nå.--Telaneo (Diskusjonsside) 20. mar. 2016 kl. 07:49 (CET)[svar]
Det er nok delte meninger om dette som om mye annet. Jeg kan ikke finne noe sted der dette har vært diskutert. Ettersom «f.eks» er en godkjent forkortelse mener jeg den ikke bør endres. M14 (diskusjon) 30. mar. 2016 kl. 15:03 (CEST)[svar]
Jeg synes å huske å ha lest i en eller annen retningslinje, hjelpeside eller noe sånt at slike forkortelser burde skrives ut. Ser ikke ut til å finne den, kan godt være jeg husker feil. Har skilt ut forkortelsene i eget avsnitt og deaktivert dem. De burde aktiveres igjen hvis vi finner ut av at slikt burde skrives ut.--Telaneo (Diskusjonsside) 30. mar. 2016 kl. 15:11 (CEST)[svar]
Jeg har alltid hørt at man i artikkeltekster skal skrive forkortelser helt ut, fordi det ikke er «plassmangel» på Wikipedia. Om dette er en regel eller en anbefaling vet jeg ikke. Når det er sagt, ser jeg at det er forkortelser i såpass mange artikler at det kanskje kan generere støy å rette opp i alle. Jeg har hittil kun gjort disse korrigeringene der det har vært andre korrigeringer, men forkortelsene genererer svært mange treff som jeg vanligvis, foreløpig, hopper over. --TorbjørnS-AWB (diskusjon) 30. mar. 2016 kl. 21:18 (CEST)[svar]
I infobokser og slikt kan det være plassmangel, så det er forståelig hvorfor eventuelle forkortelser brukes der. AWB tar ikke de der uansett. Jeg tenkte at det er like greit å ta de sammen med resten av de andre skrivefeilene her.--Telaneo (Diskusjonsside) 30. mar. 2016 kl. 21:23 (CEST)[svar]
Når man er inne på forkortelser, ser jeg at her er en utbredt praksis med å skrive det forkortede uttrykket med en stor bokstav for å illustrere hva som tilsvarer bokstavene brukt i forkortelsen: For eksempel: NRK, en forkortelse for Norsk RiksKringkasting. Var borti et eksempel i løpetekst der Troms Fylkes Dampskibsselskab ble Troms Fylkes DampskibsSelskab. Skjønner i det hele tatt ikke poenget med dette. De fleste mennesker er såpass oppegående at de skjønner hvorfor forkortelsen er slik den er. Denne praksisen har også generert uttallige omdirigeringer fra slike kreative eksempler. --TorbjørnS-AWB (diskusjon) 30. mar. 2016 kl. 21:39 (CEST)[svar]
I løpetekst ser jeg ikke poeng i å gjøre det, kanskje helt i starten i en parentes hvor forkortelsen forklares hvis artikkelen ligger under forkortelsen istedenfor fullt navn. Omdirigeringer av dette kan nok fint slettes.--Telaneo (Diskusjonsside) 30. mar. 2016 kl. 21:42 (CEST)[svar]
Det er hverken et poeng eller noe grunnlag for å gjøre slikt uansett hvor det skulle være. Dette er et leksikon, som etterhvert har fått svært stor gjennomslagskraft. Man kan anta at en person som leser slikt i en ingress vil tro at dette er korrekt skrivemåte, og da er det vranglære vi driver med. Ikke minst er jeg tilbøyelig til å anta at en rekke artikler har blitt flyttet fra korrekt oppslag til galt oppslag som et resultat av denne praksisen. TorbjørnS-AWB (diskusjon) 30. mar. 2016 kl. 21:58 (CEST)[svar]

Deaktiverte forkortelser[rediger kilde]

Forkortelser (deaktivert inntil videre)[rediger kilde]

<Typo word="Bl.a." find="\b(B|b)\.?l(\. )?a\.( ?a\.)?" replace="$1lant annet" /> <Typo word="dvs." find="\b(D|d)\. ?v\. ?s\." replace="$1et vil si" /> <Typo word="for eksempel" find="\b(F|f)(.)?( )?eks(.)?.\b" replace="$1or eksempel " /> <Typo word="osv." find="\b(O|o)\. ?s\. ?v\." replace="$1g så videre" /> </source>

Uansett hvor man flytter disse vil den fremdeles rette på det... --TorbjørnS-AWB (diskusjon) 2. apr. 2016 kl. 08:23 (CEST)[svar]
Oppdater ordlisten innenfor AWB etter å ha flyttet dem. Gå til «File» øverst venstre hjørne så burde det dukke opp det option til å oppdatere ordlisten.--Telaneo (Diskusjonsside) 2. apr. 2016 kl. 10:30 (CEST)[svar]

Feilrettinger[rediger kilde]

Ja, jeg har nok lagt merke til at denne regelen ikke helt gjør som den var tenkt. Skal fjerne den helt. Hadde andre ting i tankene som den skulle rette da jeg laget regelen. Mvh. --TorbjørnS (ʦ) 21. okt. 2022 kl. 00:08 (CEST)[svar]

Filnavn og URLer[rediger kilde]

Er den noen instillinger i AWB som hindrer endring av filnavn og URL-navn? 4ing (diskusjon) 20. okt. 2022 kl. 14:41 (CEST)[svar]

Regulærutrykkene her skal automatisk unngå slikt. Per enwp: AWB purposely avoids fixing typos in certain areas of the wiki-text. Typo fixing is prevented within: image names, template names and parameters, wikilink targets, text in quotations and italics, and any text that follows a colon or asterisk. Telaneo (Diskusjonsside) 20. okt. 2022 kl. 14:44 (CEST)[svar]
Takk. Vet du om det også kan oppnås ved rettinger med "custom" regulæruttrykk (lagt inn direkte i AWBs søkefelt)? - 4ing (diskusjon) 20. okt. 2022 kl. 14:54 (CEST)[svar]
Tror man skal kunne oppnå det samme ved å bruke find and replace. Der er det to bokser man kan tikke av som skrur av og på hva man vil ignorere. Telaneo (Diskusjonsside) 20. okt. 2022 kl. 14:58 (CEST)[svar]
Har ikke funnet noen måte å hindre dette, men jeg har heller aldri gjort noen store undersøkelser for å finne det ut. Kanskje det er noen på den engelske diskusjonssiden som vet. --TorbjørnS (ʦ) 21. okt. 2022 kl. 00:12 (CEST)[svar]

Allmenn[rediger kilde]

Foreslår at almenn/alment —> allmenn/allment legges til. Etterskrift (diskusjon) 12. feb. 2023 kl. 07:23 (CET)[svar]

Det pleide å være en regel med for det, men den ble deaktivert 2018-03-19T08:27:42, og siden fjernet. Telaneo (Diskusjonsside) 12. feb. 2023 kl. 08:25 (CET)[svar]
Almen er oppført i Riksmålsordboken (1977), men ikke i NAOB. - 4ing (diskusjon) 12. feb. 2023 kl. 08:54 (CET)[svar]

Ansees/Anses[rediger kilde]

Hei! Jeg merker at "ansees" (som i [1] og ikke [2]) blir plukket opp med feil. Jeg er ikke så kjent med regex og opplistinga er kombinert med "anselige", men kan det korrigeres? EdoAug (diskusjon) 14. jul. 2023 kl. 12:42 (CEST)[svar]

Har tatt den vekk. --TorbjørnS (ʦ) 15. jul. 2023 kl. 04:30 (CEST)[svar]

Hongkongkinesisk[rediger kilde]

Hei hei! Jeg har ikke stor kjennskap til regex, og lurte på om noen kunne hjelpe med med å legge til disse begrepene:

  • Hongkong-kinesisk(e) -> hongkongkinesisk(e)
  • hongkongsk(e) -> hongkongkinesisk(e)

EdoAug (diskusjon) 21. sep. 2023 kl. 00:12 (CEST)[svar]

Sånn. Tror det skal holde, men du får se hva du treffer på underveis. Butte (diskusjon) 22. sep. 2023 kl. 09:43 (CEST)[svar]
Tusen takk! Jeg skal holde øya oppe. EdoAug (diskusjon) 22. sep. 2023 kl. 21:00 (CEST)[svar]

Utelatt fuge-s[rediger kilde]

Jeg har lagt til utelatt fuge-s som egen underoverskrift. Vil vi ha den? Eller skal ordsammensetningene det gjelder helst settes alfabetisk, altså under sine respektive bokstaver? Dersom vi vil ha den ser jeg det er flere oppføringer som bør flyttes, men begynner ikke på den jobben hvis det ikke ønskes. Mvh Butte (diskusjon) 28. sep. 2023 kl. 15:24 (CEST)[svar]

Whops, det er overflødig fuge-s jeg mener, gikk visst litt fort :P Butte (diskusjon) 28. sep. 2023 kl. 15:26 (CEST)[svar]

Apply general fixes[rediger kilde]

Atter et spørsmål: Er det best om man kjører AWB med eller uten å huke av "apply general fixes"? Ser det da gjøres en hel del komprimeringsarbeid fra botens side, som så langt jeg kan se ikke gjør annet enn å minke størrelsen på fila, eller gjøre det hele lettere å lese i kildeteksten. Se gjerne i bidragsloggen min for å skjønne hva jeg mener, dersom det er uklart. Er det mulighet for at det kludrer noe til som jeg enda ikke forstår, og at det ikke burde hukes av når hensikten er å fikse typos? Er ikke så godt kjent med kildeteksten på wikipedia riktig enda. Svar mottas med takk, mvh Butte (diskusjon) 28. sep. 2023 kl. 15:55 (CEST)[svar]

«Apply general fixes» gjør ingenting som potensielt kan være feil. Den holder seg unna tekst i maler, sitater og lignende, hvor fiksene eventuelt kunne ha rotet noe til, så det er ingen ulempe i å la den stå på. Telaneo (Diskusjonsside) 28. sep. 2023 kl. 16:36 (CEST)[svar]

Kunne noen lagt til «p.g.a.» korrigert til «pga.» for meg? Det er noe jeg har kommet over i flere artikler. Støttes av NAOB og Språkrådet. EdoAug (diskusjon) 7. nov. 2023 kl. 16:58 (CET)[svar]

Kan prøve å legge den inn, og se hvordan den fungerer (om det gir mange feilslag og lignende). mvh --TorbjørnS (ʦ) 7. nov. 2023 kl. 17:21 (CET)[svar]

Huskeliste til nye tillegg[rediger kilde]

Fra Brukerdiskusjon:51.175.135.89:

  • så og si -> så å si
  • sant og si -> sant å si
  • vel og merke -> vel å merke
  • sinnsyk(t) -> sinnssyk(t)
  • omrking -> omkring (kan antagelig endres

Telaneo (Diskusjonsside) 2. apr. 2024 kl. 02:11 (CEST)[svar]

Også ann -> an. Telaneo (Diskusjonsside) 2. apr. 2024 kl. 02:14 (CEST)[svar]
Bøyninger av ofre (offre-offret etc > of...) og offer (offre, offrene > ofre, ofrene). --TorbjørnS (ʦ) 2. apr. 2024 kl. 05:08 (CEST)[svar]
  • morningen -> morgenen
  • uan(n)set(t) -> uansett
  • anderledes -> annerledes
  • nyskjerrig -> nysgjerrig
  • forran -> foran
  • synest -> synes (ikke i radikal bokmål heller, bare i nynorsk)
  • tolmodig -> tålmodig (ikke i radikal bokmål heller, bare i nynorsk)
  • gjordt -> gjort (tar vår regel den? tror ikke det)
  • overrens -> overens (teoretisk et mulig substantiv, men ganske så konstruert?)
  • konstantere -> konstatere
  • kontrastveske -> kontrastvæske (igjen teoretisk mulig konstruksjon, men i praksis bare feilbrukt?)
  • stearinslys -> stearinlys
  • stil(l|t)e spørsmålstegn ved -> stil(l|t)e spørsmål ved (enten 'stille spørsmål ved' eller 'sette spørsmålstegn ved', kombo ikke lov)
  • gjennta(tt|r) -> gjenta(tt|r) (sikkert også flere på gjen-, som gjenopptre)
  • tunnell -> tunnel
  • (u)vedkomne -> (u)vedkommende
Telaneo (Diskusjonsside) 3. apr. 2024 kl. 01:45 (CEST)[svar]
  • ab(b)onement/abon(n)emang -> abonnement
  • anon(n)se -> annonse
  • annta(ll|tt) -> anta(ll|tt)
  • annkom -> ankom
  • avist -> avvist
  • konfort(abel) -> komfort(abel)
  • antaelig -> antakelig
  • dertilhørende -> dertil hørende
  • høytaler -> høyttaler
51.175.135.89 5. apr. 2024 kl. 19:30 (CEST)[svar]
Høytaler er en gyldig stavelse. https://ordbokene.no/bm/100080 https://naob.no/ordbok/h%C3%B8yttaler EdoAug (diskusjon) 5. apr. 2024 kl. 23:53 (CEST)[svar]
Takk for tips, hadde ikke fått med meg at denne formen nå var blitt tillatt. Personlig synes jeg dette er en fallitt, men det er for så vidt irrelevant her - er den tillatt så er det klart den ikke skal korrigeres. 51.175.135.89 6. apr. 2024 kl. 18:42 (CEST)[svar]
Kanskje verdt å ha egen liste for "gjen"-ord:
  • gjennta(tt|r) -> gjenta(tt|r)
  • gjenntok -> gjentok
  • gjennopptre -> gjenopptre
  • gjennkjenn(e)(r) -> gjenkjenn(e)(r)
  • gjennvinn(e|bar) -> gjenvinn(e|bar)
  • igjenn -> igjen
51.175.135.89 5. apr. 2024 kl. 23:45 (CEST)[svar]
  • sammens -> sammen
  • ilag -> sammen (må gjøres case sensitive, ettersom Ilag er et stedsnavn)
  • skjelden(t) -> sjelden(t)
  • korrensponder(t)((e)(r)) -> korresponder(t)((e)(r))
  • dems -> deres
  • plastikk -> plast (jf. Språkrådet)
51.175.135.89 4. apr. 2024 kl. 21:20 (CEST)[svar]
  • offesiel(l|t) -> offisielt (må endre gjeldende regel).
  • ressigør -> regissør (må endre gjeldende regel).
Telaneo (Diskusjonsside) 5. apr. 2024 kl. 03:34 (CEST)[svar]
plastikk -> plast er lov i riksmål[3] i tillegg til et eget separat ord.[4][5] Telaneo (Diskusjonsside) 9. apr. 2024 kl. 19:08 (CEST)[svar]
"an" bør kanskje gjøres case sensitive, ettersom Ann er et egennavn. Det samme gjelder for så vidt også Endel, som er et estisk egennavn. Evt. med sjekk for punktum før el.l. for å fange opp starten på setninger. 51.175.135.89 5. apr. 2024 kl. 19:33 (CEST)[svar]
An står vel aldri først i en setning, så da kan den settes til kun å lete etter ann med liten forbokstav. Ellers er det endel uttrykk i rettelisten som er case sentitive, så anbefaler alle som kjører programmet til å se over alle tilfellene som rettes i en artikkel for å eventuelt luke ut feilrettinger. Man bør også huske på at jo mer man putter inn på listen jo tregere går AWB-programmet, så det er ikke alltid så hensiktsmessig å ta med ting som kanskje nesten aldri blir skrevet feil, men feil som forekommer ofte er veldig fint å ha med. Selv kunne jeg også tenkt meg å få med noen av de mest vanlige særskrivningsfeilene i listen, men jeg vet ikke riktig hvilke som forekommer veldig ofte (og det er jo også mange varianter av dem med samme ordene først eller sist). Mvh TorbjørnS (ʦ) 6. apr. 2024 kl. 04:00 (CEST)[svar]

Skilletegn[rediger kilde]

Mange artikler om skuespillere benytter i avsnittet Filmografi fire punktum (....) som skilletegn mellom filmtittel og rollenavn. Her bør det heller være tankestrek (–), da fire punktum ikke er ansett som gyldig tegnsetting. Er dette noe som kan fikses med AWB? ///Mvh. 1000mm (diskusjon) 6. apr. 2024 kl. 15:09 (CEST)[svar]

Skulle jo fint la seg gjøre, da jeg ikke kommer på noen andre instanser der fire punktum faktisk skal stå i fred. Jeg sliter dog med å få AWB til å "finne" punktumene, så der trengs noen kyndige som kan ordne. Butte (diskusjon) 6. apr. 2024 kl. 16:14 (CEST)[svar]
Jeg klarte heller ikke å finne artikler med .... i det ordinære søkefeltet på Wikipedia, derfor jeg hadde et håp om at AWB kunne fikse det. Én av mange artikler med disse skilletegnene er Léa Seydoux. ///Mvh. 1000mm (diskusjon) 6. apr. 2024 kl. 16:17 (CEST)[svar]
Tror jeg skal ha fått det til. Jeg tok med ellipse-tegnet også, fordi det er også brukt på samme vis en del steder. Se denne revisjonen for resultatet på Léa Seydoux. Telaneo (Diskusjonsside) 6. apr. 2024 kl. 18:14 (CEST)[svar]
Se også insource:/\.\.\.\./(søk) for artikler hvor fire punktum kommer påfølgende (mye sitater, boktitler, URL-er og lignende der). Telaneo (Diskusjonsside) 6. apr. 2024 kl. 18:22 (CEST)[svar]
Ja, ellipse forekommer også. I den konkrete artikkelen ser jeg det har vært en delvis utbytting av .... med …, ikke bare én men to ganger har noen av – ikke alle – punktumene blitt byttet ut. Også som de eneste endringene ved redigering. Merkelig metodikk!
Fire punktum er nok rettmessig brukt en del steder, i sitat, ref osv., så en kan ikke la en bot utføre dette. ///Mvh. 1000mm (diskusjon) 6. apr. 2024 kl. 18:34 (CEST)[svar]
En del tilfeller av tre punktum (ikke …, men ...) blanda inn her og der også. Per nå fanges ikke disse opp, men det blir kanskje litt vel mange feilrettinger av å inkludere dette i AWB... Butte (diskusjon) 10. apr. 2024 kl. 16:57 (CEST)[svar]
Hadde man bare klart å finne/søke opp artikler med tre og fire punktum eller ellipsetegn i søk, og avgrenset det til Kategori:Skuespillere, så hadde man kommet et langt stykke på vei med en liste for manuell redigering også… ///Mvh. 1000mm (diskusjon) 10. apr. 2024 kl. 17:21 (CEST)[svar]
insource:/\.\.\.\./ deepcategory:"Skuespillere"(søk) burde hjelpe. Deepcategory kan bare søke ned fem kategorier dypt (antagelig fordi søket fort ellers blir veldig tungt), men den finner ihvertfall en del. Telaneo (Diskusjonsside) 10. apr. 2024 kl. 17:57 (CEST)[svar]
Nå snakker du om AWB-søk, ikke sant? Har ikke somlet meg til å installere Wiki-tilleggsprogram. ///Mvh. 1000mm (diskusjon) 10. apr. 2024 kl. 18:19 (CEST)[svar]
Den funker i AWB også, men den var hovedsakelig ment å brukes rett på wiki. Trykk på 'søk'-lenken. Telaneo (Diskusjonsside) 10. apr. 2024 kl. 18:23 (CEST)[svar]
Ah, takk! "Bare" 241 artikler, relativt kurant å gjøre manuelt også. Fra PC i hvert fall, litt mer knotete fra mobil enhet med touch. ///Mvh. 1000mm (diskusjon) 10. apr. 2024 kl. 18:36 (CEST)[svar]
Husk også at rollebesetningen i filmer (som ikke inngår i kategorien "skuespillere") også ofte må rettes :) Butte (diskusjon) 10. apr. 2024 kl. 18:48 (CEST)[svar]
Merker underveis her at tilfeller av fire punktum noen ganger ikke plukkes opp (selv om andre tilfeller plukkes opp, i samme artikkel!), uten at jeg klarer å begripe hvorfor. Kjør for eksempel Matthew Broderick i AWB, der jeg kun får fatt i 25 av 58 tilfeller (ikke inkludert en håndfull "3-punktumstilfeller"). Er det meg eller AWB som surrer? Butte (diskusjon) 10. apr. 2024 kl. 18:25 (CEST)[svar]
Det er AWB. Regexen er riktig, det fikk jeg bekreftet med eksternt verktøy, og med samme regex i AWBs find and replace så funker den som forventet, se [6]. AWB ser ut til å tro at lista er i et sitat eller noe, siden så snart jeg tikker på den regelen i find and replace, så slutter den å røre lista. Jeg prøve meg på litt småpirk i artikkelen som kanskje kunne ha forstyrret, men det gjorde ikke situasjonen bedre. Grundig forvirret er jeg i dag. Telaneo (Diskusjonsside) 10. apr. 2024 kl. 18:52 (CEST)[svar]
Jøss, veldig merkelig, selv om det alltid er hyggelig å bli "frikjent". Litt manuell redigering ser det da ut til å bli her og der. Butte (diskusjon) 10. apr. 2024 kl. 19:02 (CEST)[svar]