Wikipedia:Dugnadskontor/Endre eller fjerne rester fra wikipedia på andre språk

Fra Wikipedia, den frie encyklopedi

Endre eller fjerne rester fra wikipedia på andre språk[rediger kilde]

Lagt inn av: Wikijens 11. okt 2009 kl. 13:52 (CEST)
Jeg tenkte man kunne utvide den forrige botdugnaden (om iw-kommentar fra nynorsk) til andre typiske tekster som ofte kommer med når man oversetter fra andre språk. Tanken er at man her kan foreslå ting som boter kan endre eller slette automatisk, etterhvert som man kommer på dem. Wikijens 11. okt 2009 kl. 13:52 (CEST) Et første forslag er:

  • Endre teksten «[[Category:» til «[[Kategori:». Hvis man har med de to hakeparentesene foran i søket, skulle det vel ikke være noen fare for at boten gjør uønskede endringer (f. eks. sitater fra engelsk som inneholder ordet «Category»).
  • Slette iw-lenker til oss selv, altså teksten «[[no:». Tror ikke denne heller skal ha uønskede konsekvenser. Er ikke sikker på om boter er i stand til å slette også det som kommer etter (altså dit iw-lenken peker). En mulig alternativ søkestreng kunne da kanskje være «[[no:{{PAGENAME}}]]»?

Tekniske detaljer på foreslått kjøring[rediger kilde]

Hvilket script som kjøres med lenke til kildekode/hjemmeside.
Hvilke parametre som benyttes.
  • python pwb.py replace.py -nocase -recursive -fix:category-fix -xml (for endring av kategori)
fixes['category-fix']= {
	'regex': True,
	'nocase': True,
	'recursive': True,
	'msg': {
		'_default':u'[[Wikipedia:Dugnadskontor/Endre eller fjerne rester fra wikipedia på andre språk|Kategori-fix]]',
	},
	'replacements': [
		(ur'\[\[ *(?:kategori|category): *(?P<first>[\wöëäïê])(?P<rest>.*?) *\]\]', 
			lambda m:( '[[Kategori:' + m.group('first').upper() + m.group('rest') + ']]')  ), # rewriting
	],
	'exceptions': {
		'inside-tags': [
			'nowiki', 
			'source',
			'pre',
		],
	}
}
  • python pwb.py replace.py -summary:"[[Wikipedia:Dugnadskontor/Endre eller fjerne rester fra wikipedia på andre språk|Endre eller fjerne rester fra wikipedia på andre språk]]" -nocase -regex "\n\[\[\s*no\:[^\]]+\]\]" "" -xml (for fjerning av språklenker)
Lenke til eventuelt datagrunnlag der dette er mulig å fremvise.

Testkjøring[rediger kilde]

Bevis på testkjøring uten at noen faktiske endringer er utført. Legges helst inn som en underside av denne jobben

Diskusjon[rediger kilde]

Hvis konsensus er for kjøringen, skal det settes en dato / tid for når kjøringen i henhold til retningslinjene kan utføres tidligst.
Har tatt en runde med «[[Category:» → «[[Kategori:» nå. – Danmichaelo (δ) 26. des 2012 kl. 19:05 (CET)
Burde denne kjøringen begrenses mtp. namespaces? Noen tanker om dette? Stigmj (diskusjon) 27. feb. 2016 kl. 16:07 (CET)[svar]

Kategori-jobben (utvidet til å fikse typiske feil med feilplasserte mellomrom og liten første bokstav i kategoriene samtidig) kjører nå for øvrig. Stigmj (diskusjon) 19. mar. 2016 kl. 01:38 (CET)[svar]

Lenker av typen \[\[no: er en indikasjon på at noe er feil, da de er magic iw-links (språklenker) til oss selv. Dette er ikke noe som bør rettes automatisk. Vanligvis er dette oversatte artikler som ikke er koblet til elementer. — Jeblad 19. mar. 2016 kl. 08:31 (CET)[svar]