Wikipedia:Kvalitets- og kvantitetsmål i artikler

Kvalitets- og kvantitetsmål på Wikipedia baserer seg på manuelle og automatiske metoder. De manuelle metodene er basert på en kolaborativ prosess hvor brukere med forskjellig fagbakgrunn vurderer artikler utfra sine individuelle forutsetninger. De automatiske metodene baserer seg på lesbarhetsindekser, forekomst av bestemte interne og eksterne lenker, referanser og andre kilder, og konstruksjoner som indikerer at det er lagt arbeid i artikkelen.

Begrepet kvalitet er i den her sammenhengen tettest på filosofisk kvalitet, som er egen artikkel på engelsk Wikipedia. Begrepet kvantitet er beskrevet på w:Quantity, som er en samleartikkel på engelsk Wikipedia.

Skal en artikkel få av Wikipedias høyeste kvalitetsratinger så må artikkelen vurderes manuelt. Slike vurderinger gjøres som en del av prosessen på kandidatsidene. Det finnes ingen automatiske mekanismer som kan kvalitetssikre alle aspekter ved innhold i artikler. Det finnes noen automatiserte mekanismer som kan sikre enkelte forhold ved innholdet, men disse mekanismene er nokså marginale i forhold til de manuelle metodene for kvalitetssikring. De automatiske metodene kan derimot indikere hvorvidt en artikkel er kommet forbi de initielle startvanskene.

Merk at at kvalitets- og kvantitetsmål ikke tilsvarer kvalitative og kvantitative metoder innen forskning, men at de ligner.

Automatiske kriterier

Det er mulig å bedømme automatisk et begrenset utvalg av kriterier ved en artikkel. Slike må kunne kvantiseres og sammenlignes objektivt. Typisk er det kriterier som hvorvidt en artikkel er kategorisert, om antall internlenker er i samsvar med mengde brødtekst, om teksten er kildebelagt i tilstrekkelig grad, om teksten er lesbar, om den har vedlikeholdsmerker og så videre. Til sammen gir alle disse forholdene en indikasjon på artikkelens kvalitet som så uttrykkes via en forenklet overordnet rating.

Kvalitetsmål fremkommer som total score eller penalty for hver enkelt type av kriterie, hvor summen må over en skranke for at en gitt rating skal brukes. Summen vil skalere med artikkelens størrelse og kun høyeste rating beholdes, de lavere vises ikke.

Antall anslag

Brødtekstens lengde måles i antall anslag i paragrafer etter at formatering er fjernet. Dette er omtrent det tallet som fremkommer om en kopierer teksten og limer den inn i en teksteditor og fjerner alle mellomrom og linjebrekk. En annen måte å beskrive antall anslag er hvor mange ganger brukeren har trykket på en tast som gir et tegn som formidler en idé.

En brødtekst må ha et tilstrekkelig omfang for å kunne formidle hva den omhandler, samtidig som den også skal gi en tilstrekkelig avgrensing. I noen definerende artikler kan teksten være svært kort og samtidig gi mening. I andre artikler må teksten være nokså omfattende for å gi mening.

Antall anslag multipliseres med en konstant for å gi score.

Bruk av bilder

I nesten alle artikler vil bilder øke forståelsen av teksten. Bilder har også en positiv effekt ved at det gir leseren visuelle anker under lesing av artikkelen slik at den ikke bare blir en stor sammenhengende tekstmasse.

Det er vanskelig å finne velfungerende illustrasjoner for abstrakte begreper. Det gjør at slike artikler helt kan mangle bilder uten at det er noen feil i seg selv.

Antall bilder multipliseres med en konstant for å gi score.

Bruk av kilder

Indikasjoner på bruk av kilder er antall lenker til eksterne nettsteder, påførte referanser, påviste ISBN-numre og lignende. Forskjellige kilder brukes på litt forskjellig vis, men de er alle med på å understøtte teksten. Enkelte typer kilder kan fremkomme i teksten uten at det er lett å påvise dem automatisk, dermed må en være litt varsom med å si at det er feil når det ikke påvises kilder i en tekst.

Fordi slike begrepsapparat brukes i kombinasjon så beregnes prikkproduktet mellom dem. Tallet som fremkommer multipliseres med en konstant for å gi score.

Bruk av overskrifter

Brukt varsomt vil overskrifter bedre innholdets lesbarhet. Antall overskrifter bør være i samsvar med antall paragrafer i artikkelen og den totale tekstmassen. Blir det for mange overskrifter blir artikkelen igjen tunglest. Det kan bli brukt overskrifter i forbindelse med elementer som ikke fremstår som ordinære paragrafer, slik som lister og tabeller, dermed kan antall overskrifter bli høyere enn antall paragrafer skulle tilsi.

Antall overskrifter normaliseres mot antall paragrafer og andre elementer i brødteksten og multipliseres med en konstant for å gi score.

Lesbarhet

Det er flere måter å beregne lesbarhetsindeks, og fordi skribenter uttrykker seg på forskjellig måte så vil de få litt forskjellig tall. Noen av indeksene kan indikere at artikler har et enkelt språk, mens andre kan indikere at de samme har vanskelig språk. Dette er ikke alltid entydig og kan av og til trekke i forskjellig retning. Over tid vil det normalisere seg når flere skribenter har rettet på artiklene.

Lesbarhetsindeks i sin enkleste form er et statistisk mål på lesbarhet for ordene som brukes. Det finnes flere slike mål, men de fleste er antakelser over hvor vanlige ordene er, og hvorvidt leseren må stave seg gjennom ordene eller om de leses som et bilde. Antakelsen er at sjeldnere ord må staves og dermed er tyngre å lese. For å få et statistisk mål introduseres en eller annen straffefunksjon for ord med økt vanskelighetsgrad. Når det summeres over alle ord vil en få et mål for hvor vanskelig teksten er. Enklere mål bruker ned i 2 – 3 ordlengder med tilhørende vekter. Mer avanserte mål bruker sannsynlighet for de enkelte ordene, med en antakelse at sjeldnere bruk medfører mindre sannsynlighet for at leseren kan ordet.

En modifisert utgave av Dale-Chall sin formell (det er kun en av mange) for lesbarhetsindeks er en skranke og det overskytende multipliseres med en konstant for å gi penalty. Fordi denne formelen er basert på engelsk språk og en tabell av enkle ord for dette språket så er en tilsvarende tabell laget for norsk basert på inverse document frequency i et antall aviser.

Lesbarhetsindeksen LIX sammenholdes med en skranke og det overskytende multipliseres med en konstant for å gi penalty.

Panalty for Dale-Chall og LIX slås sammen med prikkprodukt og multipliseres med en konstant og antall anslag, hvoretter resultatet trekkes fra den totale summen.

For alle gjelder at paragrafer har en implisitt setningsterminator når paragrafer avsluttes, selv om denne er utelatt i brødteksten.

Overraskelse

Overraskelse (perplexity) er et statistisk mål på hvor uvanlige kombinasjonene er av ordene som brukes. Antakelsen er at uvanlige kombinasjoner medfører en større mental last, og at leseren i større grad må vurdere hva teksten formidler. Når lasten blir for stor vil leseren gå lei, og innholdet i teksten blir ikke formidlet. For å få et statistisk mål uten for komplisert beregning så kan en vektfunksjon bruke noen tusen av de vanligste ordene og deres innbyrdes relasjon. For å få et enkelt statistisk mål settes alle ukjente kombinasjoner til en fast straffeverdi. Mer avanserte mål bruker en språkmodell.

Forvirring

Forvirring (confusion) er et mål på hvor mange avgjørelser leseren må ta i teksten. Avgjørelser utløses av «men», «om», «hvis» og lignende konjunksjoner og subjunksjoner. Hvis konjunksjonal eller subjunksjonal har en motstående leddsetning så gir dette en kompliserende avgjørelse. Slikt blir av og til omtalt som conditionals, og definerer grenpunkt (nodes) i grafer. Antall grener definerer hvor kompleks teksten er, og inneholder den for mange vil leseren starte å glemme utfall av tidligere grenpunkt. En logisk enhet i teksten bør ikke inneholde mer enn omtrent fem grener som leder opp til enhver forståelse av enheten, da fem til ni separate konsept er vår mentale kapasitet. En logisk enhet er en tankerekke som er avsluttet, ofte i form av en paragraf.

Diverse forhold

Det er enkelte forhold som må på plass i en artikkel. Slike forhold blir påvist og resultatet blir tillagt en score som vektes etter antall anslag.

En tekst bør ha en innledende frase som settes i fet skrift. Denne omtales gjerne som lead in. Teksten bør stemme overens med artikkelens oppslagsfrase (høy score), men som minimum bør den stemme overens med en omdirigering (lav score). Mangler lead in så gis det ikke noen ytterligere score.

Siden skal kategoriseres i en eller flere kategorier. Forekomst av flere eller færre kategorier er ingen indikasjon på at noe er feil ved artikkelen, men mangler kategorier så er dette en nokså klar indikasjon på at noe er galt. Det gis kun score på forekomst av kategorier, ikke for antall.

Kategorier har et iboende problem ved at noen kategorier gir vedlikeholdsinformasjon, mens andre er reell kategorisering. Vedlikeholdsinformasjon skal i utgangspunktet ikke krediteres, mens reell kategorisering skal krediteres. Som et utgangspunkt angis det antall synlige og skjulte kategorier, og det angis forekomst av noen nøkkelkategorier.

Det gis ikke score eller penalty for lister, tabeller, og blokk-konstruksjoner.

Se også

Litteratur

Hornmoen, Harald 1959- (1999). Vitenskapens vakthunder: innføring i forskningsjournalistikk. Oslo: Tano Aschehoug. s. 86–93. ISBN 8251839599.