Wikipedia:Tinget/Arkiv/2009-24

Fra Wikipedia, den frie encyklopedi
Arkiv
Arkiv
Dette er et arkiv over inaktive diskusjoner fra Wikipedia:Tinget. Vennligst ikke gjør endringer her. Ønsker du å fortsette en gammel diskusjon, ta det opp på den aktive diskusjonssiden.

Råtne lenker[rediger kilde]

For en tid tilbake fantes det en bot som sjekket lenker og sa ifra om råtne lenker. Jeg har ikke sett den på en stund. Har hele denne funksjonen opphørt? Mvh MHaugen 9. jun 2009 kl. 14:52 (CEST)

Hva er en råtten lenke? En død lenke? Forekommer meg at jeg har lest på en: at en ved skriving av ref skulle angi forfatter/tema/osv. "slik at artikkelen kunne gjenfinnes om 40 år når nettlenken er død". Er det noen regler for dette på no:? Skal døde lenker/referanser slettes? KjellG 9. jun 2009 kl. 15:18 (CEST)
Lenkeråte, ved at sider dør eller får ny lenke, er et velkjent problem. Det blir kjørt boter med ujevne mellomrom, men problemet er at de eksisterende scriptene er nokså dårlige på å spore sider som flyttes (skjer ikke) og på å detektere hvilken sider som bare svarer treigt eller er midlertidig nede. Det siste funker sådär. — Jeblad 9. jun 2009 kl. 15:27 (CEST)

Nettscanner for prosjektane[rediger kilde]

Det går ein nettscanner som hentar inn artiklar om nyhende kor prosjekta blir nemnde og sender dei ut som epost. Førebels hev denne sendt epostane til meg og så har eg sendt vidare dei mest aktuelle til adminlista for bokmålsutgåva. Det kan vera at dette istaden burde gå på ei eiga epostliste. Er det noko interesse for at eg lager ei slik epostliste? Det er ein del dobbeltpostingar, men mesteparten av treff i andre kjelder enn den første blir vaska vekk. — Jeblad 24. mai 2009 kl. 00:03 (CEST)

Da går nyhetsvarslene på en egen epostliste for nyhetsvarsel. Selve nyhetssøket gjøres hos Sesam/Finn.no, mens e-postlista er i regi av Wikimedia Norge, og undertegnede kjører boten som henter inn varslene. En del dubletter slipper gjennom, men det er uansett ikke plagsomt mye trafikk. Jeg skal se om jeg får redusert antall dubletter. — Jeblad 24. mai 2009 kl. 02:42 (CEST)
Veldig bra tiltak! nsaa (disk) 24. mai 2009 kl. 19:53 (CEST)
Jeg er overrasket over hvor mye bilder fra commons blir brukt, slik denne scanneren viser. Den ble satt opp i går, og jeg har fått en god del i innboksen min allerede. Jeblad sier at den filtrere bort dubletter, noe den ikke helt klarer ennå. Men her er noen titler som bruker bilder fra oss: Hamar Arbeiderblad: Rekordstort fall i vestlige økonomier (med pengebilde), Rogalands Avis: Sikher såret i skyting i Wien (bilde av politibil fra Østerrike), Enebakk Avis: Nordmann savnet på Mount Everest (bilde av fjellet), flere andre aviser bruker samme bildet. Forskning.no bruker bilder i tre artikler: Fugleinfluensa truer fortsatt, Ekstrem hårvekst skyldes genfeil og Studenter på dinosaurjakt. Noe som burde inspirere til å ta bilder og laste opp på commons for den som vil at ens bilder skal bli brukt, plutselig er de i bruk av noen. Jeg antar at denne tjenesten lett kunne gi stoff til semesteroppgaver, minst, med problemstillinger rundt avisers og nettsteders bruk av stoff fra wikipedia på norsk og commons, for eksempel i løpet av en uke. Harald Haugland 25. mai 2009 kl. 13:53 (CEST)
Vil legge til at en artikkel «Kritisk for klatrer» (ANB-NTB) bruker et bilde tatt av Carsten.nebel og artikkelen har gått i 24 aviser. En annen tilsvarende artikkel under litt annen tittel er «Fjellklatrer funnet i live» (ANB-NTB) med samme bilde er brukt i 44 aviser. Antakelig burde det lages noen sammendrag som oppfølgere som listet sammenfallende artikler. Avisenes Nyhetsbyrå (ANB) er nokså nøye med å merke bilder, selv om de som andre går litt i surr av og til. De andre nyhetsbyråene er langt fra så nøye med dette. — Jeblad 25. mai 2009 kl. 14:04 (CEST)
Da er det lagt til ekstra filtrering, så får vi se om de gjenstående duplikatene forsvinner. — Jeblad 25. mai 2009 kl. 14:26 (CEST)
Det kommer en ny løsning en gang i løpet av sommeren. Denne vil sortere ut treff på de enkelte prosjektene, den vil fange opp lenker, og den vil muligens skille ut treff i billedtekster. — Jeblad 27. mai 2009 kl. 07:36 (CEST)
Alternativer til Sesam.no[1] er ABC Startsiden (ABC Overblikk[2] som antakelig er identisk med ABC Søk[3]) og Kvasir[4]. Begge disse er basert på Opoint som er eid av Edda Media og antakelig har et fokus på disses aviser. Sesam var eid av Schibsted gjennom Schibsted Søk. Det er to store konstellasjoner i norsk presse og innen nyhetssøk så har de hver sine løsninger. Søk i Schibsted-sfæren skjer nå hovedsakelig gjennom tjenestene til Retriever Norge, selv om de i teorien skal ha tilgang til hverandres materiale. Retriever eier også Mediearkivet som igjen har tjenesten Atekst. Intermedium leverer tilsvarende tjenester for «andre siden», sammen med CyberWatcher. Andre aktører er Magenta News, Visma, Infopaq og Cision Norge. Tidligere Observer Norge er kjøpt av Cision, og medieovervåking og analyse er solgt videre til Infopaq. I tillegg er det også noen aktører som lever bedriftsinterne løsninger og løsninger som av en eller annen grunn faller utenfor Klareringstjenesten. Jeg antar noen av disse også leverer via andre kanaler slik som Opoint gjør.
Det kan også være lurt å merke seg at Klareringstjenesten skiller mellom privat og kommersiell bruk, det gjør at vi antakelig kan lage noen løsninger som ellers ville bryte med avtaleverket de baserer seg på. Uansett så er de nok på litt mer usikker grunn enn det de gir uttrykk for i media. — Jeblad 4. jun 2009 kl. 08:45 (CEST)
Jeg regner med at det enten blir lagd en løsning for ett av søkene til ABC Startsiden eller for søket til Kvasir. Den av aktørene som gjør det mulig for oss å sjekke billedtekst og antall identiske artikler er den som vil gå av med seieren. — Jeblad 11. jun 2009 kl. 14:57 (CEST)

Hva kan vi få av kart[rediger kilde]

Kosovo

Det ser ut som om vi kan få til kart ala det viste av Kosovo ved å bruke data fra Shuttle Radar Topography Mission[5]. Det viste kartet er delvis basert på SVG, men jeg lurer på om vi kan klare å få til kart som er fullt ut skalerbare. Slike vil da konverteres til høydekoter, men det er et problem som dukker opp når dataene brukes på denne måten – det finnes hull i dataene. De vil imidlertid bli mye tyngre å håndtere så vi må vel gjøre et eller annet smart med dem. Fra en e-post fra Forsvarets forskningsinstitutt:

Disse dataene ligger på lat/lon grid, og vil da ha en grid-størrelse på rundt 90m x 90m ved ekvator og 45m x 90m ved Oslo. De dekker ikke lengre nord enn ca. Gardermoen i breddegrad: Altså globalt-dekkende fra ca. -58 grader Syd til ca. +60 grader Nord for hele kloden. Disse dataene er overflate-høyder, ikke nødvendigvis terreng-høyder. Dette fordi interferometrisk SAR delvis måler skogshøyde, slik at "Digital Surface Map" da blir ulik selve bakken ("Digitial Terrain Map").

Maksimal oppløsning er derfor litt varierende, og med en systematisk feil for vegetasjonshøyde. En «skjermbredde» på 1024px vil da tilsvare omtrent 92km, men med litt glatting kan det se ut som om det vil gi et greit visuelt inntrykk å skalere med en faktor 10-20x og da tilsvarer en skjermbredde omtrent 5km. Det er litt varierende hva vi kan få inn av andre data, vi må jo kunne si at dataene skal være fritt tilgjengelige. Forhåpentligvis blir noe av dette tilgjengelig på den nye kartserveren, se Wikimedia Technical Blog: OpenStreetMap maps will be added to Wikimedia projects. — Jeblad 12. jun 2009 kl. 18:44 (CEST)