Søkemotor

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk

Søkemotor er en betegnelse for en type programvare som leter frem nettsiderInternett som samsvarer med et gitt søk, og rangerer disse etter hva den oppfatter som mest relevant. Typisk ligger søkemotoren tilgjengelig som et nettsted, der brukeren legger inn søkeord, og treffene vises som klikkbare lenker.

Søkemotoren kan enten gjøre søk på hele Internett (for eksempel Google, Bing og Yahoo!), innenfor et bestemt nettsted (for eksempel søk innenfor VGs nettavis), eller innenfor et bestemt tema (f.eks. Kelkoo, som søker etter priser på produkter, og Picsearch, som søker etter bilder). En bedrift kan også sette opp en intern bedrifts-søkemotor for å få enklere tilgang til alle dokumenter og databaser i bedriften.

Historie[rediger | rediger kilde]

Den første søkemotoren for Internett var Wandex, en såkalt web crawler (søkerobot), utviklet av Matthew Gray ved MIT i 1993. Denne søkemotoren finnes ikke lenger, men en annen tidlig søkemotor, Aliweb, som også kom i 1993, finnes den dag i dag. Lycos kom også tidlig, allerede i 1994.

Senere ble det mer konkurranse, da flere søkemotorer ble tilgjengelige, som WebCrawler, Hotbot, Excite, Infoseek, Inktomi og AltaVista. Disse konkurrerte med bl.a. Yahoo!, som var en ren katalogtjeneste. Yahoo fikk imidlertid søkemotorfunksjon i 2002 (Inktomi), og overtok i 2003 Overture, som eide AlltheWeb og AltaVista. I 2004 lanserte Yahoo! sin egen søkemotor, som kombinerte teknologien fra disse oppkjøpene.

Fra ca. 2001 ble Google den mest brukte søkemotoren, på grunn av sitt fokus på relevans i presentasjonen av søketreffene. Google er fortsatt den største søkemotoren på Internett. Google er kjent for å bruke betalt søkemotorannonsering ved å tilby annonser som er relevante for søkeordene.

Søkemotorer[rediger | rediger kilde]

Det finnes et vell av søkemotorer i verden. De største er:

  1. Google
  2. Bing (tidligere kjent som Live Search eller MSN Search)
  3. Yahoo!

Andre søkemotorer er Kvasir, Rubrikk, DMOZ (Open Directory Project), Gigablast, Accoona, AltaVista, AlltheWeb, Overture, Fjalar, Kvass.no, Search, Ask Jeeves, Webcrawler, Hotbot, a9, Clusty, Ez2Find, Fast, Teoma, WiseNut, GoHook, Walhello, Kartoo, DuckDuckGo, Yelo, Cuil og Snap.

Av Open Source-søkemotorer kan nevnes Htdig, Nutch, Egothor og OpenFTS.

Majestic-12 er en søkemotor basert på distribuert indeksering.

Slik fungerer søkemotorer[rediger | rediger kilde]

Søkemotorer er stadig i utvikling, og de fleste har utviklet seg og tatt i bruk andre, bedre teknikker i tillegg til de som er beskrevet her.

De forskjellige søkemotorene er ulikt utformet, men det er to ting de ikke klarer seg uten: en søkerobot og en indeks (søkemotor). Søkeroboten leser en nettside, identifiserer eventuelle linker, og følger en av de mulige linkene videre. «Kommersielle» søkemotorer har gjerne også en database med nettsider de tidligere har besøkt, som de besøker igjen etter en viss tid. Indeksen er som en indeks bakerst i en bok, bare mye større. Den består av alle ordene som den har kommet over på alle nettsider den har besøkt. Hvert av ordene i indeksen har en liste over alle nettsider der ordene forekommer.

Når søkeroboten leser en ny nettside, legges den til i søkemotoren: Søkemotoren registrerer alle ordene som forekommer i dokumentet. For hvert av ordene legges nettsiden til i listen over steder dette ordet forekommer. Det vil for eksempel si at hvis søkeroboten leser en side med 50 ord som forekommer en eller flere ganger, så legges nettsiden til i forekomstlisten til alle disse 50 ordene.

Søkeroboten må ha minst én side å starte fra, deretter foregår traverseringen langs lenker den finner på sidene den leser. Dette betyr at en søkerobot bare registrerer de sidene som det finnes lenker til.

Søketeknikker[rediger | rediger kilde]

Når man søker har, man vanligvis enten problemer med at man får for mange eller for få treff. Taktikken for å få til et godt søk bør tilpasses situasjonen. Det er vanskelig å vite om et søk er for generelt eller for spesifikt, derfor er det ofte greit å bare prøve, og velge videre taktikk basert på dette.

I alle søkemotorer oppgir man ord man er interessert i, for eksempel «bil» eller «bil + engelsk» hvis man vil begrense det til engelske biler. Hvis søket fører til mange hundre treff, er søkeordene for generelle, mens null treff tyder på at søket er for spesifikt.

Prefiltrering er et samlebegrep for teknikker for å avgrense søk før selve spørringen sendes, mens postfiltrering angir teknikker for å gjøre avgrensinger etter at det første søket er gjort og søkeresultater er synlige for brukeren.

Løsninger på for mange treff[rediger | rediger kilde]

  • Legg til flere ord. Hvis du bare har skrevet «bil», er ikke det veldig spesielt. Er du interessert i sider om Ford Escorter med feil under tomgang, så søk på «Ford Escort feil tomgang»
  • Bytt fra generelle til mer spesielle ord. Hvis du har skrevet «ferie» men egentlig er interessert i charterturer, så skriv «chartertur» i stedet.
  • Legg til ord du tror forekommer på sider som kan være relevante. Hvis du skriver «chartertur» får du sikkert opp en del sider som er reisereferater fra privatpersoner. Hvis du legger til ord som «avreisetidspunkt», «pris» eller «bestill», er det mer sannsynlig at du får opp sider som tilbyr charterturer.
  • Legg til " på begge sider av ordet. Hvis du leter etter «Per Hansen», så er du ikke interessert i alle sider som omtaler enten Per, Hansen eller Per Olsen og Ole Hansen. Når du legger til " rundt ordene finner søkemotoren bare de dokumentene der orden forekommer nøyaktig i den rekkefølgen du har oppgitt.
  • I noen søkemotorer, blant annet Google, kan du søke "site:(nettadresse)" om du bare ønsker resultater fra den spesifikke nettsiden. Ønsker du f.eks. Facebook-profilen til Per Hansen, kan du søke "site:facebook.com Per Hansen", og slippe irrelevante resultater.

Løsninger på for få treff[rediger | rediger kilde]

  • Sjekk stavemåten. Har du brukt et vanlig ord som du regner med forekommer mange steder, så har du antagelig stavet det feil. Finn rett stavemåte og prøv igjen.
  • Selv om mennesker forstår at «merkelig» og «rar» betyr det samme, så forstår ikke søkemotorer vanligvis det. Prøv å bruke synonymer til ordet du leter etter.
  • Mesteparten av Internett er ikke på norsk. Med mindre ordet du søker etter er likt på norsk og engelsk, leter søkemotoren bare etter dokumenter på språket du har skrevet søkeordet på. Hvis du kan lese engelsk, kan du prøve å oversette søkeordet til engelsk og søke igjen.
  • Hvis du har brukt " på begge sider av et søkeord, kan det være smart å fjerne "-tegnene. Dette åpner for at sider der «Per Hansen» bare er nevnt som «Per» eller «Hansen» også kommer opp.
  • Det er ikke alltid at en nettside som er om noe, nevner det den omtaler. Prøv å søke etter ord du tror vil forekomme i siden du leter etter.

Hvordan kombinere søkeord[rediger | rediger kilde]

  • Pluss og minus: Pluss (+) foran et ord gjør at ordet være med i søkeresultatet, minus (-) gir kun treff der dette ordet ikke er med.
  • Anførselstegn: Setter man flere ord i hermetegn (f.eks "test av Ford Mondeo"), søker søkemotoren etter denne spesifikke ordkombinasjonen.
  • Boolske søk: Ved bruk av flere søkeord, kan man legge inn for eksempel AND, OR eller NOT mellom ordene. AND tvinger søkemotoren til kun å vise treff der alle ord er representert. NOT foran et søkeord tar bort treff der dette ordet er med. Google bruker automatisk AND mellom søkeord, selv om dette ikke vises.

Se også[rediger | rediger kilde]