Solr

Fra Wikipedia, den frie encyklopedi
Gå til: navigasjon, søk
Apache Solr
Skaper Yonik Seeley
Utvikler Apache Software Foundation
Nyeste versjon 4.1
Plattform Multiplattform
Operativsystem Alle
Skrevet i Java
Type Bedrifts-søkemotor og indeks
Lisens Apache-lisensen 2.0
Nettside http://lucene.apache.org/solr/
Last ned

Solr er en åpen kildekode-basert søkemotortjener basert på Lucene-biblioteket, med XML/HTTP- og JSON-APIer, utheving av søketreff, fasett-søk/navigatorer, replikering og et webbasert administrasjonsgrensesnitt.

Solr kjører i en Java servlet-container, som for eksempel Apache Tomcat.

Historie[rediger | rediger kilde]

Sent i 2004 ble Solr først utviklet av CNET Networks som et internt prosjekt for å lage søk på nettsidene deres.

Tidlig i 2006 bestemte CNET Networks seg for å gå live og donere kildekoden til Apache Software Foundation under topp-prosjektet Lucene.[1]

På slutten av januar 2007 ble Solr et fullverdig medlem av Lucene-prosjektet og har siden vokst med stadig mer funksjonalitet og tiltrukket seg et robust miljø av brukere, bidragsytere og programmerere. Solr er i bruk på flere høy-trafikk web-steder.[2]

I september 2008 ble Solr 1.3 sluppet, med mange forbedringer, blant annet distribuert søk og ytelsesforbedringer.

I november 2009 ble Solr 1.4 lansert, med forbedret replikering, dramatisk ytelsesforbedring for indeksering og fasetter, støtte for å indeksere Office-dokumenter ved hjelp av Apache Tika mm.[3]

I mars 2010 ble utviklingen av Lucene og Solr slått sammen til ett prosjekt, men fortsatt med to distinkte produkter. Dette førte til at når Solr/Lucene versjon 3.1 ble lansert i mars 2011 så hoppet versjonsnummeret opp til det som Lucene brukte. Utover i 2011 ble det en rask takt av versjons-utgivelser med 3.2 i juni, 3.3 i juli, 3.4 i september og 3.5 i november.

I april 2012 ble Solr 3.6 sluppet, og dette ble besluttet å være siste versjon på 3.x serien i påvente av en større oppgradering til versjon 4.

Funksjonalitet[rediger | rediger kilde]

  • Bruker Lucene-biblioteket for full-tekst søk
  • Fasett-navigering
  • Markering av treff i søkeresultat
  • Søkespråk for strukturerte så vel som fritekst søk
  • JSON, XML, PHP, Ruby, XSLT, Velocity, Python og Java binær-format over HTTP
  • HTML administrasjons-grensesnitt
  • Replikering til andre Solr tjenere
  • Plugin-arkitektur
  • Pluggbar relevans – relevansvekting gjennom formler
  • Distribuert søk gjennom Sharding
  • Indeksering av dokumenter, som PDF, DOC, XLS, PPT m.fl.
  • Geografisk søk
  • Skjul treff med samme verdi for et felt (field collapsing)
  • Caching
  • Kan innebygges i en Java applikasjon

Tilgang på kompetanse[rediger | rediger kilde]

Det er et levende utvikler- og brukermiljø rundt Lucene og Solr, som raskt og effektivt kan svare på spørsmål eller rette feil. Det er også flere ulike kommersielle konsulentfirmaer som kan tilby kursing, konsulenthjelp, skreddersøm/videreutvikling og support-kontrakter.[4]

Planlagte funksjoner[rediger | rediger kilde]

I versjon 4.0 er blant annet følgende planlagt:

  • SolrCloud funksjonalitet for å lettere skalere til store klynger av maskiner
  • Sanntids indeksering
  • Feiltolerant indeksering v.hj. av transaksjonslogger
  • Sentralisert konfigurasjon ved hjelp av Apache ZooKeeper
  • Automatisk distribuert søk og lastbalansering
  • Nytt og bedre grafisk administrasjonsgrensesnitt
  • Mindre disk- og minnebruk og mer effektivt søk

Se også[rediger | rediger kilde]

Referanser[rediger | rediger kilde]

Bibliografi[rediger | rediger kilde]

Eksterne lenker[rediger | rediger kilde]