Recoll

Fra Wikipedia, den frie encyklopedi
Recoll
Utgitt 2005
Nyeste versjon1.37.4 (2. februar 2024)[1]
Kodelagerhttps://framagit.org/medoc92/recoll.git
PlattformX86-arkitektur, x86_64
OperativsystemGNU/Linux BSD Microsoft Windows macOS Solaris Unix-liknende
Skrevet iC++, Python
Sjangerdesktopsøk
SkrivebordsmiljøQt
TypeDesktopsøk
LisensGPL 2.0+
Nettstedwww.lesbonscomptes.com (en)

Recoll er i hovedsak basert på et veldig kraftig søkebibliotekverktøy som kalles for Xapian[2] og er lisensiert under "GNU fri dokumentasjonslisens, versjon 1.3". Recoll er en fullstendig tekst-søking-applikasjon og gir muligheten for å finne lagret data basert på innholdet fremfor bare filnavnet ved hjelp av et brukervennlig grafisk brukergrensesnitt.[3][4] I praksis vil dette si at en kan spesifisere termer som det ønskes skal eller ikke skal forekomme i teksten det søkes på, og deretter returnere en liste basert på relevans. Programmet kjører under de fleste Unix-operativsystemer og er basert på skrivebordmiljøer.

Henting av tekst[rediger | rediger kilde]

Recoll benytter seg av Xapians informasjonshentingsbibliotek for å lagre og hente ut data. Den benytter seg av en Sophisticated probalistic ranking model"[5]. I praksis kan man si at Xapian arbeider på den måten at den husker hvor termer forekommer i dokumentfilene dine. Denne prosessen kalles for indeksering. Det er ikke et dokumentarkiv, så den vil bare vise de dokumentene som fremdeles er på samme sted som de ble indeksert.[6]

Alle de interne dataene i Recoll blir lagret i Unicode UTF-8 format, og den kan indeksere andre skrifttyper, encodings og språk i samme indeks.

Søkeapplikasjonen støtter flere dokumenter, blant annet HTML, Open Documents(som Open Office), tekstfiler og mye mer. Dokumenter som PDF og MS-documents (for eksempel: MS Word) trenger eksterne applikasjoner for å indekseres.[6]

Indeksering[rediger | rediger kilde]

Dette er prosessen hvor dokumenter er analysert og lagt inn i en database. Recoll sin indeksering er vanligvis inkrementell og dokumenter vil bare bli behandlet dersom de er modifisert eller flyttet på. Første gang programmet kjøres må så klart indekseringen kjøres fra bunnen av.

Etter første indekseringen kan fremtidig indeksering foregå på to måter.

  1. Periodic Indexing:[7] Dette vil si at indekseringen forekommer på visse angitte tider.
  2. Real Time Indexing:[8] Som navnet hinter til, vil indekseringen forekomme så fort det foretas en endring i systemet.

Referanser[rediger | rediger kilde]

Eksterne lenker[rediger | rediger kilde]