Innholdsfortegnelse:
Definisjon - Hva betyr Apache Lucene?
Apache Lucene er et åpen kildekode-prosjekt for et høyt ytelses- og fullfunksjonsbibliotek for tekstsøkemaskiner som er skrevet i sin helhet ved hjelp av Java.
Den er i stand til søk i fulltekst i dokumenter, så det er en teknologi som er egnet for ethvert program som krever denne funksjonen, spesielt hvis det er plattform.
Det ble første gang utviklet av Doug Cutting i 1999 og ble offisielt en del av Apache Foundations Jakarta-familie av open source Java-prosjekter i september 2001. Det ble oppgradert til et Apache-prosjekt på toppnivå i februar 2005.
Techopedia forklarer Apache Lucene
Apache Lucene er en høyytelses søkemotor med konseptet "et dokument som inneholder tekstfelt" i sin kjernelogiske arkitektur. Dette gir stor fleksibilitet og lar Lucene API bli uavhengig av filformat.
All tekst fra formater som MS Word, HTML, XML, PDF og OpenDocument kan indekseres så lenge tekstinformasjonen kan trekkes ut, noe som betyr at den ikke kan gjøre noe med bilder.
Lucene er egnet for alle applikasjoner som trenger en fulltekstindeksering og søkefunksjonalitet, men den er anerkjent som et flott verktøy for å implementere Internett-søkemotorer og for lokalt søk på ett sted.
Funksjonene inkluderer:
- Skalerbar og høyytelsesindeksering - den kan behandle over 150 Gb per time på moderne maskinvare og krever bare 1 Mb per haug med minnekrav.
- Kraftige, nøyaktige og effektive søkealgoritmer - den tilbyr mange typer kraftige spørsmål, for eksempel uttrykk, jokertegn, nærhet og rekkevidde. Det har også felt søk og sortering etter hvilket som helst felt.
- Cross plattform - ren Java-implementering og også tilgjengelig på andre programmeringsspråk.