Innholdsfortegnelse:
Definisjon - Hva betyr Apache Kafka?
Apache Kafka er et open source-meldingssystem som er utviklet for å gi rask, skalerbar og feiltolerant håndtering av sanntids datafeeds. I motsetning til tradisjonell firmameldingsprogramvare, er Kafka i stand til å håndtere alle dataene som flyter gjennom et selskap, og å gjøre det i nær sanntid.
Kafka er skrevet i Scala og ble opprinnelig utviklet av LinkedIn. Siden den tid har en rekke selskaper brukt det til å bygge sanntidsplattformer.
Techopedia forklarer Apache Kafka
Kafka har mange likheter med transaksjonslogger, og den opprettholder strømmer av meldinger i emner. Produsenter skriver data til emner og forbrukere leser fra disse emnene, som er partisjonert og replisert over flere noder i et distribuert systemformat. Kafka er unik ved at den behandler hvert emnepartisjon som en logg, og hver melding i en partisjon tildeles en unik forskyvning. Den beholder alle meldinger i en viss tid, og forbrukere er ansvarlige for å spore deres beliggenhet i hver logg. Dette skiller seg fra tidligere systemer, hvor meglere var ansvarlige for denne sporing, noe som sterkt begrenset systemets muligheter til å skalere etter hvert som antall forbrukere økte. Denne strukturen gjør det mulig for Kafka å støtte mange forbrukere og beholde store datamengder med veldig lite overhead.
Kafka kan brukes:
- Som en tradisjonell meldingsmegler
- For sporing av aktivitet på nettstedet
- For loggsamling
- For behandling av store datastrømmer
Kafka kan brukes sammen med Apache Storm, Apache HBase og Apache Spark for sanntidsanalyse og gjengivelse av streamingdata.
