Hjem Audio Hva er hadoop-økosystemet? - definisjon fra techopedia

Hva er hadoop-økosystemet? - definisjon fra techopedia

Innholdsfortegnelse:

Anonim

Definisjon - Hva betyr Hadoop Ecosystem?

Hadoop-økosystemet refererer til de forskjellige komponentene i Apache Hadoop-programvarebiblioteket, samt tilbehør og verktøy som tilbys av Apache Software Foundation for disse typer programvareprosjekter, og til måtene de samarbeider.

Hadoop er et Java-basert rammeverk som er ekstremt populært for håndtering og analyse av store datasett.

Techopedia forklarer Hadoop Ecosystem

Både kjernen Hadoop-pakken og dens tilbehør er for det meste åpen kildekode-prosjekter lisensiert av Apache. Ideen om et Hadoop-økosystem innebærer bruk av forskjellige deler av kjernen Hadoop-settet, for eksempel MapReduce, et rammeverk for å håndtere store datamengder, og Hadoop Distribuert File System (HDFS), et sofistikert filhåndteringssystem. Det er også YARN, en Hadoop-ressurssjef.

I tillegg til disse kjerneelementene i Hadoop, har Apache også levert andre typer tilbehør eller komplementære verktøy for utviklere. Disse inkluderer Apache Hive, et dataanalyseverktøy; Apache Spark, en generell motor for behandling av big data; Apache Pig, et datastrømsspråk; HBase, et databaseverktøy; og også Ambarl, som kan betraktes som Hadoop-økosystemadministrator, ettersom det hjelper til med å administrere bruken av disse forskjellige Apache-ressursene sammen. Da Hadoop ble den faktiske standarden for datainnsamling og blir allestedsnærværende i mange organisasjoner, lærer ledere og utviklingsledere alt om Hadoop-økosystemet og hva slags ting som er involvert i et generelt Hadoop-oppsett.

Hva er hadoop-økosystemet? - definisjon fra techopedia