Å kombinere datakilder i Hadoop er en kompleks virksomhet. Noen av årsakene til dette inkluderer:
- Tilpassede, kildespesifikke skript som kombinerer datakilder er problematiske.
- Å bruke dataintegrasjon eller datavitenskapelige verktøy introduserer for mye usikkerhet.
- Det er nesten umulig å legge til data fra eksterne kilder.
I dag skal jeg diskutere hvordan Hadoop analytics forbedres gjennom kilde-agnostiske teknologier som gjør det enkelt å kombinere interne og eksterne datakilder. I tillegg til å beskrive hvordan kilde-agnostiske metoder fungerer, vil jeg også dekke hvorfor Hadoop analytics trenger innebygde intelligens- og kunnskapsoverføringsevner, en forståelse av relasjoner og dataegenskaper og en skalerbar og høyytelsesarkitektur.
Webinar: Matrices of meaning: Connecting the Dots Within Hadoop - Registrer deg her |