Innholdsfortegnelse:
Definisjon - Hva betyr variasjon?
Variety er en 3 Vs rammekomponent som brukes til å definere de forskjellige datatypene, kategoriene og tilhørende styring av et big data repository. Variasjon gir innsikt i unikheten til forskjellige klasser av big data og hvordan de sammenlignes med andre typer data.
Techopedia forklarer Variety
Variasjon definerer arten av data som finnes i big data. Dette inkluderer forskjellige dataformater, datasemantikk og datastrukturtyper.
Variasjon er rettet mot å tilveiebringe forskjellige teknikker for å løse og administrere datavariasjon innen big data, for eksempel:
- Indekseringsteknikker for å relatere data med forskjellige og inkompatible typer
- Dataprofilering for å finne sammenhenger og avvik mellom datakilder
- Importere data til universelt aksepterte og brukbare formater, for eksempel Extensible Markup Language (XML)
- Metadatastyring for å oppnå kontekstuell datakonsistens