Innholdsfortegnelse:
Definisjon - Hva betyr Data Sandbox?
En datasandkasse, i sammenheng med big data, er en skalerbar og utviklingsplattform som brukes til å utforske en organisasjons rike informasjonssett gjennom samhandling og samarbeid. Det gjør at et selskap kan realisere sin faktiske investeringsverdi i big data.
En datasandkasse utforskes først og fremst av data science-team som skaffer sandkasseplattformer fra frittstående, analytiske datamarts eller logiske partisjoner i bedriftens datavarehus. Datasandkasseplattformer gir den databehandling som kreves for dataforskere for å takle typisk komplekse analytiske arbeidsmengder.
Techopedia forklarer Data Sandbox
En datasandkasse inkluderer massive parallelle sentrale prosesseringsenheter, avansert minne, lagring med høy kapasitet og I / O-kapasitet og skiller typisk dataeksperimenter og produksjonsdatabasemiljøer i datavarehus.
IBM Netezza 1000 er et eksempel på en datasandkasseplattform som er en frittstående analytisk datamart. Et eksempel på en logisk partisjon i et enterprise data warehouse, som også fungerer som en datasandkasseplattform, er IBM Smart Analytics System. En Hadoop-klynge som IBM InfoSphere BigInsights Enterprise Edition er også inkludert i denne kategorien.



