Hjem Audio Datasjøens overlevelsesguide: hva, hvorfor og hvordan av datasjøen

Datasjøens overlevelsesguide: hva, hvorfor og hvordan av datasjøen

Anonim

Tidligere, når man tenkte på digitale data, var det fornuftig å skille data mellom transaksjonsdata, dataene som er fanget i forretningsapplikasjoner, lagret i databasetabeller og presentert av BI-verktøy, og alle andre data: e-post, websider, bilder, video og så videre. I dag pleier vi å referere til “andre data” som ustrukturerte data.

Likevel var det analyserbart og programvare for å hente verdi fra slike data har krysset klyngen. Det var det analytiske imperativet mer enn noe annet som ga opphav til det opprinnelige konseptet med en datasjø, et datalager for begge dataslagene, og i tillegg for data som ble høstet fra flere kilder utenfor virksomheten, hvorav noen uunngåelig var ustrukturert.

I denne artikkelen vil vi undersøke hvordan det nye økosystemet opprettet av datasjøen ikke lenger vil bestå fullstendig av transaksjonene (eller hendelsene) av virksomheten. Den vil også omfatte data fra andre kilder, som virksomheten bruker for å utføre analyser og informere brukerne om viktig informasjon om hvilke beslutninger som kan baseres. Registreringssystemet vil, som det alltid var, være den gyldne kopien av bedriftsdata og revisjonssporet for virksomhetens IT-aktiviteter.

Datasjøens overlevelsesguide: hva, hvorfor og hvordan av datasjøen