ETL (pakke ut, transformere og laste) er en av de viktigste prosessene innen big data-analyse - og samtidig kan det være en av de største flaskehalsene. (For mer informasjon om big data, sjekk ut 5 nyttige Big Data-kurs du kan ta online.)
Årsaken til at ETL er så viktig er at de fleste data en virksomhet samler inn ikke er klare, i sin rå form, for en analyseløsning å fordøye. For at en analyseløsning skal skape innsikt, må rådataene hentes fra applikasjonen der den for tiden ligger, transformeres til et format som et analyseprogram kan lese, og deretter lastes det inn i selve analyseprogrammet.
Denne prosessen er analog med matlaging. Rå ingrediensene er dine rå data. De trenger å bli trukket ut (kjøpt fra en butikk), transformert (kokt) og deretter lastet (belagt), før de kan analyseres (smakes). Vanskeligheten og utgiftene kan skalere uforutsigbart - det er lett å lage mac n 'ost til deg selv, men mye vanskeligere å lage en gourmetmeny for 40 personer på en middagsselskap. Unødvendig å si at en feil når som helst kan gjøre måltidet ufordøyelig.