Hjem trender 6 store myter om håndtering av big data

6 store myter om håndtering av big data

Innholdsfortegnelse:

Anonim

Tilbake i mai 2014 ga Forrester Research to rapporter som trakk visse konklusjoner om hypen rundt big data. Forskningsfirmaet kartla mer enn 250 ledere for markedsføring og forretningsutvikling. I følge rapportens forfattere er returdetaben av stor data til enhver tid høy, og teknologileverandørene touter produkter med det som ser ut til å være utrolige påstander.


Gartner er enig med Forrester Research; betydelig hype omgir store data. I rapporten fra september 2014 debuterer Gartner fem av de største datamytene, og Gartner-analytikere gir sin mening om hva som er misforstått om big data og manipulering av dem. Så hva er big data's største myter? La oss se.

Myte: Alle er foran oss med å ta i bruk big data.

Gartner sier interessen for big data er på et høyt nivå. Til tross for dette har vel 13 prosent av de spurte arbeidssystemene. Årsaken: de fleste selskaper har ennå ikke funnet ut hvordan de kan utvinne noen verdier fra store lagringsplasser med data. Her er Gartners undersøkelse mer optimistisk enn Forrester-rapporten, som fant at bare 9 prosent av deltakerne i undersøkelsen sa at de planla å implementere big-data-teknologier i løpet av det neste året. (Big data har mye å tilby. Lær mer i 5 reelle problemer Big Data kan løse.)

Myte: Vi har så mye data; vi trenger ikke å bekymre oss for hver liten datafeil.

Gartner er bekymret for en ting vi mennesker har: "Vi har så mye, det lille som er ille, vil ikke gjøre noe." Ted Friedman, visepresident og fremtredende analytiker i Gartner mener at dette er feil måte å se på situasjonen.


"I virkeligheten, selv om hver enkelt feil har en mye mindre innvirkning på hele datasettet enn det gjorde da det var mindre data, er det flere feil enn før fordi det er mer data, " sa Friedman. "Derfor forblir den samlede effekten av data av dårlig kvalitet på hele datasettet den samme."


Friedman legger til en annen grunn til bekymring. Innsamling av store data inkluderer ofte data utenfor virksomheten, som derfor er av ukjent struktur og opprinnelse. Dette øker potensialet for feil.

Myte: Big datateknologi vil eliminere behovet for dataintegrasjon.

Det er to viktige dataanalysestrategier som kan brukes på big data: "skjema på skriving" eller "skjema på lest." Inntil nylig var skjema på skriving den eneste metoden som ble brukt. Skjema på lest er gjeldende mani i databaseadministrasjon. I motsetning til skjema for skriving, som krever et strukturert format, lastes data inn i skjema-på-les-databaser i dets rå format. Da utvikler utviklere - ved bruk av ustrukturerte databaseplattformer som Hadoop - de forskjellige dataene til et brukbart format. Skjema på lest har åpenbare fordeler, men som Gartner nevner, må dataintegrering skje på et tidspunkt.

Myte: Å bruke et datavarehus for avansert analyse er meningsløst.

Å bruke tiden på å opprette et datavarehus virker meningsløst for mange informasjonssjefer, spesielt når nyoppfangede data er annerledes enn i datavarehuset. Imidlertid advarer Gartner igjen at selv avansert dataanalyse vil bruke datavarehus og nye data, noe som betyr at dataintegratorer må:

  • Avgrens nye datatyper for å gjøre dem egnet for analyse
  • Bestem hvilke data som er relevante, og nivået på datakvalitet som trengs
  • Bestem hvordan du skal samle dataene
  • Forstå at foredling av data kan skje andre steder enn datavarehuset

Myte: Datasjøer erstatter datavarehuset.

Datasjøer er depoter av forskjellige data, i motsetning til datavarehus der data er i et strukturert format. Å lage en datasjø krever liten forhåndsinnsats (ikke nødvendig å formatere dataene) sammenlignet med datavarehus, og det er derfor datasjøer er av interesse.


Gartner understreker at det ikke er poenget å ha dataene - å kunne manipulere de innfangede dataene for informert beslutningstaking er poenget. Det er dessuten problematisk å bruke (noe uprovoserte) datasjøer for å lette beslutningen.


"Datavarehus har allerede mulighetene til å støtte et bredt utvalg av brukere i en organisasjon, " sa Nick Heudecker, forskningsdirektør i Gartner. "Ledere for informasjonsledelse trenger ikke å vente på at innsjøer kommer inn." (Lær mer om å ta i bruk big data i 7 ting du må vite om big data før adopsjon.)

Big Data Works - Nye datamanipuleringsmetoder kan ikke

Årsaken til at Gartner sa "største datamyter" i stedet for "bigdata-myter" blir tydelig etter å ha lest rapporten. Gartner er ikke leery for big data. Gartner er leery av de som føler at de nyere metodene for å manipulere big data er klare for "prime time."

6 store myter om håndtering av big data