Innholdsfortegnelse:
Definisjon - Hva betyr Schema on Read?
Skjema på lest viser til en innovativ dataanalysestrategi i nye datahåndteringsverktøy som Hadoop og andre mer involverte databaseteknologier. I skjema som er lest, blir data brukt på en plan eller et skjema når de trekkes ut fra et lagret sted, i stedet for når det går inn.
Techopedia forklarer skjema på Read
Eldre databaseteknologier hadde en håndhevingsstrategi for skjema på skriving - med andre ord, dataene måtte brukes på en plan eller et skjema når de skulle inn i databasen. Dette ble delvis gjort for å håndheve konsistensen av data, og det er en av de største fordelene med skjema ved skriving. Når skjemaet er lest, kan det hende at personer som håndterer dataene trenger å gjøre mer arbeid for å identifisere hvert enkelt stykke, men det er mye mer allsidighet.
På en grunnleggende måte kompletterer skjema-på-les-design den viktigste bruken av Hadoop og relaterte verktøy. Bedrifter ønsker å samle mye data effektivt, og lagre dem til spesiell bruk. Når det er sagt, kan de verdsette innsamlingen av urene eller inkonsekvente data mer enn de verdsetter et strengt datahåndhevelsesregime. Hadoop har med andre ord plass til å få et bredt omfang av forskjellige små biter med data som kanskje ikke er helt organisert. Da informasjonen blir brukt, blir den organisert. Å bruke det gamle skjema-til-skrivesystemet for databaser ville bety at de mindre organiserte dataene sannsynligvis vil bli kastet ut.
En annen måte å si dette på er at skjema for skriving er bedre for å få veldig rene og konsistente datasett, men disse datasettene kan være mer begrensede. Skjema på lest kaster et bredere nett, og gir mulighet for en mer allsidig organisering av data. Eksperter påpeker også at det er lettere å lage to forskjellige visninger av de samme dataene med skjema på lest.
Denne skjema-til-les-strategien er en vesentlig del av grunnen til at Hadoop og relaterte teknologier er så populære i dagens virksomhetsteknologi. Bedrifter bruker store mengder rå data for å drive alle slags forretningsprosesser ved å anvende uklar logikk og andre sorterings- og filtreringssystemer som involverer bedriftens datavarehus og andre store dataverdier.









