Innholdsfortegnelse:
Definisjon - Hva betyr skitne data?
Skitne data refererer til data som inneholder feil informasjon. Det kan også brukes når du refererer til data som er i minnet og ennå ikke lastet inn i en database. Fullstendig fjerning av skitne data fra en kilde er upraktisk eller praktisk talt umulig.
Følgende data kan betraktes som skitne data:
- Misvisende data
- Dupliser data
- Feil data
- Unøyaktige data
- Ikke-integrerte data
- Data som bryter forretningsreglene
- Data uten en generell formatering
- Feil punkterte eller stavede data
Techopedia forklarer skitne data
I tillegg til feil datainnføring, kan skitne data genereres på grunn av feil metoder i datahåndtering og datalagring. Noen skitne datatyper blir forklart nedenfor:
- Feil data - For å sikre at dataene er gyldige eller korrekte, skal den oppgitte verdien være i samsvar med feltets gyldige verdier. For eksempel bør verdien som er lagt inn i månedsfeltet være fra 1 til 12, eller en persons aldersgruppe må være under 130. Dataregnskapets korrekthet kan håndheves programmatisk ved hjelp av oppslagstabeller eller med redigeringskontroller.
- Unøyaktige data - Det er mulig at en dataverdi kan være korrekt, men ikke nøyaktig. Noen ganger er det praktisk å undersøke mot andre filer eller felt for å finne ut om dataverdien er nøyaktig basert på konteksten den brukes. Likevel kan nøyaktighet ofte bare valideres ved manuell bekreftelse.
- Brudd på forretningsregel - Data som bryter forretningsregel er en annen type skitne data. For eksempel må en effektiv dato alltid komme før en utløpsdato. Et annet eksempel på brudd på forretningsregel kan være pasientens Medicare-forsikringskrav der pasienten fremdeles kan være under pensjonsalder og ikke har rett til Medicare.
- Inkonsekvente data - Ukontrollert dataredundans fører til datakonsekvenser. Hver organisasjon påvirkes av inkonsekvente og repeterende data. Dette er spesielt typisk med kundedata.
- Ufullstendige data - Data med manglende verdier er hovedtypen ufullstendige data.
- Dupliserte data - Dupliserte data kan oppstå på grunn av gjentatte innsendinger, feil dataforbindelse eller brukerfeil.
For å øke datakvaliteten og forhindre skitne data, bør organisasjoner innlemme metodologier for å sikre fullstendighet, gyldighet, konsistens og korrekthet av dataene.
