Innholdsfortegnelse:
Definisjon - Hva betyr datakvalitet?
Datakvalitet er en intrikat måte å måle dataegenskaper fra forskjellige perspektiver. Det er en omfattende undersøkelse av applikasjonseffektivitet, pålitelighet og egnethet til data, spesielt data som er bosatt i et datavarehus.
Inne i en organisasjon er tilstrekkelig datakvalitet avgjørende for transaksjons- og operasjonelle prosesser, samt levetiden for forretningsintelligens (BI) og forretningsanalyse (BA) rapportering. Datakvalitet kan påvirkes av måten data legges inn, håndteres og vedlikeholdes på.
Datakvalitetssikring (DQA) er en prosedyre som er ment å verifisere effektiviteten og påliteligheten av data.
Techopedia forklarer datakvalitet
Effektiv vedlikehold av datakvalitet krever periodisk overvåking og rengjøring av data. Generelt innebærer vedlikehold av datakvalitet oppdatering / standardisering av data og deduplisering av poster for å lage en enkelt datavisning.
De viktigste datakvalitetskomponentene er som følger:
- Fullstendighet: Nivå der ønskede dataattributter leveres. Data trenger ikke å være 100 prosent fullstendig.
- Nøyaktighet: Representerer datas virkelige status. Kan beregnes ved å bruke en automatisert metode ved hjelp av forskjellige lister og kartlegging.
- Troverdighet: Omfanget av hvilke data som anses som troverdige og sanne. Kan avvike fra kilde.
- Aktualitet (alder på data): Omfanget av hvilke data som er tilstrekkelig oppdatert for en aktuell virksomhet.
- Konsistens: vurderer om forskjellige datasettfakta stemmer overens.
- Integritet: vurderer referansegyldighet og nøyaktig sammenføyning av forskjellige datasett.
Datakvalitet er viktig av følgende årsaker:
- Den gir presis og tidsbestemt informasjon for å håndtere ansvarlighet og tjenester.
- Den tilbyr rask informasjon for å håndtere effektiviteten av tjenesten.
- Det hjelper med å prioritere og garantere effektiv ressursutnyttelse.