Q:
Hvorfor skal ledere beskytte seg mot overflødig database?
EN:Databaseansvarlige og andre IT-fagfolk bør beskytte seg mot "database redundancy" eller "data redundancy" på grunn av alle de negative effektene som redundans kan ha i et databasesystem eller miljø. Uansett hvor et bestemt stykke data dupliseres, enten i to felt i en database, eller i to forskjellige databasemiljøer, kan det få konsekvenser for datainnhenting.
En av de første grunnene til å unngå dataredundans er at det kan være bortkastet eller overdreven.
Det er viktig å påpeke at det er planlagt noen typer dataredundans for å ivareta og sikkerhetskopiere data. Andre oppstår imidlertid som følge av dårlig eller ineffektiv koding, eller manglende oppmerksomhet rundt beste praksis. I mange tilfeller fører store mengder dataredundans til at databasen raskt vokser utover en rimelig størrelse. Med dette i bakhodet, gjøres mange anstrengelser for å bekjempe redundans for å spare plass i en database, og følgelig for å redusere kostnader og vedlikeholdsinnsats. Imidlertid må dette gjøres med et blikk mot praktiske forhold - ingeniører kan øve på noe som kalles dataduplisering, men det må gjøres på en måte som er effektiv.
For eksempel kan databasesjefer utforske noe som å fjerne en streng fra et gjentatt felt, for eksempel en delt kunde eller firmanavn, og erstatte den med en enkel variabelreferanse der strengen holdes et annet sted. Dette kan spare plass i en database - men det kan også kreve mer serveraktivitet å utføre et gitt spørsmål, så det er kanskje ikke så effektivt som det ser ut.
En annen stor grunn til å deduplisere data eller unngå dataredundans er på grunn av forvirringen som kan føre til. Overflødige data i en database kan forårsake forskjellige typer avvik. En av disse kalles en oppdateringsavvik - oppdateringsavvik skjer når en post blir lagt inn på nytt med oppdatert informasjon, men oppdateringen gjør det ikke tilbake til den opprinnelige posten. I en slik situasjon kan det være tre forskjellige poster for en bestemt bedriftsansatt, med tre forskjellige stillingstitler og tre forskjellige adresser, fordi personens informasjon ikke ble oppdatert i hele databasen, men bare på posten sist ble lagt inn.
Som foreslått av eksperter, kan databaseadministratorer unngå dataredundans ved design. De kan også delta i datanormaliseringspraksis som kan fikse oppdateringsavvik og andre typer avvik ved å standardisere måtene databasetabellenes poster blir ført på. Databaseadministratorer kan også satse på deduplisering av data som rydder opp og standardiserer data på andre måter. Alt dette tjener formålet med å lage renere databasetabeller, gjøre databaseposter mer konsistente og forhindre all hodepine og komplekse problemer forbundet med uplanlagt dataredundans.