Q:
Hva er noen av de viktigste problemene du må vurdere i en stor datalagringsstrategi?
EN:En av de største problemene som blir ignorert for lagring av store data er tilgjengeligheten for team som trenger det. Data lagres jevnlig uten dokumentasjon, på steder der det er vanskelig å få tilgang til eller der de relevante teamene er glemme at de i det hele tatt eksisterer. Til syvende og sist, store datalagring bør ta en åpen første strategi der team blir gjort oppmerksom på at de eksisterer, hva dataene består av og hvordan de får tilgang til dem slik at team kan gjøre bruk av den i programvaren hvis de trenger det.
Et annet viktig spørsmål som jeg finner er kvaliteten på dataene som blir lagret. Data skal lagres i den høyeste kvalitetsformen som de kan eksistere på det endelige lagringsstedet. Det er vanligvis greit å lagre data av lav kvalitet i en datasjø, men når de fortsetter nedover datarørledningen, bør hvert trinn øke kvaliteten på dataene slik at de lagres i den høyeste kvalitetsformen i et system som et datavarehus eller analysedatabase. Dette vil øke kvaliteten på systemene som bruker hvilestedet til dataene.