Q:
Hva er de fire grunnlagene for å bli en god dataforsker?
EN:Som mange eksperter påpeker, å bli en stor dataforsker krever en kombinasjon av ferdigheter og erfaring som bygges gjennom dedikert læring og analyse av et komplekst felt. Dataforskere som administratorer og kuratorer av verdifulle dataeiendommer er veldig etterspurt i dag. La oss se på hva noen av disse grunnleggende ferdighetene innebærer.
Den første av de fire grunnleggende komponentene i dataforskerarbeid er matematikk og statistikk. Gode dataforskere bør lære å være fortrolige med ulike matematiske begreper relatert til veiledet og uten tilsyn av maskinlæring, inkludert algoritmetyper som beslutnings-trær, tilfeldig skog, logistisk regresjon, klynging og bruk av dimensjonalitet i maskinlæring (ML). Generelt sett bør de ha et godt håndtak med å jobbe med matematiske ligninger og statistikk ved bruk av statistiske analyseressurser.
Den andre viktigste grunnleggende komponenten i datavitenskapelig arbeid involverer programmering og databestyring. Enkeltpersoner skal være sterke i skriptspråk som Python og statistiske språk som R, sammen med erfaring og ferdigheter med database og SQL semantikk og operasjonelle teknikker. Kunnskap om programvarekomponenter som Hadoop, MapReduce, Hive og Pig er også attraktiv for arbeidsgivere.
Den tredje grunnleggende komponenten for å bli en god dataforsker er den teoretiske og filosofiske komponenten for å forstå datavitenskap og maskinlæring. Disse personene bør være selvoppstartende problemløsere med nysgjerrige sinn - de kombinerer tross alt rå kvantitativ analyse med kreativ forståelse av maskinlæring og datavitenskapelige prosesser. I stedet for bare å være tekniske personer, bør de ha en dyp forankring i hva det vil si å lage maskinlæringsprosjekter og jobbe med datavitenskaplige initiativ når det gjelder sluttmål og sluttresultater.
En fjerde hovedpilar for å lære å være en god dataforsker innebærer å jobbe med mennesker og å kunne bruke data på måter som er fornuftige for andre mennesker.
Gode dataforskere kan være historiefortellere - de kan oversette kvantitative data til fortellinger og innsikter. Som sådan bør de ha gode kommunikasjonsevner for å kunne bringe arbeidet sitt til bordet og formidle det til flere interessenter eller et gitt publikum effektivt. Dette er noen av de viktigste typene ferdigheter som bygger en god dataforsker som er klar til å delta i dagens fartsfylte og raskt fremme IT-bransje.