Blant oppstart av teknologi er dataforsker et stadig vanligere begrep som brukes til å referere til datagendere som er i stand til å bygge bro over tradisjonelle separate funksjonsområder for dataintelligens. En dataforsker er noen som er komfortable med å utføre flere (om ikke alle) aspekter ved prosjekter med datainnsamling:
- Datainnsamling: Dette kan innebære å skrive tilpassede parsers og webcrawlere eller skript som er målrettet mot spesifikke webtjenester eller API-er for ikke-tradisjonelle datakilder.
- Datahåndtering: ETL, manipulere, spørre og vedlikeholde data i databaser, nøkkelverdibutikker eller Hadoop.
- Informasjonsvisualisering: Avdekking av mønstre ved bruk av statiske visualiseringsverktøysett og / eller interaktive plattformer basert på Flash, JavaScript eller Processing.
- Analytics: Dette kan variere fra enkle til komplekse teknikker i multivariat statistikk, maskinlæring og NLP.
- Innsikt: Pakk ut, oppsummer og presentere sentrale funn for et bredt publikum.
Det er mange verktøy, ferdigheter og tekniske detaljer, og man kan bruke år på å mestre hvert av elementene oppført ovenfor. Selv om en dataforsker kanskje ikke har ekte ekspertkunnskap på noen av områdene, er han eller hun komfortabel med å hoppe frem og tilbake og utføre grunnleggende oppgaver på dem alle. Resultatet er en datagek kvikk nok til å raskt undersøke et dataprosjekt og produsere svar på (høyt nivå) spørsmål fra ledelsen. (om dataforskere i Data Scientists: The New Rock Stars of the Tech World.)
For å pleie dataforskere, trenger selskaper å fokusere mer på kultur og organisasjonsstruktur. Mange dataarbeidere har nok ferdigheter og opplæring til å raskt bli produktive på flere områder av datainnsikt. Problemet er at de fleste ikke jobber i miljøer som oppmuntrer dem til å bli dataforskere. De sitter fast i siloer og er begrenset til ett eller to områder av datainnsamling. Ofte er de begrenset til å bruke verktøy som er "godkjent" av lederne sine.