Innholdsfortegnelse:
Definisjon - Hva betyr datautvinning?
Datautvinning er der data blir analysert og gjennomgått for å hente relevant informasjon fra datakilder (som en database) i et bestemt mønster. Ytterligere databehandling utføres, som innebærer å legge til metadata og annen dataintegrasjon; en annen prosess i datamaskinens arbeidsflyt.
De fleste datautvinning kommer fra ustrukturerte datakilder og forskjellige dataformater. Disse ustrukturerte dataene kan være i alle former, for eksempel tabeller, indekser og analyser.
Techopedia forklarer datautvinning
Data i et lager kan komme fra forskjellige kilder, et datavarehus krever tre forskjellige metoder for å bruke innkommende data. Disse prosessene er kjent som utvinning, transformasjon og lasting (ETL).
Prosessen med datautvinning innebærer innhenting av data fra oppvaskede datakilder. Dataekstraktene blir deretter lastet inn i iscenesettelsesområdet til den relasjonsdatabase. Her brukes ekstraksjonslogikk og kildesystemet blir spurt om data ved bruk av applikasjonsprogrammeringsgrensesnitt. Etter denne prosessen er dataene nå klare til å gå gjennom transformasjonsfasen av ETL-prosessen.