Innholdsfortegnelse:
Definisjon - Hva betyr utvinning?
Utvinning er prosessen med å hente relevant informasjon fra datakilder i et spesifikt mønster for bruk i et datalagermiljø. Utvinning gir mening til dataene og er det første trinnet i datatransformasjonsprosessen. Utvinning plukker bare ut visse data som passer til en tilstand eller kategori fra en enorm samling av data som kommer fra forskjellige kilder.
Techopedia forklarer Utvinning
I et datalagermiljø må en enorm samling av data som kommer fra forskjellige strukturer og ustrukturerte kilder, behandles, transformeres og lagres for å utlede meningsfulle konklusjoner og spådommer. Dataene som kommer fra de primære kildene, må importeres til datalagringssystemet på en systematisk måte som gjør det enkelt å utføre de forskjellige dataoperasjonene. Denne prosessen kalles utvinning. Ekstraksjon tilfører struktur til ellers ustrukturerte data ved å følge visse regler. Følgende er noen av teknikkene som brukes i datautvinning:
- Mønster matching
- Tabellbasert tilnærming
- Tekstanalyse
