Innholdsfortegnelse:
Definisjon - Hva betyr ustrukturert datagruvedrift?
Ustrukturert datautvinning er praksisen med å se på relativt ustrukturerte data og prøve å få mer raffinerte datasett ut av det. Det består ofte av å trekke ut data fra kilder som ikke tradisjonelt brukes til data mining-aktiviteter.Techopedia forklarer Unstructured Data Mining
Generelt er data mining en praksis å kamme gjennom datasett og prøve å få bare de mest verdifulle bitene med informasjon til et bestemt format. Dette er vanligvis vanskeligere med relativt ustrukturerte data. IT-eksperter definerer ustrukturerte data som data som ikke er i et spesifikt format, data som er "teksttunge" eller data som er "skjult" i upresise dokumenter som ikke formelt er beordret til å gi teknisk informasjon.
Et eksempel på et ustrukturert dokument vil være et brev eller korrespondanse mellom to eller flere parter. Ved ustrukturert data mining ville teknologier fordele denne bokstaven og lete etter spesifikke identifikatorer og informasjonsbiter som navnene på nærstående parter, datoene brevene ble sendt, navnene på de involverte virksomhetene, mengdene valuta eller annen kvantifisering biter av data, eller kodene som er tilordnet bestemte produkter, tjenester eller tilbud. Disse typer data blir utvunnet og deretter satt i et format som bedrifter eller andre parter kan bruke for en rask referanse eller for utviklede applikasjoner for forretningsintelligens.