Innholdsfortegnelse:
- Definisjon - Hva betyr Knowledge Discovery in Databases (KDD)?
- Techopedia forklarer Knowledge Discovery in Databases (KDD)
Definisjon - Hva betyr Knowledge Discovery in Databases (KDD)?
Kunnskapsoppdagelse i databaser (KDD) er prosessen med å oppdage nyttig kunnskap fra en datasamling. Denne mye benyttede data mining-teknikken er en prosess som inkluderer forberedelse og utvalg av data, rensing av data, inkorporering av forkunnskaper om datasett og tolking av nøyaktige løsninger fra de observerte resultatene.
De viktigste KDD-applikasjonsområdene inkluderer markedsføring, svindeloppdagelse, telekommunikasjon og produksjon.
Techopedia forklarer Knowledge Discovery in Databases (KDD)
Tradisjonelt ble data mining og kunnskapsfunn utført manuelt. Etter hvert som tiden gikk, vokste datamengden i mange systemer til større enn terabyte-størrelse, og kunne ikke lenger opprettholdes manuelt. For å få en vellykket eksistens av enhver virksomhet, anses det å være underliggende å oppdage underliggende mønstre i data. Som et resultat ble flere programvareverktøy utviklet for å oppdage skjulte data og gjøre antagelser, som utgjorde en del av kunstig intelligens.
KDD-prosessen har nådd sitt høydepunkt de siste 10 årene. Den rommer nå mange forskjellige tilnærminger til oppdagelse, som inkluderer induktiv læring, Bayesiansk statistikk, semantisk spørringsoptimalisering, kunnskapsinnhenting for ekspertsystemer og informasjonsteori. Det endelige målet er å hente ut kunnskap på høyt nivå fra data på lavt nivå.
KDD inkluderer tverrfaglige aktiviteter. Dette omfatter datalagring og tilgang, skalering av algoritmer til massive datasett og tolkningsresultater. Datarensing og datatilgang prosess som er inkludert i datavarehus letter KDD prosessen. Kunstig intelligens støtter også KDD ved å oppdage empiriske lover fra eksperimentering og observasjoner. Mønstrene som er anerkjent i dataene, må være gyldige for nye data, og ha en viss grad av sikkerhet. Disse mønstrene anses som ny kunnskap. Trinn som er involvert i hele KDD-prosessen er:
- Identifiser målet for KDD-prosessen fra kundens perspektiv.
- Forstå involverte applikasjonsdomener og kunnskapen som kreves
- Velg et måldatasett eller delmengde av dataprøver som funn utføres på.
- Rengjør og forbehandler data ved å bestemme strategier for å håndtere manglende felt og endre dataene i henhold til kravene.
- Forenkle datasettene ved å fjerne uønskede variabler. Deretter analyserer du nyttige funksjoner som kan brukes til å representere dataene, avhengig av mål eller oppgave.
- Match KDD-mål med data mining-metoder for å foreslå skjulte mønstre.
- Velg data mining-algoritmer for å oppdage skjulte mønstre. Denne prosessen inkluderer å bestemme hvilke modeller og parametere som kan være passende for den samlede KDD-prosessen.
- Søk etter mønstre av interesse i en bestemt representasjonsform, som inkluderer klassifiseringsregler eller trær, regresjon og klynger.
- Tolke essensiell kunnskap fra de utvinnede mønstrene.
- Bruk kunnskapen og integrer den i et annet system for videre handling.
- Dokumenter det og lag rapporter for interesserte.