Innholdsfortegnelse:
Definisjon - Hva betyr dataforarbeiding?
Forbehandling av data er en data mining-teknikk som innebærer å transformere rå data til et forståelig format. Virkelige data er ofte ufullstendige, inkonsekvente og / eller mangler visse oppførsler eller trender, og vil sannsynligvis inneholde mange feil. Forbehandling av data er en velprøvd metode for å løse slike problemer. Forbehandling av data forbereder rå data for videre behandling.
Dataprebehandling brukes databasedrevne applikasjoner som styring av kundeforhold og regelbaserte applikasjoner (som nevrale nettverk).
Techopedia forklarer dataprosessering
Data går gjennom en serie trinn under forbehandling:
- Datarengjøring: Data blir renset gjennom prosesser som å fylle ut manglende verdier, glatte ut støyende data eller løse uoverensstemmelser i dataene.
- Dataintegrasjon: Data med forskjellige representasjoner blir satt sammen og konflikter i dataene blir løst.
- Datatransformasjon: Data normaliseres, aggregeres og generaliseres.
- Datareduksjon: Dette trinnet tar sikte på å presentere en redusert representasjon av dataene i et datavarehus.
- Datakommunisering: involverer reduksjon av et antall verdier av en kontinuerlig attributt ved å dele omfanget av attributtintervaller.