Innholdsfortegnelse:
Definisjon - Hva betyr Data Mining?
Data mining er prosessen med å analysere skjulte datamønstre i henhold til forskjellige perspektiver for kategorisering til nyttig informasjon, som blir samlet og samlet i fellesområder, for eksempel datavarehus, for effektiv analyse, data mining algoritmer, forenkle beslutninger om virksomheten og annen informasjon krav for å til slutt kutte kostnader og øke inntektene.
Data mining er også kjent som data discovery og kunnskapsfunn.
Techopedia forklarer Data Mining
De viktigste trinnene som er involvert i en data mining-prosess er:
- Pakk ut, transformer og last inn data i et datavarehus
- Lagre og administrer data i flerdimensjonale databaser
- Gi datatilgang til forretningsanalytikere ved hjelp av applikasjonsprogramvare
- Presentere analyserte data i lett forståelige former, for eksempel grafer
Det første trinnet i data mining er å samle relevant data kritisk for virksomheten. Bedriftsdata er enten transaksjonelle, ikke-operasjonelle eller metadata. Transaksjonsdata omhandler den daglige driften som salg, varelager og kostnader etc. Ikke-operasjonelle data er normalt forutsett, mens metadata er opptatt av logisk databasedesign. Mønstre og forhold mellom dataelementer gir relevant informasjon, som kan øke organisasjonsinntektene. Organisasjoner med et sterkt forbrukerfokus tar for seg data mining-teknikker som gir klare bilder av solgte produkter, pris, konkurranse og kundedemografi.
For eksempel overfører retailgiganten Wal-Mart all relevant informasjon til et datavarehus med terabyte med data. Disse dataene kan enkelt nås av leverandører slik at de kan identifisere kjøpemønster for kunder. De kan generere mønstre på shoppingvaner, de fleste handlede dager, mest etterspurte produkter og andre data ved bruk av data mining-teknikker.
Det andre trinnet i data mining er å velge en passende algoritme - en mekanisme som produserer en data mining-modell. Den generelle bruken av algoritmen innebærer å identifisere trender i et sett med data og bruke output for parameterdefinisjon. De mest populære algoritmene som brukes til data mining er klassifiseringsalgoritmer og regresjonsalgoritmer, som brukes til å identifisere sammenhenger mellom dataelementer. Store databaseleverandører som Oracle og SQL har integrert data mining-algoritmer, for eksempel clustering og regression tress, for å dekke etterspørselen etter data mining.
