Innholdsfortegnelse:
Definisjon - Hva betyr K-Means Clustering?
K-betyr klynging er en enkel læringsalgoritme uten tilsyn som brukes til å løse problemer med klynger. Den følger en enkel prosedyre for å klassifisere et gitt datasett i et antall klynger, definert av bokstaven "k", som er fikset på forhånd. Klyngene blir deretter plassert som punkter, og alle observasjoner eller datapunkter er assosiert med den nærmeste klyngen, beregnet, justert, og deretter starter prosessen på nytt ved å bruke de nye justeringene til et ønsket resultat er nådd.
K-betyr klynging har bruk i søkemotorer, markedssegmentering, statistikk og til og med astronomi.
Techopedia forklarer K-Means Clustering
K-betyr klynging er en metode som brukes for gruppeanalyse, spesielt innen data mining og statistikk. Den tar sikte på å dele opp et sett med observasjoner i et antall klynger (k), noe som resulterer i partisjonering av dataene i Voronoi-celler. Det kan betraktes som en metode for å finne ut hvilken gruppe et bestemt objekt virkelig hører til.
Det brukes hovedsakelig i statistikk og kan brukes på nesten hvilken som helst gren av studien. I markedsføring kan det for eksempel brukes til å gruppere forskjellige demografier av mennesker i enkle grupper som gjør det lettere for markedsførere å målrette. Astronomer bruker den for å sile gjennom enorme mengder astronomiske data; siden de ikke kan analysere hvert objekt en etter en, trenger de en måte å statistisk finne interessante steder for observasjon og undersøkelse.
Algoritmen:
- K-punkter plasseres i objektdataområdet som representerer den innledende gruppen av centroids.
- Hvert objekt eller datapunkt tilordnes til det nærmeste k.
- Etter at alle objekter er tilordnet, beregnes k centroidenes posisjon på nytt.
- Trinn 2 og 3 gjentas inntil centroidenes posisjoner ikke lenger beveger seg.
