Innholdsfortegnelse:
Definisjon - Hva betyr umerkede data?
Umerkede data er en betegnelse på data som ikke er merket med etiketter som identifiserer egenskaper, egenskaper eller klassifiseringer. Umerkede data brukes vanligvis i forskjellige former for maskinlæring.
Techopedia forklarer umerkede data
I typer maskinlæring kalt unsupervised machine learning, fungerer maskinlæringsprogrammet ved å evaluere sett med umerkede data. Fordi dataene ikke har etiketter, må maskinlæringsprogrammet identifisere hvert datablad om dets egenskaper og egenskaper.
En av de beste måtene å forklare dette på er å bruke metaforen om fruktbolle. Anta at maskinlæringsprogrammet lærer å identifisere tre forskjellige typer frukt - bananer, druer og epler. Hvis dataene i opplæringssettet er merket, fungerer maskinlæringsprogrammet fra det perspektivet - samsvarer suksessive bilder med en av de tre kategoriene.
Hvis imidlertid ingen av databitene er merket med de tre fruktnavnene - bananer, druer og epler - vil maskinlæringsprogrammet trenge å arbeide ved å evaluere hvert bilde og se på egenskaper som farge - gul, rød eller lilla - former - lang og tynn, rund eller klynget - og andre egenskaper.
Fra dette eksemplet er det lett å se hvordan merkede data gir mye enklere muligheter til å bruke maskinlæringsalgoritmer for beslutningsresultater. Imidlertid kan sofistikerte, uovervåkte maskinlæringsprogrammer som håndterer umerkede data, gi forbløffende nøyaktige og presise resultater også.
