Hjem På nyhetene Hvorfor er valg av funksjoner så viktig i maskinlæring?

Hvorfor er valg av funksjoner så viktig i maskinlæring?

Anonim

Q:

Hvorfor er valg av funksjoner så viktig i maskinlæring?

EN:

Valg av funksjoner er ekstremt viktig i maskinlæring først og fremst fordi det fungerer som en grunnleggende teknikk for å rette bruken av variabler til det som er mest effektivt og effektivt for et gitt maskinlæringssystem.

Eksperter snakker om hvordan funksjonsvalg og ekstraksjon av funksjoner for å minimere forbannelsen av dimensjonalitet eller hjelpe til med å takle overmontering - dette er forskjellige måter å ta opp ideen om overdreven kompleks modellering.

Gratis nedlasting: Machine Learning og Why It Matters

En annen måte å si dette på er at funksjonsvalg er med på å gi utviklere verktøyene til å bruke bare de mest relevante og nyttige dataene i opplæringssett for maskinlæring, noe som dramatisk reduserer kostnader og datavolum.

Et eksempel er ideen om å måle en kompleks form i skala. Når programmet skalerer, identifiserer det større antall datapunkter, og systemet blir mye mer sammensatt. Men en sammensatt form er ikke det typiske datasettet som et maskinlæringssystem bruker. Disse systemene kan bruke datasett som har sterkt forskjellige nivåer av varians mellom forskjellige variabler. I klassifisering av arter kan for eksempel ingeniører bruke funksjonsvalg for bare å studere variablene som vil gi dem de mest målrettede resultatene. Hvis hvert dyr i diagrammet har samme antall øyne eller bein, kan dataene fjernes, eller andre mer relevante datapunkter kan trekkes ut.

Valg av funksjoner er den diskriminerende prosessen som ingeniører leder maskinlæringssystemer mot et mål. I tillegg til ideen om å fjerne kompleksitet fra systemer i skala, kan funksjonsvalg også være nyttig for å optimalisere aspekter av det eksperter kaller "skjevhet avveining" i maskinlæring.

Årsakene til at funksjonsvalg hjelper med skjevhet og variansanalyse er mer kompliserte. En studie fra Cornell University om valg av funksjoner, skjevhet varians og bagging tjener til å illustrere hvordan funksjonsvalg hjelper prosjekter.

I følge forfatterne undersøker papiret mekanismen som valg av funksjon forbedrer nøyaktigheten av veiledet læring. "

Studien sier videre:

En empirisk skjevhets- / variansanalyse etter hvert som funksjonen velges, indikerer at det mest nøyaktige funksjonssettet tilsvarer det beste avveiningspunktet for skjevhet avvik for læringsalgoritmen.

Når de diskuterer bruken av sterk eller svak relevans, snakker forfatterne om funksjonsvalg som "en variansreduksjonsmetode" - dette er fornuftig når du tenker på varians som vesentlig mengden variasjon i en gitt variabel. Hvis det ikke er noen varians, kan datapunktet eller matrisen i det vesentlige være ubrukelig. Hvis det er ekstremt høy varians, kan det utvikle seg til hva ingeniører kan tenke på som "støy" eller irrelevante, vilkårlige resultater som er vanskelige for maskinlæringssystemet å administrere.

I lys av dette er funksjonsvalg en grunnleggende del av design i maskinlæring.

Hvorfor er valg av funksjoner så viktig i maskinlæring?