Q:
Hvorfor er skjevhet versus avvik viktig for maskinlæring?
EN:Å forstå begrepene "skjevhet" og "varians" i maskinlæring hjelper ingeniører til å mer kalibrere maskinlæringssystemer for å tjene deres tiltenkte formål. Skjevhet versus varians er viktig fordi det hjelper deg med å håndtere noen avveiningene i maskinlæringsprosjekter som avgjør hvor effektivt et gitt system kan være for bedriftsbruk eller andre formål.
Når du forklarer skjevhet versus varians, er det viktig å merke seg at begge disse problemene kan kompromittere dataresultater på veldig forskjellige måter.
Gratis nedlasting: Machine Learning og Why It Matters |
Skjevhet kan beskrives som et problem som resulterer i unøyaktige klynger - det er en situasjon der maskinlæring kan gi mange resultater med presisjon, men savner merket når det gjelder nøyaktighet. Derimot er varians en "spredning" av informasjon - det er en villhet, en data som viser en rekke resultater, hvorav noen kan være nøyaktige, men mange av dem vil falle utenfor en bestemt sone av presisjon for å gjøre det samlede resultatet mindre nøyaktig og mye mer "bråkete."
Faktisk forklarer noen eksperter som beskriver varians at variantresultater har en tendens til å "følge støyen", der høye partiske resultater ikke går langt nok til å utforske datasett. Dette er en annen måte å kontrastere problemet med skjevhet med variansproblemet - eksperter forbinder skjevheter med undermontering, der systemet kanskje ikke er fleksibelt nok til å inkludere et sett med optimale resultater. Derimot vil varians være en slags motsatt - der overmontering gjør systemet for skjørt og delikat til å tåle mye dynamisk endring. Ved å se på skjevhet versus avvik gjennom dette objektivet med kompleksitet, kan ingeniører tenke på hvordan de kan optimalisere montering av et system for å gjøre det ikke for komplekst, ikke for enkelt, men bare komplekst nok.
Dette er to måter filosofien om skjevhet versus varians er nyttig i å designe maskinlæringssystemer. Det er alltid viktig å jobbe med maskinskjevhet for å prøve å få et samlet sett med resultater som er nøyaktige for bruken de brukes til. Det er også alltid viktig å se på varians i å prøve å kontrollere kaoset eller villskapen til sterkt spredte eller spredte resultater, og å håndtere støy i et gitt system.