Innholdsfortegnelse:
Definisjon - Hva betyr Value Learning Problem?
Verdilæringsproblemet er et spesifikt grunnleggende spørsmål i utviklingen av maskinlæring og teknologi for kunstig intelligens som adresserer forskjellen mellom mennesker og datamaskiner, og måtene de tenker.
I et nøtteskall er verdilæringsproblemet basert på hvor vanskelig det er for datamaskiner å finne ut hva de skal "verdsette" (både når det gjelder data og policy) og hvordan de skal handle i et maskinlæringsnettverk, og hvordan programmerere kan optimalisere hvordan programmet fungerer som å samsvare med de opprinnelige intensjonene da de opprettet det.
Techopedia forklarer Value Learning Problem
Nøkkelen til verdilæringsproblemet er at det er ekstremt viktig for programmerere å kunne lage maskinlæringsprogrammer som utfører de tiltenkte verdiene. Imidlertid er fangst-22 at verdiene ikke eksplisitt kan angis på måter som hindrer selve læring av programmet.
Noen ganger snakker folk om "konvergensen" av maskinlæringsteknologier som den vellykkede fokuseringen på verdidata, men verdien av læringsproblemet er på noen måter litt annerledes. Det er ideen om at det må være en eller annen grunnleggende måte å vise maskinlæringsprogrammet hva som er ønsket, i stedet for bare å stave det ut, som er en deterministisk måte å drive ML på.
Ta for eksempel dette papiret om verdilæringsproblemet som antyder at maskinlæringsprogrammer kan ha et lagringssett med innspill som viser positive menneskelige svar på stimuli. Når du leser disse adressene til verdilæringsproblemet, blir det klart at det er et stort gap i maskinlæring som ikke er lett å fikse - egentlig - hvordan lager mennesker maskiner som virkelig kan tenke som mennesker? En annen måte å forklare dette på er at verdilæringsproblemet går til hjertet av hvordan vi tenker som mennesker, og hvordan tankene våre ikke alltid er basert på roteinnspill.
For datamaskiner å modellere vår intuisjon, vårt instinkt, våre sosiale tilbøyeligheter og våre dypeste etiske verdier er en høy rekkefølge, selv når datamaskiner kan lære å spille sjakk på en menneskelig måte, eller overgå oss til å løse vanskelige matematikkproblemer. Fagpersoner kan forvente at verdilæringsprogrammet vil fortsette å være sentralt i utviklingen av maskinlæringsteknologier.