Q:
Hvordan kan konseptet likevekt informere om maskinlæringsprosjekter?
EN:Generelt vil en likevekt informere maskinlæring ved å søke å stabilisere maskinens læringsmiljøer og skape utfall med en kompatibel blanding av deterministiske og probabilistiske komponenter.
Eksperter beskriver en "likevekt" som en situasjon der rasjonelle aktører i et maskinlæringssystem oppnår enighet om strategisk handling - spesielt Nash-likevekten i spillteorien innebærer at to eller flere av disse rasjonelle aktørene konsoliderer strategier ved å erkjenne at ingen spiller drar nytte av endre en bestemt strategi hvis de andre spillerne ikke endrer.
Gratis nedlasting: Machine Learning og Why It Matters |
En spesielt populær og enkel demonstrasjon av Nash-likevekt involverer en enkel matrise der to spillere hver velger et binært utfall.
Ovennevnte er en ganske teknisk måte å beskrive likevekt på og hvordan den fungerer. En mye mer uformell måte å illustrere likevektsbegrepet, spesielt eksemplet ovenfor med to rasjonelle aktører som hver har binære valg, er å tenke på hva du kan kalle "å gå mot hverandre i gymnaset".
Anta at to personer går i forskjellige retninger nedover en videregående skole (eller en hvilken som helst annen type område), som bare har plass til to personer i bredden. De to åpne banene er de binære resultatene. Hvis de to rasjonelle aktørene velger forskjellige binære utfall som ikke kommer i konflikt med hverandre, vil de gå forbi hverandre og si hei. Hvis de velger to motstridende binære utfall - går de i samme rom, og ett av dem vil trenge å gi seg.
I eksemplet over, hvis de to rasjonelle aktørene velger de to kompatible og ikke-motstridende utfallene, er den generelle konsensus at ingen av dem oppnår ved å endre strategien - i dette tilfellet deres veibeskrivelse - hvis den andre personen ikke endrer sin.
Ovennevnte utgjør en likevekt som kan modelleres i enhver gitt maskinlæringskonstruksjon. Gitt dette enkle eksemplet, vil utfallet alltid være de to rasjonelle aktørene som samarbeider, eller med andre ord, to personer som går forbi hverandre.
Det motsatte kan kalles en "ulikhet" - hvis de to rasjonelle aktørene velger motstridende utfall, som nevnt, vil en av dem måtte gi etter. Imidlertid kan ML-programmet som modellerer dette kastes i en uendelig sløyfe hvis begge bestemmer seg for å gi seg - omtrent som to personer som skal flytte for å prøve å imøtekomme hverandre og fortsatt fortsette å gå mot kollisjon.
Likevekt som den over vil vanligvis bli brukt i maskinlæring for å skape konsensus og stabilisere modeller. Ingeniører og utviklere vil se etter de scenariene og situasjonene som drar nytte av likevekt, og jobber med å endre eller håndtere de som ikke gjør det. Når vi ser på eksempler fra ekte verden som tilsvarer ML-likevekt, er det lett å se hvordan denne typen analyser i maskinlæringssystem er unikt lærerikt for å finne ut hvordan man kan modellere menneskelig atferd ved å skape rasjonelle aktører og agenter. Det er bare et utmerket eksempel på hvordan en likevekt kan brukes til å gjøre fremskritt i bruken av maskinlæringssystemer.