Hjem Utvikling Hva er forsterkningslæring? - definisjon fra techopedia

Hva er forsterkningslæring? - definisjon fra techopedia

Innholdsfortegnelse:

Anonim

Definisjon - Hva betyr forsterkningslæring?

Forsterkningslæring, i forbindelse med kunstig intelligens, er en type dynamisk programmering som trener algoritmer ved hjelp av et system med belønning og straff.

En forsterkende læringsalgoritme, eller agent, lærer ved å samhandle med omgivelsene. Agenten mottar belønninger ved å utføre riktig og straffer for å ha prestert feil. Agenten lærer uten inngripen fra et menneske ved å maksimere belønningen og minimere straffen.

Techopedia forklarer Reinforcement Learning

Forsterkningslæring er en tilnærming til maskinlæring som er inspirert av behaviorist-psykologi. Det ligner på hvordan et barn lærer å utføre en ny oppgave. Forsterkningslæring står i kontrast til andre tilnærminger til maskinlæring ved at algoritmen ikke eksplisitt blir fortalt hvordan du skal utføre en oppgave, men fungerer gjennom problemet på egen hånd.

Som agent, som kan være en selvkjørende bil eller et program som spiller sjakk, samhandler med omgivelsene, får en belønningstilstand avhengig av hvordan den presterer, for eksempel å kjøre til destinasjonen trygt eller vinne et spill. Omvendt får agenten en straff for å ha prestert feil, for eksempel å gå av veien eller bli sjekket.

Agent over tid tar beslutninger om å maksimere belønningen og minimere sin straff ved hjelp av dynamisk programmering. Fordelen med denne tilnærmingen til kunstig intelligens er at den lar et AI-program lære uten en programmerer som skriver ut hvordan en agent skal utføre oppgaven.

Hva er forsterkningslæring? - definisjon fra techopedia