Hva er forsterkningslæring? - definisjon fra techopedia

2025

Innholdsfortegnelse:

Definisjon - Hva betyr forsterkningslæring?
Techopedia forklarer Reinforcement Learning

Definisjon - Hva betyr forsterkningslæring?

Forsterkningslæring, i forbindelse med kunstig intelligens, er en type dynamisk programmering som trener algoritmer ved hjelp av et system med belønning og straff.

En forsterkende læringsalgoritme, eller agent, lærer ved å samhandle med omgivelsene. Agenten mottar belønninger ved å utføre riktig og straffer for å ha prestert feil. Agenten lærer uten inngripen fra et menneske ved å maksimere belønningen og minimere straffen.

Techopedia forklarer Reinforcement Learning

Forsterkningslæring er en tilnærming til maskinlæring som er inspirert av behaviorist-psykologi. Det ligner på hvordan et barn lærer å utføre en ny oppgave. Forsterkningslæring står i kontrast til andre tilnærminger til maskinlæring ved at algoritmen ikke eksplisitt blir fortalt hvordan du skal utføre en oppgave, men fungerer gjennom problemet på egen hånd.

Som agent, som kan være en selvkjørende bil eller et program som spiller sjakk, samhandler med omgivelsene, får en belønningstilstand avhengig av hvordan den presterer, for eksempel å kjøre til destinasjonen trygt eller vinne et spill. Omvendt får agenten en straff for å ha prestert feil, for eksempel å gå av veien eller bli sjekket.

Agent over tid tar beslutninger om å maksimere belønningen og minimere sin straff ved hjelp av dynamisk programmering. Fordelen med denne tilnærmingen til kunstig intelligens er at den lar et AI-program lære uten en programmerer som skriver ut hvordan en agent skal utføre oppgaven.

Hva er forsterkningslæring? - definisjon fra techopedia

Innholdsfortegnelse:

Definisjon - Hva betyr forsterkningslæring?

Techopedia forklarer Reinforcement Learning

Geolocation: hva det er, hva det har å tilby

Forsterkningslæring kan gi en fin dynamisk dreining til markedsføring

Forsterkningslæring kontra dyp forsterkningslæring: hva er forskjellen?

Redaktørens valg

Hva er en portal på internett? - definisjon fra techopedia

Hva er on-demand computing (odc)? - definisjon fra techopedia

Hva er et strømbrudd? - definisjon fra techopedia

Hva er effektutjevning (pl)? - definisjon fra techopedia

Redaktørens valg

Hva er en nettverksbruksmonitor? - definisjon fra techopedia

Hva er hardware asset management (skinke)? - definisjon fra techopedia

Hva er nettverksbehandling? - definisjon fra techopedia

Hva er nettverksdiagramvare? - definisjon fra techopedia

Redaktørens valg

Hva er management performance (mpm)? - definisjon fra techopedia

Hva er en metadirektory? - definisjon fra techopedia

Hva er marketing content management (mcm)? - definisjon fra techopedia

Hva er internett for overveldende ting (ioot)? - definisjon fra techopedia

Redaktørens valg

Hva er et virtuelt lokalnettverk (vlan)? - definisjon fra techopedia

Hva er et skyoperativsystem (sky os)? - definisjon fra techopedia

Hva er klokkehastighet? - definisjon fra techopedia

Hva er et autonomt systemnummer (asn)? - definisjon fra techopedia

Redaktørens valg

Hva er delt kontroll? - definisjon fra techopedia

Hva er en smart tag? - definisjon fra techopedia

Hva er Microsofts volumlisensiering? - definisjon fra techopedia

Hva er en verditype? - definisjon fra techopedia

Populære kategorier