Hjem Audio Hva er delvis observerbar markov beslutningsprosess (pomdp)? - definisjon fra techopedia

Hva er delvis observerbar markov beslutningsprosess (pomdp)? - definisjon fra techopedia

Innholdsfortegnelse:

Anonim

Definisjon - Hva betyr delvis observerbar Markov Decision Process (POMDP)?

En delvis observerbar Markov-beslutningsprosess (POMPD) er en Markov-beslutningsprosess der agenten ikke direkte kan observere de underliggende tilstandene i modellen. Markov beslutningsprosess (MDP) er et matematisk rammeverk for modellering av avgjørelser som viser et system med en rekke stater og gir handlinger til beslutningstakeren basert på disse statene.

POMPD bygger videre på dette konseptet for å vise hvordan et system kan takle utfordringene med begrenset observasjon.

Techopedia forklarer Delvis observerbar Markov Decision Process (POMDP)

I den delvis observerbare Markov-beslutningsprosessen, fordi de underliggende tilstandene ikke er transparente for agenten, er et konsept som kalles en "tro-tilstand" nyttig. Troen på staten gir en måte å takle uklarheten i modellen.

POMPD er nyttig i forsterkningslæring der et system kan gå over MPD- eller POMPD-modellen ved å bruke det som er kjent for å bygge et tydeligere bilde av sannsynlighetsutfall.

Hva er delvis observerbar markov beslutningsprosess (pomdp)? - definisjon fra techopedia