Cours/Séminaire
Notice
Lieu de réalisation
Paris
Langue :
Anglais
Crédits
François Baccelli (Publication), Venkat Anantharam (Intervention)
Détenteur des droits
Inria
Conditions d'utilisation
Droit commun de la propriété intellectuelle
Citer cette ressource :
Venkat Anantharam. Inria. (2023, 12 juin). Reversible Markov decision processes , in DYOGENE/ERC NEMO 2023 : Seminar series. [Vidéo]. Canal-U. https://www.canal-u.tv/147595. (Consultée le 26 avril 2025)

Reversible Markov decision processes

Réalisation : 12 juin 2023 - Mise en ligne : 12 juin 2023
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

A Markov decision process is called reversible if for every stationary Markov control strategy the resulting Markov chain is reversible. In view of their relevance in applications such as Markov Chain Monte Carlo algorithms, such reversible Markov decision process seem to be of interest to study in their own right. We characterize all discrete time reversible Markov decision processes with finite state and action spaces, generalizing earlier work of Cogill and Peng. We discuss how the policy iteration algorithm to find an optimal stationary Markov control strategy is considerably simplified for reversible Markov decision processes. The potential to apply powerful tools from the study of reversible Markov chains, such as the Poisson gas of Markovian loops and the Gaussian free field, will also be discussed.

Intervention

Dans la même collection

Avec les mêmes intervenants et intervenantes

Sur le même thème