Comprendre l'équation de Bellman [Résolu]

Messages postés
734
Date d'inscription
mardi 8 janvier 2019
Statut
Membre
Dernière intervention
19 juin 2019
-
Bonjour tous le monde !
Je suis au collège et n'ai donc pas encore vraiment le niveau en math pour comprendre cette équation. Quelqu'un peut m'aider ?
Merci :)

Pour rappel, voilà l'équation en question :
V(s) = max (R(a, s) + y ∑ P(s, a, s')V(s'))
_______a______________s'

Les ____ représentent des espaces, CCM les supprimes quand je valide (a est en dessous de max et s' de ∑ )
Afficher la suite 

1 réponse

0
Merci
Je ne peut pas te la détailler personnellement, mais tu trouvera des choses sur le net:

- https://www.ceremade.dauphine.fr/~carlier/progdyn.pdf
- https://en.wikipedia.org/wiki/Bellman_equation
- http://www.lpsm.paris/pageperso/pham/Tangente.pdf
- https://joshgreaves.com/reinforcement-learning/understanding-rl-the-bellman-equations/

Cette équation est liée à la programmation dynamique:
- https://fr.wikipedia.org/wiki/Programmation_dynamique
- https://openclassrooms.com/fr/courses/1164481-introduction-a-la-programmation-dynamique

Have fun ^^
Hr2944
Messages postés
734
Date d'inscription
mardi 8 janvier 2019
Statut
Membre
Dernière intervention
19 juin 2019
25 -
Merci :) mais mon principale souci c'est que signifie ceci : R(a, s)
fouz93
Messages postés
2
Date d'inscription
mardi 21 janvier 2014
Statut
Membre
Dernière intervention
31 juillet 2019
> Hr2944
Messages postés
734
Date d'inscription
mardi 8 janvier 2019
Statut
Membre
Dernière intervention
19 juin 2019
-
R : recompense;
a : action;
s : state(etat);
C'est la recompense de l'action (a) lorsque nous sommes dans l'etat (s)
Hr2944
Messages postés
734
Date d'inscription
mardi 8 janvier 2019
Statut
Membre
Dernière intervention
19 juin 2019
25 -
Up
Commenter la réponse de T3ch