Browsing Titles index "Real-Time Reinforcement Learning"

Now showing items 1-1 of 1

Real-Time Reinforcement Learning

Ramstedt, Simon (2020-03-25)

Les processus de décision markovien (MDP), le cadre mathématiques sous-jacent à la plupart des algorithmes de l'apprentissage par renforcement (RL) est souvent utilisé d'une manière qui suppose, à tort, que l'état de l'environnement d'un agent ne change ...