Browsing Titles index "Real-Time Reinforcement Learning"
Now showing items 1-1 of 1
-
Real-Time Reinforcement Learning
(2020-03-25)Les processus de décision markovien (MDP), le cadre mathématiques sous-jacent à la plupart des algorithmes de l'apprentissage par renforcement (RL) est souvent utilisé d'une manière qui suppose, à tort, que l'état de l'environnement d'un agent ne change ...