Parcourir Faculté des arts et des sciences par sujet "Markov decision process"
Voici les éléments 1-2 de 2
-
Large state spaces and self-supervision in reinforcement learning
(2022-03-16)L'apprentissage par renforcement (RL) est un paradigme d'apprentissage orienté agent qui s'intéresse à l'apprentissage en interagissant avec un environnement incertain. Combiné à des réseaux de neurones profonds comme approximateur de fonction, ... -
Parsimonious reasoning in reinforcement learning for better credit assignment
(2022-03-16)Le contenu de cette thèse explore la question de l’attribution de crédits à long terme dans l’apprentissage par renforcement du point de vue d’un biais inductif de parcimonie. Dans ce contexte, un agent parcimonieux cherche à comprendre son environnement ...