Parcourir Faculté des arts et des sciences par sujet "Markov decision process"

Voici les éléments 1-2 de 2

Large state spaces and self-supervision in reinforcement learning

Touati, Ahmed (2022-03-16)

L'apprentissage par renforcement (RL) est un paradigme d'apprentissage orienté agent qui s'intéresse à l'apprentissage en interagissant avec un environnement incertain. Combiné à des réseaux de neurones profonds comme approximateur de fonction, ...
Parsimonious reasoning in reinforcement learning for better credit assignment

Ma, Michel (2022-03-16)

Le contenu de cette thèse explore la question de l’attribution de crédits à long terme dans l’apprentissage par renforcement du point de vue d’un biais inductif de parcimonie. Dans ce contexte, un agent parcimonieux cherche à comprendre son environnement ...