Search
Now showing items 1-2 of 2
Parsimonious reasoning in reinforcement learning for better credit assignment
(2022-03-16)
Le contenu de cette thèse explore la question de l’attribution de crédits à long terme dans l’apprentissage par renforcement du point de vue d’un biais inductif de parcimonie. Dans ce contexte, un agent parcimonieux cherche ...
Accelerated algorithms for temporal difference learning methods
(2023-06-19)
L'idée centrale de cette thèse est de comprendre la notion d'accélération dans les algorithmes d'approximation stochastique. Plus précisément, nous tentons de répondre à la question suivante : Comment l'accélération ...