Browsing Faculté des arts et des sciences – Département d'informatique et de recherche opérationnelle - Thèses et mémoires by Advisor "Castro, Pablo Samuel"
Now showing items 1-1 of 1
-
Small batch deep reinforcement learning
(2023-12-20)Dans l'apprentissage par renforcement profond basé sur la valeur avec des mémoires de relecture, le paramètre de taille de lot joue un rôle crucial en déterminant le nombre de transitions échantillonnées pour chaque mise à jour de gradient. Étonnamment, ...