Parcourir l'index des titres "On impact of mixing times in continual reinforcement learning"

Voici les éléments 1-1 de 1

On impact of mixing times in continual reinforcement learning

Raparthy, Sharath Chandra (2023-05-29)

Le temps de mélange de la chaîne de Markov induite par une politique limite ses performances dans les scénarios réels d'apprentissage continu. Pourtant, l'effet des temps de mélange sur l'apprentissage dans l'apprentissage par renforcement (RL) continu ...