Now showing items 1-1 of 1

  • On impact of mixing times in continual reinforcement learning 

    Raparthy, Sharath Chandra (2023-05-29)
    Le temps de mélange de la chaîne de Markov induite par une politique limite ses performances dans les scénarios réels d'apprentissage continu. Pourtant, l'effet des temps de mélange sur l'apprentissage dans l'apprentissage par renforcement (RL) continu ...