Now showing items 1-1 of 1

  • Stabilizing Q-Learning for continuous control 

    Hui, David Yu-Tung (2023-05-29)
    L'apprentissage profond par renforcement a produit des décideurs qui jouent aux échecs, au Go, au Shogi, à Atari et à Starcraft avec une capacité surhumaine. Cependant, ces algorithmes ont du mal à naviguer et à contrôler des environnements physiques, ...