Search

Now showing items 1-1 of 1

Stabilizing Q-Learning for continuous control

Hui, David Yu-Tung (2023-05-29)

L'apprentissage profond par renforcement a produit des décideurs qui jouent aux échecs, au Go, au Shogi, à Atari et à Starcraft avec une capacité surhumaine. Cependant, ces algorithmes ont du mal à naviguer et à contrôler ...