Search
Now showing items 1-1 of 1
Stabilizing Q-Learning for continuous control
(2023-05-29)
L'apprentissage profond par renforcement a produit des décideurs qui jouent aux échecs, au Go, au Shogi, à Atari et à Starcraft avec une capacité surhumaine. Cependant, ces algorithmes ont du mal à naviguer et à contrôler ...