Search

Now showing items 31-40 of 50

Toward causal representation and structure learning

Mansouri Tehrani, Sayed Mohammadamin (2023-11-28)

Dans les annales de l'Intelligence Artificielle (IA), la quête incessante pour émuler la cognition humaine dans les machines a sous-tendu l'évolution technologique, repoussant les limites du potentiel humain et des capacités ...

Stabilizing Q-Learning for continuous control

Hui, David Yu-Tung (2023-05-29)

L'apprentissage profond par renforcement a produit des décideurs qui jouent aux échecs, au Go, au Shogi, à Atari et à Starcraft avec une capacité surhumaine. Cependant, ces algorithmes ont du mal à naviguer et à contrôler ...

Taxonomy of datasets in graph learning : a data-driven approach to improve GNN benchmarking

Cantürk, Semih (2023-02-22)

L'apprentissage profond sur les graphes a atteint des niveaux de succès sans précédent ces dernières années grâce aux réseaux de neurones de graphes (GNN), des architectures de réseaux de neurones spécialisées qui ont sans ...

Investigating intra and inter-subject performance with deep learning for gait on irregular surfaces

Lam, Guillaume (2023-06-19)

La médecine personnalisée promet des soins adaptés à chaque patient. Cependant, l’ap- prentissage automatique appliqué à cette fin nécessite beaucoup d’améliorations. L’évalua- tion des modèles est une étape cruciale qui ...

On impact of mixing times in continual reinforcement learning

Raparthy, Sharath Chandra (2023-05-29)

Le temps de mélange de la chaîne de Markov induite par une politique limite ses performances dans les scénarios réels d'apprentissage continu. Pourtant, l'effet des temps de mélange sur l'apprentissage dans l'apprentissage ...

Model-based hyperparameter optimization

Crouther, Paul (2023-05-29)

The primary goal of this work is to propose a methodology for discovering hyperparameters. Hyperparameters aid systems in convergence when well-tuned and handcrafted. However, to this end, poorly chosen hyperparameters ...

Accelerated algorithms for temporal difference learning methods

Rankawat, Anushree (2023-06-19)

L'idée centrale de cette thèse est de comprendre la notion d'accélération dans les algorithmes d'approximation stochastique. Plus précisément, nous tentons de répondre à la question suivante : Comment l'accélération ...

Imitation from observation using behavioral learning

Djeafea Sonwa, Medric B. (2023-02-22)

L'Imitation par observation (IPO) est un paradigme d'apprentissage qui consiste à entraîner des agents autonomes dans un processus de décision markovien (PDM) en observant les démonstrations d'un expert et sans avoir accès ...

Re-weighted softmax cross-entropy to control forgetting in federated learning

Legate, Gwendolyne (2023-03-22)

Dans l’apprentissage fédéré, un modèle global est appris en agrégeant les mises à jour du modèle calculées à partir d’un ensemble de nœuds clients, un défi clé dans ce domaine est l’hétérogénéité des données entre les ...

Adaptive learning of tensor network structures

Hashemizadehaghda, Seyed Meraj (2023-02-22)

Les réseaux tensoriels offrent un cadre puissant pour représenter efficacement des objets de très haute dimension. Les réseaux tensoriels ont récemment montré leur potentiel pour les applications d’apprentissage automatique ...