Search
Now showing items 1-10 of 10
Real-Time Reinforcement Learning
(2020-03-25)
Les processus de décision markovien (MDP), le cadre mathématiques sous-jacent à la plupart des algorithmes de l'apprentissage par renforcement (RL) est souvent utilisé d'une manière qui suppose, à tort, que l'état de ...
Optimizing ANN Architectures using Mixed-Integer Programming
(2020-12-16)
Over-parameterized networks, where the number of parameters surpass the number of train-ing samples, generalize well on various tasks. However, large networks are computationally expensive in terms of the training and ...
Emerging communication between competitive agents
(2020-06-04)
Nous utilisons l’apprentissage automatique pour répondre à une question fondamentale: comment les individus peuvent apprendre à communiquer pour partager de l'information et se coordonner même en présence de conflits? Cette ...
A deep learning theory for neural networks grounded in physics
(2021-07-14)
Au cours de la dernière décennie, l'apprentissage profond est devenu une composante majeure de l'intelligence artificielle, ayant mené à une série d'avancées capitales dans une variété de domaines. L'un des piliers de ...
Self-supervision for data interpretability in image classification and sample efficiency in reinforcement learning
(2021-10-21)
L'apprentissage auto-surveillé (AAS), c'est-à-dire l'apprentissage de connaissances en exploitant la structure intrinsèque présente dans un ensemble de données non étiquettées, a beaucoup fait progresser l'apprentissage ...
Latent variable language models
(2019-03-13)
There has been a renewed interest in generative modeling/unsupervised learning
for language for downstream natural language understanding tasks. In this thesis,
we explore the augmentation of standard language models ...
Improved training of energy-based models
(2019-10-30)
L'estimation du maximum de vraisemblance des modèles basés sur l'énergie est un problème difficile à résoudre en raison de l'insolubilité du gradient du logarithmique de la vraisemblance. Dans ce travail, nous proposons ...
Distributed conditional computation
(2015-04-30)
L'objectif de cette thèse est de présenter différentes applications du programme de recherche de calcul conditionnel distribué.
On espère que ces applications, ainsi que la théorie présentée ici, mènera à une solution ...
Leveraging noisy side information for disentangling of factors of variation in a supervised setting
(2015-02-18)
Ce mémoire est composé de trois articles et présente les résultats de travaux de recherche effectués dans le but d'améliorer les techniques actuelles permettant d'utiliser des données associées à certaines tâches dans le ...
Towards computationally efficient neural networks with adaptive and dynamic computations
(2021-10-21)
Ces dernières années, l'intelligence artificielle a été considérablement avancée et l'apprentissage en profondeur, où des réseaux de neurones profonds sont utilisés pour tenter d'imiter vaguement le cerveau humain, y a ...