Search

Now showing items 1-10 of 10

Real-Time Reinforcement Learning

Ramstedt, Simon (2020-03-25)

Les processus de décision markovien (MDP), le cadre mathématiques sous-jacent à la plupart des algorithmes de l'apprentissage par renforcement (RL) est souvent utilisé d'une manière qui suppose, à tort, que l'état de ...

Optimizing ANN Architectures using Mixed-Integer Programming

ElAraby, Mostafa (2020-12-16)

Over-parameterized networks, where the number of parameters surpass the number of train-ing samples, generalize well on various tasks. However, large networks are computationally expensive in terms of the training and ...

Emerging communication between competitive agents

Noukhovitch, Mikhail (2020-06-04)

Nous utilisons l’apprentissage automatique pour répondre à une question fondamentale: comment les individus peuvent apprendre à communiquer pour partager de l'information et se coordonner même en présence de conflits? Cette ...

A deep learning theory for neural networks grounded in physics

Scellier, Benjamin (2021-07-14)

Au cours de la dernière décennie, l'apprentissage profond est devenu une composante majeure de l'intelligence artificielle, ayant mené à une série d'avancées capitales dans une variété de domaines. L'un des piliers de ...

Self-supervision for data interpretability in image classification and sample efficiency in reinforcement learning

Rajkumar, Nitarshan (2021-10-21)

L'apprentissage auto-surveillé (AAS), c'est-à-dire l'apprentissage de connaissances en exploitant la structure intrinsèque présente dans un ensemble de données non étiquettées, a beaucoup fait progresser l'apprentissage ...

Latent variable language models

Tan, Shawn (2019-03-13)

There has been a renewed interest in generative modeling/unsupervised learning for language for downstream natural language understanding tasks. In this thesis, we explore the augmentation of standard language models ...

Improved training of energy-based models

Kumar, Rithesh (2019-10-30)

L'estimation du maximum de vraisemblance des modèles basés sur l'énergie est un problème difficile à résoudre en raison de l'insolubilité du gradient du logarithmique de la vraisemblance. Dans ce travail, nous proposons ...

Distributed conditional computation

Léonard, Nicholas (2015-04-30)

L'objectif de cette thèse est de présenter différentes applications du programme de recherche de calcul conditionnel distribué. On espère que ces applications, ainsi que la théorie présentée ici, mènera à une solution ...

Leveraging noisy side information for disentangling of factors of variation in a supervised setting

Carrier, Pierre Luc (2015-02-18)

Ce mémoire est composé de trois articles et présente les résultats de travaux de recherche effectués dans le but d'améliorer les techniques actuelles permettant d'utiliser des données associées à certaines tâches dans le ...

Towards computationally efficient neural networks with adaptive and dynamic computations

Kim, Taesup (2021-10-21)

Ces dernières années, l'intelligence artificielle a été considérablement avancée et l'apprentissage en profondeur, où des réseaux de neurones profonds sont utilisés pour tenter d'imiter vaguement le cerveau humain, y a ...