Browsing Faculté des arts et des sciences – Département d'informatique et de recherche opérationnelle - Thèses et mémoires by Advisor "Bacon, Pierre-Luc"

Now showing items 1-9 of 9

Accelerated algorithms for temporal difference learning methods

Rankawat, Anushree (2023-06-19)

L'idée centrale de cette thèse est de comprendre la notion d'accélération dans les algorithmes d'approximation stochastique. Plus précisément, nous tentons de répondre à la question suivante : Comment l'accélération apparaît-elle naturellement dans les ...
Beyond the horizon : improved long-range sequence modeling, from dynamical systems to language

Fathi, Mahan (2024-02-21)

Cette thèse est ancrée dans deux aspirations principales: (i) l'extension des longueurs de séquence pour une fidélité de prédiction supérieure pendant les phases d'entraînement et de test, et (ii) l'amélioration de l'efficacité computationnelle des ...
Learning neural ordinary differential equations for optimal control

Howe, Nikolaus Harry Reginald (2022-03-16)

Ce mémoire rassemble des éléments d'optimisation, d'apprentissage profond et de contrôle optimal afin de répondre aux problématiques d'apprentissage et de planification dans le contexte des systèmes dynamiques en temps continu. Deux approches ...
Model-based hyperparameter optimization

Crouther, Paul (2023-05-29)

The primary goal of this work is to propose a methodology for discovering hyperparameters. Hyperparameters aid systems in convergence when well-tuned and handcrafted. However, to this end, poorly chosen hyperparameters leave practitioners in limbo, ...
On choice models in the context of MDPs

Mohammadpour, Sobhan (2023-12-20)

Cette thèse se penche sur les modèles de choix, des distributions sur des ensembles d'alternatives. Les modèles de choix sur les processus décisionnels de Markov (MDP) peuvent décomposer de très grands espaces alternatifs en procédures étape par étape ...
Parsimonious reasoning in reinforcement learning for better credit assignment

Ma, Michel (2022-03-16)

Le contenu de cette thèse explore la question de l’attribution de crédits à long terme dans l’apprentissage par renforcement du point de vue d’un biais inductif de parcimonie. Dans ce contexte, un agent parcimonieux cherche à comprendre son environnement ...
Sample efficient reinforcement learning for biological sequence design

Nouri, Padideh (2023-11-01)

L’apprentissage par renforcement profond a mené à de nombreux résultats prometteurs dans l’apprentissage des jeux vidéo à partir de pixels, dans la robotique pour l’apprentissage de compétences généralisables et dans les soins de santé pour l’apprentissage ...
Stabilizing Q-Learning for continuous control

Hui, David Yu-Tung (2023-05-29)

L'apprentissage profond par renforcement a produit des décideurs qui jouent aux échecs, au Go, au Shogi, à Atari et à Starcraft avec une capacité surhumaine. Cependant, ces algorithmes ont du mal à naviguer et à contrôler des environnements physiques, ...
Steepest descent as Linear Quadratic Regulation

Dufort-Labbé, Simon (2022-03-16)

Concorder un modèle à certaines observations, voilà qui résume assez bien ce que l’apprentissage machine cherche à accomplir. Ce concept est maintenant omniprésent dans nos vies, entre autre grâce aux percées récentes en apprentissage profond. La ...

Browsing Faculté des arts et des sciences – Département d'informatique et de recherche opérationnelle - Thèses et mémoires by Advisor "Bacon, Pierre-Luc"

Accelerated algorithms for temporal difference learning methods ﻿

Beyond the horizon : improved long-range sequence modeling, from dynamical systems to language ﻿

Learning neural ordinary differential equations for optimal control ﻿

Model-based hyperparameter optimization ﻿

On choice models in the context of MDPs ﻿

Parsimonious reasoning in reinforcement learning for better credit assignment ﻿

Sample efficient reinforcement learning for biological sequence design ﻿

Stabilizing Q-Learning for continuous control ﻿

Steepest descent as Linear Quadratic Regulation ﻿

Accelerated algorithms for temporal difference learning methods

Beyond the horizon : improved long-range sequence modeling, from dynamical systems to language

Learning neural ordinary differential equations for optimal control

Model-based hyperparameter optimization

On choice models in the context of MDPs

Parsimonious reasoning in reinforcement learning for better credit assignment

Sample efficient reinforcement learning for biological sequence design

Stabilizing Q-Learning for continuous control

Steepest descent as Linear Quadratic Regulation