Now showing items 1-9 of 9

  • Accelerated algorithms for temporal difference learning methods 

    Rankawat, Anushree (2023-06-19)
    L'idée centrale de cette thèse est de comprendre la notion d'accélération dans les algorithmes d'approximation stochastique. Plus précisément, nous tentons de répondre à la question suivante : Comment l'accélération apparaît-elle naturellement dans les ...
  • Beyond the horizon : improved long-range sequence modeling, from dynamical systems to language 

    Fathi, Mahan (2024-02-21)
    Cette thèse est ancrée dans deux aspirations principales: (i) l'extension des longueurs de séquence pour une fidélité de prédiction supérieure pendant les phases d'entraînement et de test, et (ii) l'amélioration de l'efficacité computationnelle des ...
  • Learning neural ordinary differential equations for optimal control 

    Howe, Nikolaus Harry Reginald (2022-03-16)
    Ce mémoire rassemble des éléments d'optimisation, d'apprentissage profond et de contrôle optimal afin de répondre aux problématiques d'apprentissage et de planification dans le contexte des systèmes dynamiques en temps continu. Deux approches ...
  • Model-based hyperparameter optimization 

    Crouther, Paul (2023-05-29)
    The primary goal of this work is to propose a methodology for discovering hyperparameters. Hyperparameters aid systems in convergence when well-tuned and handcrafted. However, to this end, poorly chosen hyperparameters leave practitioners in limbo, ...
  • On choice models in the context of MDPs 

    Mohammadpour, Sobhan (2023-12-20)
    Cette thèse se penche sur les modèles de choix, des distributions sur des ensembles d'alternatives. Les modèles de choix sur les processus décisionnels de Markov (MDP) peuvent décomposer de très grands espaces alternatifs en procédures étape par étape ...
  • Parsimonious reasoning in reinforcement learning for better credit assignment 

    Ma, Michel (2022-03-16)
    Le contenu de cette thèse explore la question de l’attribution de crédits à long terme dans l’apprentissage par renforcement du point de vue d’un biais inductif de parcimonie. Dans ce contexte, un agent parcimonieux cherche à comprendre son environnement ...
  • Sample efficient reinforcement learning for biological sequence design 

    Nouri, Padideh (2023-11-01)
    L’apprentissage par renforcement profond a mené à de nombreux résultats prometteurs dans l’apprentissage des jeux vidéo à partir de pixels, dans la robotique pour l’apprentissage de compétences généralisables et dans les soins de santé pour l’apprentissage ...
  • Stabilizing Q-Learning for continuous control 

    Hui, David Yu-Tung (2023-05-29)
    L'apprentissage profond par renforcement a produit des décideurs qui jouent aux échecs, au Go, au Shogi, à Atari et à Starcraft avec une capacité surhumaine. Cependant, ces algorithmes ont du mal à naviguer et à contrôler des environnements physiques, ...
  • Steepest descent as Linear Quadratic Regulation 

    Dufort-Labbé, Simon (2022-03-16)
    Concorder un modèle à certaines observations, voilà qui résume assez bien ce que l’apprentissage machine cherche à accomplir. Ce concept est maintenant omniprésent dans nos vies, entre autre grâce aux percées récentes en apprentissage profond. La ...