Algorithmes d’apprentissage profonds supervisés et non-supervisés: applications et résultats théoriques
Thèse ou mémoire
2013-09 (octroi du grade: 2014-03-03)
Auteur·e·s
Directeur·trice·s de recherche
Cycle d'études
MaîtriseProgramme
InformatiqueMots-clés
- Apprentissage machine
- Matchmaking
- Réseaux de neurones
- Autoencodeurs
- Recommendation de contenu
- Architectures profondes
- Machine learning
- Neural networks
- Autoencoders
- Content recommendation
- Deep architectures
- Applied Sciences - Artificial Intelligence / Sciences appliqués et technologie - Intelligence artificielle (UMI : 0800)
Résumé·s
La liste des domaines touchés par l’apprentissage machine s’allonge rapidement. Au fur et à mesure que la quantité de données disponibles augmente, le développement d’algorithmes d’apprentissage de plus en plus puissants est crucial. Ce mémoire est constitué de trois parties: d’abord un survol des concepts de bases de l’apprentissage automatique et les détails nécessaires pour l’entraînement de réseaux de neurones, modèles qui se livrent bien à des architectures profondes. Ensuite, le premier article présente une application de l’apprentissage machine aux jeux vidéos, puis une méthode de mesure performance pour ceux-ci en tant que politique de décision. Finalement, le deuxième article présente des résultats théoriques concernant l’entraînement d’architectures profondes nonsupervisées.
Les jeux vidéos sont un domaine particulièrement fertile pour l’apprentissage automatique: il estf facile d’accumuler d’importantes quantités de données, et les applications ne manquent pas. La formation d’équipes selon un critère donné est une tˆache commune pour les jeux en lignes. Le premier article compare différents algorithmes d’apprentissage à des réseaux de neurones profonds appliqués à la prédiction de la balance d’un match. Ensuite nous présentons une méthode par simulation pour évaluer les modèles ainsi obtenus utilisés dans le cadre d’une politique de décision en ligne.
Dans un deuxième temps nous présentons une nouvelleméthode pour entraîner des modèles génératifs. Des résultats théoriques nous indiquent qu’il est possible d’entraîner par rétropropagation des modèles non-supervisés pouvant générer des échantillons qui suivent la distribution des données. Ceci est un résultat pertinent dans le cadre de la récente littérature scientifique investiguant les propriétés des autoencodeurs comme modèles génératifs. Ces résultats sont supportés avec des expériences qualitatives préliminaires ainsi que quelques résultats quantitatifs. The list of areas affected by machine learning is growing rapidly. As the amount of available training
data increases, the development of more powerful learning algorithms is crucial. This thesis consists
of three parts: first an overview of the basic concepts of machine learning and the details necessary
for training neural networks, models that lend themselves well to deep architectures. The second
part presents an application of machine learning to online video games, and a performance measurement
method when using these models as decision policies. Finally, the third section presents
theoretical results for unsupervised training of deep architectures.
Video games are a particularly fertile area for machine learning: it is easy to accumulate large
amounts of data, and many tasks are possible. Assembling teams of equal skill is a common machine
learning application for online games. The first paper compares different learning algorithms against
deep neural networks applied to the prediction of match balance in online games. We then present
a simulation based method to evaluate the resulting models used as decision policies for online
matchmaking.
Following this we present a new method to train generative models. Theoretical results indicate that
it is possible to train by backpropagation unsupervised models that can generate samples following
the data’s true distribution. This is a relevant result in the context of the recent literature investigating
the properties of autoencoders as generative models. These results are supported with preliminary
quantitative results and some qualitative experiments.
Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.