Prédiction et génération de données structurées à l'aide de réseaux de neurones et de décisions discrètes

Dutil, Francis

dc.contributor.advisor	Bengio, Yoshua
dc.contributor.author	Dutil, Francis
dc.date.accessioned	2019-06-07T16:31:05Z
dc.date.available	NO_RESTRICTION	fr
dc.date.available	2019-06-07T16:31:05Z
dc.date.issued	2019-03-13
dc.date.submitted	2018-08
dc.identifier.uri	http://hdl.handle.net/1866/22124
dc.subject	Intelligence artificielle	fr
dc.subject	Apprentissage automatique	fr
dc.subject	Apprentissage profond	fr
dc.subject	Réseaux de neurones récurrents	fr
dc.subject	Réseaux de neurones à convolution	fr
dc.subject	Réseaux antagonistes génératifs	fr
dc.subject	Décisions discrètes	fr
dc.subject	Artificial intelligence	fr
dc.subject	Machine learning	fr
dc.subject	Deep learning	fr
dc.subject	Recurrent neural networks	fr
dc.subject	Convolutional neural networks	fr
dc.subject	Generative Adversarial networks	fr
dc.subject	Discrete decisions	fr
dc.subject.other	Applied Sciences - Artificial Intelligence / Sciences appliqués et technologie - Intelligence artificielle (UMI : 0800)	fr
dc.title	Prédiction et génération de données structurées à l'aide de réseaux de neurones et de décisions discrètes	fr
dc.type	Thèse ou mémoire / Thesis or Dissertation
etd.degree.discipline	Informatique	fr
etd.degree.grantor	Université de Montréal	fr
etd.degree.level	Maîtrise / Master's	fr
etd.degree.name	M. Sc.	fr
dcterms.abstract	L’apprentissage profond, une sous-discipline de l’apprentissage automatique, est de plus en plus utilisé dans une multitude de domaines, dont le traitement du langage naturel. Toutefois, plusieurs problèmes restent ouverts, notamment la prédiction de longues séquences et la génération de langues naturelles. Dans le mémoire qui suit, nous présentons deux modèles travaillant sur ces problèmes. Dans le chapitre 1, nous incorporons un système de planification à l’intérieur des modèles séquence-à-séquence. Pour ce faire, le modèle détermine à l’avance l’alignement entre la séquence d’entrée et de sortie. Nous montrons que ce mécanisme améliore l’alignement à l’intérieur des modèles, converge plus rapidement et nécessite moins de paramètres. Nous montrons également des gains de performance en traduction automatique, en génération de questions ainsi que la découverte de circuits eulériens dans des graphes. Dans le chapitre 2, nous appliquons des réseaux antagonistes génératifs aux langues naturelles, une tâche compliquée par la nature discrète du domaine. Le modèle est entraîné de manière purement non supervisée et n’utilise aucune estimation de gradients. Nous montrons des résultats en modélisation de la langue, en génération de grammaires non contextuelles et génération conditionnelle de phrases.	fr
dcterms.abstract	Deep learning, a subdiscipline of machine learning, is used throughout multiple domains, including natural language processing. However, in the field multiple problems remain open, notably the prediction of long sequences and the generation of natural languages. In the following thesis, we present two models that work toward solving both of these problems. In chapter 1, we add a planning mechanism to sequence-to-sequence models. The mech- anism consists of establishing ahead of time the alignment between the input and output sequence. We show that this improves the alignment, help the model to converge faster, and necessitate fewer parameters. We also show performance gain in neural machine translation, questions generation, and the algorithmic task of finding Eulerian circuits in graphs. In chapter 2, we tackle the language generation task using generative adversarial net- works. A non-trivial problem considering the discrete nature of the output space. The model is trained using only an adversarial loss and without any gradient estimation. We show results on language modeling, context-free grammar generation, and conditional sen- tence generation.	fr
dcterms.language	fra	fr

Fichier·s constituant ce document

Nom:: Dutil_Francis_2018_memoire.pdf
Taille:: 1.744Mo
Format:: PDF
Description:: Mémoire

Ce document figure dans la ou les collections suivantes

Thèses et mémoires électroniques de l’Université de Montréal [24479]
Faculté des arts et des sciences – Département d'informatique et de recherche opérationnelle - Thèses et mémoires [1189]

Afficher la notice

Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.