Balancing signals for semi-supervised sequence learning

Xu, Ge Ya

dc.contributor.advisor	Pal, Christopher
dc.contributor.author	Xu, Ge Ya
dc.date.accessioned	2020-07-10T15:08:04Z
dc.date.available	NO_RESTRICTION	fr
dc.date.available	2020-07-10T15:08:04Z
dc.date.issued	2020-03-25
dc.date.submitted	2019-12
dc.identifier.uri	http://hdl.handle.net/1866/23792
dc.subject	Auxiliary Learning	fr
dc.subject	Deep Learning	fr
dc.subject	Sequence Learning	fr
dc.subject	Semi-supervised Learning	fr
dc.subject	Machine Learning	fr
dc.subject	Apprentissage automatique	fr
dc.subject	Apprentissage semi-supervisé	fr
dc.subject	Formation auxiliaire	fr
dc.subject.other	Communications and the Arts - Information Science / Communications et les arts - Sciences de l’information (UMI : 0723)	fr
dc.title	Balancing signals for semi-supervised sequence learning	fr
dc.type	Thèse ou mémoire / Thesis or Dissertation
etd.degree.discipline	Informatique	fr
etd.degree.grantor	Université de Montréal	fr
etd.degree.level	Maîtrise / Master's	fr
etd.degree.name	M. Sc.	fr
dcterms.abstract	Recurrent Neural Networks(RNNs) are powerful models that have obtained outstanding achievements in many sequence learning tasks. Despite their accomplishments, RNN models still suffer with long sequences during training. It is because error propagate backwards from output to input layers carrying gradient signals, and with long input sequence, issues like vanishing and exploding gradients can arise. This thesis reviews many current studies and existing architectures designed to circumvent the long-term dependency problems in backpropagation through time (BPTT). Mainly, we focus on the method proposed by Trinh et al. (2018) which uses semi- supervised learning method to alleviate the long-term dependency problems in BPTT. Despite the good results Trinh et al. (2018)’s model achieved, we suggest that the model can be further improved with a more systematic way of balancing auxiliary signals. In this thesis, we present our paper – RNNs with Private and Shared Representations for Semi-Supervised Learning – which is currently under review for AAAI-2019. We propose a semi-supervised RNN architecture with explicitly designed private and shared representations that regulates the gradient flow from auxiliary task to main task.	fr
dcterms.abstract	Les réseaux neuronaux récurrents (RNN) sont des modèles puissants qui ont obtenu des réalisations exceptionnelles dans de nombreuses tâches d’apprentissage séquentiel. Malgré leurs réalisations, les modèles RNN sou˙rent encore de longues séquences pendant l’entraî-nement. C’est parce que l’erreur se propage en arrière de la sortie vers les couches d’entrée transportant des signaux de gradient, et avec une longue séquence d’entrée, des problèmes comme la disparition et l’explosion des gradients peuvent survenir. Cette thèse passe en revue de nombreuses études actuelles et architectures existantes conçues pour contour-ner les problèmes de dépendance à long terme de la rétropropagation dans le temps (BPTT). Nous nous concentrons principalement sur la méthode proposée par cite Trinh2018 qui utilise une méthode d’apprentissage semi-supervisée pour atténuer les problèmes de dépendance à long terme dans BPTT. Malgré les bons résultats obtenus avec le modèle de cite Trinh2018, nous suggérons que le modèle peut être encore amélioré avec une manière plus systématique d’équilibrer les signaux auxiliaires. Dans cette thèse, nous présentons notre article - emph RNNs with Private and Shared Representations for Semi-Supervised Learning - qui est actuellement en cours de révision pour AAAI-2019. Nous propo-sons une architecture RNN semi-supervisée avec des représentations privées et partagées explicitement conçues qui régule le flux de gradient de la tâche auxiliaire à la tâche principale.	fr
dcterms.language	eng	fr
dcterms.relation	http://yann.lecun.com/exdb/mnist/	fr
dcterms.relation	https://www.cs.toronto.edu/~kriz/cifar.html	fr
dcterms.relation	https://github.com/zalandoresearch/fashion-mnist	fr
dcterms.relation	https://www.kaggle.com/lakshmi25npathi/imdb-dataset-of-50k-movie-reviews	fr
dcterms.relation	https://wiki.dbpedia.org/data-set-37	fr

Files in this item

Name:: Xu_Ge_Ya_2020_memoire.pdf
Size:: 823.6Kb
Format:: PDF
Description:: Mémoire

This item appears in the following Collection(s)

Thèses et mémoires électroniques de l’Université de Montréal [24306]
Faculté des arts et des sciences – Département d'informatique et de recherche opérationnelle - Thèses et mémoires [1178]

Show item record

This document disseminated on Papyrus is the exclusive property of the copyright holders and is protected by the Copyright Act (R.S.C. 1985, c. C-42). It may be used for fair dealing and non-commercial purposes, for private study or research, criticism and review as provided by law. For any other use, written authorization from the copyright holders is required.