Apprentissage de représentations musicales à l'aide d'architectures profondes et multiéchelles

Hamel, Philippe

dc.contributor.advisor	Eck, Douglas
dc.contributor.advisor	Bengio, Yoshua
dc.contributor.author	Hamel, Philippe
dc.date.accessioned	2012-10-31T14:10:58Z
dc.date.available	NO_RESTRICTION	en
dc.date.available	2012-10-31T14:10:58Z
dc.date.issued	2012-10-11
dc.date.submitted	2012-05
dc.identifier.uri	http://hdl.handle.net/1866/8678
dc.subject	Apprentissage machine	en
dc.subject	Machine learning	en
dc.subject	Recherche d'information musicale	en
dc.subject	Music information retrieval	en
dc.subject	Analyse d'audio musical	en
dc.subject	Music audio analysis	en
dc.subject	Étiquetage automatique	en
dc.subject	Automatic annotation	en
dc.subject	Apprentissage profond	en
dc.subject	Deep learning	en
dc.subject	Apprentissage multiéchelle	en
dc.subject	Multiscale learning	en
dc.subject.other	Applied Sciences - Artificial Intelligence / Sciences appliqués et technologie - Intelligence artificielle (UMI : 0800)	en
dc.title	Apprentissage de représentations musicales à l'aide d'architectures profondes et multiéchelles	en
dc.type	Thèse ou mémoire / Thesis or Dissertation
etd.degree.discipline	Informatique	en
etd.degree.grantor	Université de Montréal	fr
etd.degree.level	Doctorat / Doctoral	en
etd.degree.name	Ph. D.	en
dcterms.abstract	L'apprentissage machine (AM) est un outil important dans le domaine de la recherche d'information musicale (Music Information Retrieval ou MIR). De nombreuses tâches de MIR peuvent être résolues en entraînant un classifieur sur un ensemble de caractéristiques. Pour les tâches de MIR se basant sur l'audio musical, il est possible d'extraire de l'audio les caractéristiques pertinentes à l'aide de méthodes traitement de signal. Toutefois, certains aspects musicaux sont difficiles à extraire à l'aide de simples heuristiques. Afin d'obtenir des caractéristiques plus riches, il est possible d'utiliser l'AM pour apprendre une représentation musicale à partir de l'audio. Ces caractéristiques apprises permettent souvent d'améliorer la performance sur une tâche de MIR donnée. Afin d'apprendre des représentations musicales intéressantes, il est important de considérer les aspects particuliers à l'audio musical dans la conception des modèles d'apprentissage. Vu la structure temporelle et spectrale de l'audio musical, les représentations profondes et multiéchelles sont particulièrement bien conçues pour représenter la musique. Cette thèse porte sur l'apprentissage de représentations de l'audio musical. Des modèles profonds et multiéchelles améliorant l'état de l'art pour des tâches telles que la reconnaissance d'instrument, la reconnaissance de genre et l'étiquetage automatique y sont présentés.	en
dcterms.abstract	Machine learning (ML) is an important tool in the field of music information retrieval (MIR). Many MIR tasks can be solved by training a classifier over a set of features. For MIR tasks based on music audio, it is possible to extract features from the audio with signal processing techniques. However, some musical aspects are hard to extract with simple heuristics. To obtain richer features, we can use ML to learn a representation from the audio. These learned features can often improve performance for a given MIR task. In order to learn interesting musical representations, it is important to consider the particular aspects of music audio when building learning models. Given the temporal and spectral structure of music audio, deep and multi-scale representations are particularly well suited to represent music. This thesis focuses on learning representations from music audio. Deep and multi-scale models that improve the state-of-the-art for tasks such as instrument recognition, genre recognition and automatic annotation are presented.	en
dcterms.language	fra	en

Fichier·s constituant ce document

Nom:: Hamel_Philippe_2012_these.pdf
Taille:: 1.810Mo
Format:: PDF
Description:: Thèse

Ce document figure dans la ou les collections suivantes

Thèses et mémoires électroniques de l’Université de Montréal [24306]
Faculté des arts et des sciences – Département d'informatique et de recherche opérationnelle - Thèses et mémoires [1178]

Afficher la notice

Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.