Applications of complex numbers to deep neural networks

Bilaniuk, Olexa

CONGÉ DES FÊTES 2024 : Veuillez noter qu'il n'y aura pas de suivi des dépôts des thèses, mémoires et travaux étudiants après le 23 décembre 2024. Retour aux délais réguliers dès le 6 janvier 2025. ------------- ❄⛄❄ ------------- HOLIDAY BREAK 2024: Please note that there will be no follow-up on thesis, dissertations and student papers submissions after December 23, 2024. Regular deadlines will resume on January 6, 2025.

Afficher les métadonnées

Permalien

https://hdl.handle.net/1866/22518

Thèse ou mémoire

Bilaniuk_Olexa_2018_memoire.pdf (2.344Mo)

2018-08 (octroi du grade: 2019-06-19)

Auteur·e·s

Bilaniuk, Olexa

Directeur·trice·s de recherche

Bengio, Yoshua

Cycle d'études

Maîtrise

Programme

Informatique

Mots-clés

Résumé·s

Dans la dernière décennie, une heureuse confluence de matériel, de logiciels et de théorie ont permis à l'intelligence artificielle de connaître un renouveau: un "printemps" et qui, contrairement au passé, semblent avoir mené non pas à la déception d'un autre "hiver", mais à un "été" durable, rempli de réelles avances. Une de ces récentes avances est l'entrée en scène de l'apprentissage véritablement ``profond''. Dans maintes applications les architectes de réseaux de neurones ont connu du succès en les approfondissant, et plus personne ne doute de l'utilité de représentations profondes, composées, hiérarchiques, apprises automatiquement à base d'exemples. Mais il existe d'autres avenues, moins explorées, qui pourraient être utiles, comme l'emploi d'alternatives au système numérique le plus commun, les nombres réels: nombres à basse précision, nombres complexe, quaternions. En 2017, moi-même et l'un de mes principaux collaborateurs discutâmes du manque d'intérêt accordé au traitement en nombres complexes et à l'analyse de signaux complexes ou aisément convertis en une série de nombres complexes grâce à la transformée de Fourier (1D, 2D, à court terme ou non). Puisque ce secteur semblait peu exploré, nous nous y sommes lancés et, au terme d'une année passée à relever des défis propres à l'architecture et l'initialisation d'un réseau de neurones n'employant que des nombres complexes, nous avons débouché sur des résultats prometteurs en vision informatique et en traitement de musique. Nous déjouons aussi les pièges d'une initialisation et d'une normalisation naïve de ce type de réseau de neurones avec des procédures adaptées.

In the past decade, a convergence of hardware, software and theory have allowed artificial intelligence to experience a renewal: a "spring" that, unlike previous times, seems to have led not to a burst hype bubble and a new "AI winter", but to a lasting "summer", anchored by tangible advances in the field. One of the key such advances is truly ``deep'' learning. In many applications, the architects of neural networks have had great success by deepening them, and there is now little doubt about the value of deep, composable, hierarchical, automatically-learned-from-examples representations. But there exist other, less-well-explored avenues for research, such as alternatives to the real-valued number system most commonly used: low-precision, complex, quaternions. In 2017, myself and one of my primary collaborators discussed the seeming lack of interest given to purely complex-valued processing of digital signals, either directly available in complex form or convertible to such using e.g. the Fourier Transform (1D, 2D, short-time or not). Since this area seemed under-explored, we threw ourselves into it and, after a year spent dealing with the challenges of neural networks with purely complex-valued internal representations, we obtained good results in computer vision and music spectrum prediction. We also expose the pitfalls of naively initializing and normalizing such complex-valued networks and solve them with custom formulations adapted for the use of complex numbers.

Collections

Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.