Avancées récentes dans l'observation et l'application des techniques d'apprentissage automatique aux études des galaxies et des amas de galaxies
Thèse ou mémoire
2024-07 (octroi du grade: 2024-09-11)
Directeur·trice·s de recherche
Cycle d'études
DoctoratProgramme
PhysiqueRésumé·s
Les galaxies, qui sont des ensembles de milliards d’étoiles, de gaz, de poussière et de matière
sombre — un mystère persistant — se répandent à travers l’univers. Il est reconnu que
presque toutes les galaxies hébergent un trou noir supermassif capable d’augmenter ou de
diminuer le taux de formation stellaire via un mécanisme appelé rétroaction. Les conglomérats massifs de galaxies gravitationnellement liés, nommés amas de galaxies, présentent le
même phénomène astronomique, mais à une échelle plus grande. Ces phénomènes laissent
des traces dans l’environnement qui sont observables grâce aux instruments contemporains.
Cette thèse se concentre sur deux axes principaux : l’application des algorithmes
d’apprentissage automatique pour améliorer l’analyse optique des galaxies et des amas de
galaxies, ainsi que l’utilisation d’un algorithme spécifique en apprentissage automatique, la
machine d’inférence récurrente (MIR), capable de déconvoluer les spectres en rayons X de
sources astrophysiques.
Dans la première moitié de cette thèse, nous discutons du développement de LUCI, un
logiciel conçu pour ajuster les cubes de données de SITELLE à l’aide de l’apprentissage automatique. Ce logiciel vise à accélérer l’algorithme d’ajustement et à obtenir les meilleurs
résultats possibles. LUCI a été développé dans le but de fournir un algorithme d’ajustement
polyvalent, personnalisable, facile à utiliser et assisté par l’apprentissage automatique. Les
deux premiers articles de cette thèse décrivent en détail LUCI et les algorithmes qui le
sous-tendent. Après cette présentation, plusieurs projets scientifiques auxquels j’ai contribué sont mis en avant, illustrant l’utilisation de LUCI. Grâce aux innovations apportées par
LUCI, nous avons pu étudier plus en détail le gaz ionisé diffus dans des galaxies proches
telles que NGC 4449, analyser le gaz ionisé dans une galaxie en chute vers l’amas de Persée,
et cartographier en détail le gaz ionisé dans un amas de galaxies à grand décalage vers le
rouge (voir section 2.3). Les deux articles suivants, dans les sections 2.4, 2.5, explorent les méthodes d’apprentissage automatique pour effectuer des tâches qui auraient traditionnellement été réalisées par des algorithmes standard : calculer les rapports des lignes d’émission
des spectres, démêler les systèmes en fusion et catégoriser les régions d’émission.
Dans l’avant-dernier article du chapitre 2, section 2.7, nous développons une nouvelle
technique basée sur les algorithmes d’apprentissage automatique qui segmente un cube hyperspectral en régions de source et régions de l’arrière-plan, construit un modèle local de la
région à l’arrière-plan, et interpole ce modèle sur les pixels de la source.
Dans le troisième chapitre, nous nous concentrons sur les techniques de déconvolution
des spectres en rayons X, un objectif qui, jusqu’à présent, reste insaisissable. Cela nous
permet, pour la première fois, d’observer le spectre intrinsèque du gaz chaud dans les amas
de galaxies. Lorsqu’un spectre en rayons X est observé avec un observatoire en rayons X,
le spectre intrinsèque n’est pas directement capturé mais plutôt, il est convolué avec la
réponse instrumentale. Dans le cas des observatoires contemporains, cet effet est dramatique car la réponse instrumentale étale les lignes d’émission en une caractéristique simple et
elle varie considérablement en fonction du temps et de la position. Les méthodes standard
pour extraire les paramètres physiques du spectre utilisent des techniques de pré-ajustement
qui augmentent les coûts computationnels et ajoutent des complexités d’ajustement. Par
conséquent, une méthodologie de déconvolution des spectres observés peut mener à une
modélisation plus précise. C’est avec cela en tête que nous explorons les méthodes de déconvolution des spectres en rayons X, nous donnant ainsi accès aux spectres intrinsèques.
Le premier article de ce chapitre, section 3.1, démontre que les techniques traditionnelles de
déconvolution ne fonctionnent pas suffisamment pour les spectres complexes, même si elles
fonctionnent pour les spectres simples comme les lois de puissance. Dans l’article suivant,
nous utilisons un nouvel algorithme d’apprentissage automatique, la MIR, pour effectuer la
déconvolution. Dans ce papier, nous montrons le potentiel de cette nouvelle méthode sur
des données synthétiques et réelles. Notre MIR entraînée reconstruit le spectre intrinsèque
et les réalisations du modèle antérieur avec un niveau de bruit d’un écart-type, démontrant
que la MIR est capable, au moins pour les spectres synthétiques, de récupérer les spectres
intrinsèques. Dans le dernier article de cette thèse, nous explorons également l’efficacité et les limitations de la MIR dans la déconvolution des spectres en rayons X. La MIR est entraînée
sur une base de données synthétique couvrant une gamme plus large de paramètres. Même
pour les modèles complexes, la MIR est capable de déconvoluer les spectres synthétiques à
un niveau de bruit d’un écart-type. Cependant, lorsqu’elle est appliquée aux données réelles,
les reconstructions ne sont pas en accord avec les observations réelles. Cela indique soit que
les données synthétiques ne représentent pas fidèlement les observations réelles, soit qu’il y a
un problème avec la MIR. Nous concluons cet article en soulignant l’intérêt d’appliquer des
modèles de diffusion pour pallier les limitations de la MIR. Galaxies, combinations of billions of stars, gas, dust, and the ever-mysterious dark matter, permeate the universe. It is understood that nearly all galaxies host a supermassive
black hole capable of either enhancing or reducing stellar formation through a mechanism
known as active galactic nuclei feedback. Massive conglomerations of gravitationally bound
galaxies, known as galaxy clusters, demonstrate the same astrophysical phenomena but on
a much larger scale. These phenomena leave traces on their surrounding medium that can
be observed through modern instrumentation.
This thesis is aligned along two main research axes: the application of machine learning
algorithms to enhance the optical analysis of galaxies and galaxy clusters and the application
of a particular machine learning algorithm, the recurrent inference machine, to deconvolve
X-ray spectra of astrophysical sources.
In the first half of the thesis, we discuss the development of LUCI – a software package
created to fit SITELLE datacubes using machine learning to speed up the fitting algorithms
and increase their performance. LUCI was borne out of a desire to have a general-purpose
line fitting algorithm that is highly customizable, easy to use, and enhanced by machine
learning algorithms for SITELLE. The first two articles presented in this thesis describe
LUCI and the algorithms that drive the package. After presenting the software, we showcase
several scientific projects that LUCI has been used in which I contributed. Owing to the
innovations in LUCI, we were able to expand our study of diffuse ionized gas in nearby
galaxies such as NGC 4449, study the ionized gas in an infalling galaxy in the Perseus
cluster, and make detailed maps of a high-redshift galaxy cluster’s ionized gas (see 2.3).
The following three papers, sections 2.4, 2.5, and 2.6, explore machine learning methods
to accomplish tasks normally reserved for standard algorithms: calculating line ratios from spectra and disentangling multi emission components in merging systems, and categorizing
emission line regions.
In the second to last paper of chapter 2, section 2.7, we develop a novel technique based
off machine learning algorithms to segment an hyperspectral data cube into source and
background regions, build a local model of the background region, and interpolate this model
over source pixels.
In the final paper of this chapter, we use LUCI to analyze multi-filter SITELLE observations of NGC 1275. This analysis reveals homogeneity in the ionization mechanism in the
extended filaments. Moreover, they solidify previous findings that the emission nebula is not
undergoing star formation except for two small and distinct regions.
In chapter 3, we focus on techniques for deconvolving X-ray spectra, a goal that has,
until now, remained elusive. By deconvolving X-ray spectra, we will be able to, for the first
time, observe the intrinsic X-ray spectrum of the hot gas in galaxy clusters. When an X-ray
spectrum is observed with an X-ray observatory, the intrinsic source spectrum is not itself
captured but rather the intrinsic spectrum convolved with the instrumental response. In
the case of contemporary X-ray observatories, this effect is dramatic since the instrumental
response smears emission lines into a single feature and changes considerably as a function
of time and the location of the detector.
Therefore, having a methodology to deconvolve observed spectra can lead to more accurate modeling of the underlying physical phenomena. It is with this in mind that we explore
methods to deconvolve the X-ray spectra and thus have access to the intrinsic spectrum
of the astrophyiscal source. The first article presented in this chapter, section 3.1, demonstrates that traditional inverse techniques do not reliably deconvolve complex X-ray spectra
from the instrumental response even though they are sufficient for simple spectra such as
a powerlaw. In the following article, we employ a new machine learning algorithm, the recurrent inference machine (RIM), to tackle the problem of X-ray spectral deconvolution. In
this paper, we show the potential of this new method as applied to synthetic and real data.
Our trained RIM reconstructs the intrinsic matrix and forward model realizations below the
1-σ noise-level proving that the RIM is capable, at least for synthetic data, to recover the intrinsic spectra. In the final article of this thesis, we further explore the RIM’s ability and
limitations in X-ray spectral deconvolution. The RIM is trained on a larger set of synthetic
spectra covering a wider parameter range. The RIM is able to deconvolve the sythetic Xray spectrum at the 1-σ noise level even for complicated physical models. However, when
applied to real observations, the RIM reconstructions do not match theoretical predictions.
We conclude this paper by motivating the application of state-of-the-art diffusion models to
address the limitations of the RIM.
Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.