Alzheimer prediction from connected speech extracts : assessment of generalisation to new data

Chafouleas, Geneviève

dc.contributor.advisor	Langlais, Philippe
dc.contributor.advisor	Brambati, Simona Maria
dc.contributor.author	Chafouleas, Geneviève
dc.date.accessioned	2022-01-24T20:51:12Z
dc.date.available	NO_RESTRICTION	fr
dc.date.available	2022-01-24T20:51:12Z
dc.date.issued	2021-10-21
dc.date.submitted	2021-09
dc.identifier.uri	http://hdl.handle.net/1866/26066
dc.subject	Natural language processing	fr
dc.subject	Transfer learning	fr
dc.subject	Machine learning	fr
dc.subject	Alzheimer's disease	fr
dc.subject	Traitement automatique des langues	fr
dc.subject	Apprentissage machine	fr
dc.subject	Maladie d'Alzheimer	fr
dc.subject	Apprentissage par transfert	fr
dc.subject.other	Applied Sciences - Artificial Intelligence / Sciences appliqués et technologie - Intelligence artificielle (UMI : 0800)	fr
dc.title	Alzheimer prediction from connected speech extracts : assessment of generalisation to new data	fr
dc.type	Thèse ou mémoire / Thesis or Dissertation
etd.degree.discipline	Informatique	fr
etd.degree.grantor	Université de Montréal	fr
etd.degree.level	Maîtrise / Master's	fr
etd.degree.name	M. Sc.	fr
dcterms.abstract	Plusieurs avancées utilisant le discours obtenu de la tâche de description d’image ont été réalisées dans la détection de la maladie d’Alzheimer (AD). L’utilisation de caractéristiques linguistiques et acoustiques sélectionnées manuellement ainsi que l’utilisation de méthodologies d’apprentissage profond ont montré des résultats très prometteurs dans la classification des patients avec AD. Dans ce mémoire, nous comparons les deux méthodologies sur la scène Cookie Theft du Boston Aphasia Examination en entrainant des modèles avec des caractéristiques sélectionnées à partir des extraits textuels et audio ainsi que sur un modèle d’apprentissage profond BERT. Nos modèles sont entrainés sur l’ensemble de données ADReSS challenge plus récent et évaluées sur l’ensemble de données CCNA et vice versa pour mesurer la généralisation des modèles sur des exemples jamais vus dans des ensembles de données différents. Une évaluation détaillée de l’interprétabilité des modèles est effectuée pour déterminer si les modèles ont bien appris les représentations reliées à la maladie. Nous observons que les modèles ne performent pas bien lorsqu’ils sont évalués sur différents ensembles de données provenant du même domaine. Les représentations apprises des modèles entrainés sur les deux ensembles de données sont très différentes, ce qui pourrait expliquer le bas niveau de performance durant l’étape d’évaluation. Même si nous démontrons l’importance des caractéristiques linguistiques sur la classification des AD vs contrôle, nous observons que le meilleur modèle est BERT avec un niveau d’exactitude de 62.6% sur les données ADReSS challenge et 66.7% sur les données CCNA.	fr
dcterms.abstract	Many advances have been made in the early diagnosis of Alzheimer’s Disease (AD) using connected speech elicited from a picture description task. The use of hand built linguistic and acoustic features as well as Deep Learning approaches have shown promising results in the classification of AD patients. In this research, we compare both approaches on the Cookie Theft scene from the Boston Aphasia Examination with models trained with features derived from the text and audio extracts as well as a Deep Learning approach using BERT. We train our models on the newer ADReSS challenge dataset and evaluate on the CCNA dataset and vice versa in order to asses the generalisation of the trained model on unseen examples from a different dataset. A thorough evaluation of the interpretability of the models is performed to see how well each of the models learn the representations related to the disease. It is observed that the models do not perform well when evaluated on a different dataset from the same domain. The selected and learned representations from the models trained on either dataset are very different and may explain the low performance in the evaluation step. While we demonstrate the importance of linguistic features in the classification of AD vs non-AD, we find the best overall model is BERT which achieves a test accuracy of 62.6% on the ADRess challenge dataset and 66.7% on the CCNA dataset.	fr
dcterms.description	co-direction : Simona Brambati	fr
dcterms.language	eng	fr

Files in this item

Name:: genevieve_chafouleas_2021_memo ...
Size:: 1.674Mb
Format:: PDF
Description:: Mémoire

Name:: Connected-Speech-Feature-Extra ...
Size:: 15.45Mb
Format:: Unknown
Description:: Open source project

This item appears in the following Collection(s)

Thèses et mémoires électroniques de l’Université de Montréal [24325]
Faculté des arts et des sciences – Département d'informatique et de recherche opérationnelle - Thèses et mémoires [1178]

Show item record

This document disseminated on Papyrus is the exclusive property of the copyright holders and is protected by the Copyright Act (R.S.C. 1985, c. C-42). It may be used for fair dealing and non-commercial purposes, for private study or research, criticism and review as provided by law. For any other use, written authorization from the copyright holders is required.