Show item record

dc.contributor.advisorLanglais, Philippe
dc.contributor.authorGao, Tianjian
dc.date.accessioned2023-05-15T15:13:01Z
dc.date.availableNO_RESTRICTIONfr
dc.date.available2023-05-15T15:13:01Z
dc.date.issued2023-03-22
dc.date.submitted2022-12
dc.identifier.urihttp://hdl.handle.net/1866/27942
dc.subjectTaxonomiefr
dc.subjectOntologiefr
dc.subjectApprentissage de taxonomiefr
dc.subjectÉvaluation d’ontologiefr
dc.subjectExtraction de connaissancesfr
dc.subjectReprésentation des connaissancesfr
dc.subjectExtraction de l’informationfr
dc.subjectModélisation du langagefr
dc.subjectDécouverte d’hyperonymesfr
dc.subjectTaxonomyfr
dc.subjectOntologyfr
dc.subjectTaxonomy learningfr
dc.subjectOntology evaluationfr
dc.subjectKnowledge representationfr
dc.subjectKnowledge extractionfr
dc.subjectInformation retrievalfr
dc.subjectInformation extractionfr
dc.subjectHypernym discoveryfr
dc.subjectLanguage modellingfr
dc.subject.otherArtificial intelligence / Intelligence artificielle (UMI : 0800)fr
dc.titleAutomatic taxonomy evaluationfr
dc.typeThèse ou mémoire / Thesis or Dissertation
etd.degree.disciplineInformatiquefr
etd.degree.grantorUniversité de Montréalfr
etd.degree.levelMaîtrise / Master'sfr
etd.degree.nameM. Sc.fr
dcterms.abstractLes taxonomies sont une représentation essentielle des connaissances, jouant un rôle central dans de nombreuses applications riches en connaissances. Malgré cela, leur construction est laborieuse que ce soit manuellement ou automatiquement, et l'évaluation quantitative de taxonomies est un sujet négligé. Lorsque les chercheurs se concentrent sur la construction d'une taxonomie à partir de grands corpus non structurés, l'évaluation est faite souvent manuellement, ce qui implique des biais et se traduit souvent par une reproductibilité limitée. Les entreprises qui souhaitent améliorer leur taxonomie manquent souvent d'étalon ou de référence, une sorte de taxonomie bien optimisée pouvant service de référence. Par conséquent, des connaissances et des efforts spécialisés sont nécessaires pour évaluer une taxonomie. Dans ce travail, nous soutenons que l'évaluation d'une taxonomie effectuée automatiquement et de manière reproductible est aussi importante que la génération automatique de telles taxonomies. Nous proposons deux nouvelles méthodes d'évaluation qui produisent des scores moins biaisés: un modèle de classification de la taxonomie extraite d'un corpus étiqueté, et un modèle de langue non supervisé qui sert de source de connaissances pour évaluer les relations hyperonymiques. Nous constatons que nos substituts d'évaluation corrèlent avec les jugements humains et que les modèles de langue pourraient imiter les experts humains dans les tâches riches en connaissances.fr
dcterms.abstractTaxonomies are an essential knowledge representation and play an important role in classification and numerous knowledge-rich applications, yet quantitative taxonomy evaluation remains to be overlooked and left much to be desired. While studies focus on automatic taxonomy construction (ATC) for extracting meaningful structures and semantics from large corpora, their evaluation is usually manual and subject to bias and low reproducibility. Companies wishing to improve their domain-focused taxonomies also suffer from lacking ground-truths. In fact, manual taxonomy evaluation requires substantial labour and expert knowledge. As a result, we argue in this thesis that automatic taxonomy evaluation (ATE) is just as important as taxonomy construction. We propose two novel taxonomy evaluation methods for automatic taxonomy scoring, leveraging supervised classification for labelled corpora and unsupervised language modelling as a knowledge source for unlabelled data. We show that our evaluation proxies can exert similar effects and correlate well with human judgments and that language models can imitate human experts on knowledge-rich tasks.fr
dcterms.descriptionThis thesis would not be made possible without the generous support of IATA.fr
dcterms.languageengfr


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show item record

This document disseminated on Papyrus is the exclusive property of the copyright holders and is protected by the Copyright Act (R.S.C. 1985, c. C-42). It may be used for fair dealing and non-commercial purposes, for private study or research, criticism and review as provided by law. For any other use, written authorization from the copyright holders is required.