Show item record

dc.contributor.advisorForest, Dominic
dc.contributor.advisorCrépeau, Robert
dc.contributor.authorSamson, Anne-Renée
dc.date.accessioned2014-03-25T16:27:43Z
dc.date.availableNO_RESTRICTIONfr
dc.date.available2014-03-25T16:27:43Z
dc.date.issued2014-03-03
dc.date.submitted2013-06
dc.identifier.urihttp://hdl.handle.net/1866/10440
dc.subjectFouille de textesfr
dc.subjectforage de textesfr
dc.subjectanalyse thématique assistée par ordinateurfr
dc.subjectclassification automatiquefr
dc.subjectvisualisation graphiquefr
dc.subjectanalyse réseauxfr
dc.subjectanthropologiefr
dc.subjectText miningfr
dc.subjectautomated thematic analysis of textual datafr
dc.subjecthierarchical clusteringfr
dc.subjectconcept extractionfr
dc.subjectinformation visualizationfr
dc.subjectanthropologyfr
dc.subject.otherCommunications and the Arts - Information Science / Communications et les arts - Sciences de l’information (UMI : 0723)fr
dc.titleExtraction automatique et visualisation des thèmes abordés dans des résumés de mémoires et de thèses en anthropologie au Québec, de 1985 à 2009fr
dc.typeThèse ou mémoire / Thesis or Dissertation
etd.degree.disciplineSciences de l'informationfr
etd.degree.grantorUniversité de Montréalfr
etd.degree.levelMaîtrise / Master'sfr
etd.degree.nameM.S.I.fr
dcterms.abstractS’insérant dans les domaines de la Lecture et de l’Analyse de Textes Assistées par Ordinateur (LATAO), de la Gestion Électronique des Documents (GÉD), de la visualisation de l’information et, en partie, de l’anthropologie, cette recherche exploratoire propose l’expérimentation d’une méthodologie descriptive en fouille de textes afin de cartographier thématiquement un corpus de textes anthropologiques. Plus précisément, nous souhaitons éprouver la méthode de classification hiérarchique ascendante (CHA) pour extraire et analyser les thèmes issus de résumés de mémoires et de thèses octroyés de 1985 à 2009 (1240 résumés), par les départements d’anthropologie de l’Université de Montréal et de l’Université Laval, ainsi que le département d’histoire de l’Université Laval (pour les résumés archéologiques et ethnologiques). En première partie de mémoire, nous présentons notre cadre théorique, c'est-à-dire que nous expliquons ce qu’est la fouille de textes, ses origines, ses applications, les étapes méthodologiques puis, nous complétons avec une revue des principales publications. La deuxième partie est consacrée au cadre méthodologique et ainsi, nous abordons les différentes étapes par lesquelles ce projet fut conduit; la collecte des données, le filtrage linguistique, la classification automatique, pour en nommer que quelques-unes. Finalement, en dernière partie, nous présentons les résultats de notre recherche, en nous attardant plus particulièrement sur deux expérimentations. Nous abordons également la navigation thématique et les approches conceptuelles en thématisation, par exemple, en anthropologie, la dichotomie culture ̸ biologie. Nous terminons avec les limites de ce projet et les pistes d’intérêts pour de futures recherches.fr
dcterms.abstractTaking advantage of the recent development of automated analysis of textual data, digital records of documents, data graphics and anthropology, this study was set forth using data mining techniques to create a thematic map of anthropological documents. In this exploratory research, we propose to evaluate the usefulness of thematic analysis by using automated classification of textual data, as well as information visualizations (based on network analysis). More precisely, we want to examine the method of hierarchical clustering (HCA, agglomerative) for thematic analysis and information extraction. We built our study from a database consisting of 1 240 thesis abstracts, granted from 1985 to 2009, by anthropological departments at the University of Montreal and University Laval, as well as historical department at University Laval (for archaeological and ethnological abstracts). In the first section, we present our theoretical framework; we expose definitions of text mining, its origins, the practical applications and the methodology, and in the end, we present a literature review. The second part is devoted to the methodological framework and we discuss the various stages through which the project was conducted; construction of database, linguistic and statistical filtering, automated classification, etc. Finally, in the last section, we display results of two specific experiments and we present our interpretations. We also discuss about thematic navigation and conceptual approaches. We conclude with the limitations we faced through this project and paths of interest for future research.fr
dcterms.languagefrafr


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show item record