Vocabulaire employé pour l'accès thématique aux documents d'archives patrimoniaux : étude linguistique exploratoire de termes de recherche, de description, d'indexation
Thèse ou mémoire
2018-04 (octroi du grade: 2018-10-18)
Cycle d'études
DoctoratProgramme
Sciences de l'informationMots-clés
- Accès thématique
- Relations sémantiques
- Archives patrimoniales
- Analyse linguistique
- Vocabulaire
- Documents d’archives
- Indexation
- Recherche par sujet
- Référence archivistique
- Subject access
- Semantic relationships
- Heritage archives
- Linguistic analysis
- Vocabulary
- Subject indexing
- Subject research
- Archival reference
- Usagers des archives
- Archives users
- Communications and the Arts - Information Science / Communications et les arts - Sciences de l’information (UMI : 0723)
Résumé·s
Les usagers recherchent des documents d’archives par sujet mais l’accès offert dans les services d’archives est principalement par provenance : il réside un écart entre l’accès recherché et l’accès offert. Pour répondre à la demande des usagers, certains services d’archives fournissent déjà des accès thématiques. Les instruments de recherche de ces précurseurs servent de base à notre recherche. Nous avons analysé le vocabulaire que les archivistes emploient pour décrire et indexer par sujet, c’est-à-dire le choix des mots et les relations sémantiques que ces mots entretiennent les uns avec les autres dans les documents dont ils sont issus (notices descriptives, index). Parallèlement, nous avons analysé le vocabulaire des usagers dans les questions envoyées par courriel à la référence avec la réponse de l’archiviste. Ainsi, notre étude couvre une large partie de la chaîne communicationnelle entre les usagers et les documents d’archives qu’ils recherchent par sujet. La comparaison de ces deux vocabulaires a fait émerger l’écart sémantique qui les sépare. Par l’étude des termes de recherche, de description, d’indexation, nous souhaitons contribuer à l’avancement des connaissances sur le vocabulaire employé pour l’accès thématique aux archives patrimoniales (VATAP). Notre méthode de recherche est l’étude de corpus. Nous étudions les relations sémantiques entre les termes d’un corpus de termes provenant de quatre sources de données (questions d’usagers à la référence, réponses d’archivistes, notices descriptives, index), collectées dans trois milieux. Nous circonscrivons la recherche à des données de centres ou services d’archives de grande envergure parce qu’ils ont les moyens de développer des outils pour encadrer et faciliter l’accès. L’originalité de notre recherche réside dans l’application de la linguistique à l’étude du VATAP. Par cette recherche, nous souhaitons décrire le VATAP et contribuer à l’amélioration de l’accès thématique aux archives patrimoniales en émettant des recommandations à l’usage des archivistes à partir de l’étude des relations sémantiques les plus fréquentes dans notre corpus. La formalisation linguistique nécessaire à notre recherche pourrait servir de prémisses à une automatisation de l’indexation. Cette étude exploratoire du vocabulaire des usagers permettra aux établissements participants de mieux connaître cet aspect du profil de leur clientèle. Users carry out searches for archives by subject, yet the access offered in the archives is mainly by provenance resulting in a gap between the desired access and the offered access. To meet users’ demand, some archival services already offer access by subject. Research instruments used by these services provide the basis for our research. We analyzed the vocabulary used by archivists to describe and to index archival documents by subject. That is to say, the choice of words and the semantic relationships that exist between the meanings of these words in the documents from which they come from (descriptions, index). We analyzed both the users’ vocabulary in the questions asked to the reference archivist by email and the answers offered by the latter. Thus, our study covers a large part of the communicative chain between users and archives they are looking for by subject. The comparison of these two vocabularies has brought out the semantic gap that separates them. By studying the terms used for research, for description, and for indexing, we wish to contribute to the advancement of knowledge on the vocabulary used for thematic access to heritage archives (VATAP). We have chosen corpus studies as our research methodology. We study the semantic relationships between the terms in a corpus from four data sources (user-to-reference questions, reference archivists’ answers, descriptions, indexes), collected from three different archives services. We limit our research to data obtained from large archival repositories as they have the means to develop tools to guide and facilitate access. The originality of our research lies in the application of linguistics to the study of VATAP. Our study describes VATAP and contributes to a better accessing of heritage archives by subject. We accomplish this by formulating recommendations for the archivists’ use based on the study of the most frequent semantic relationships in our corpus. The linguistic formalization needed for our research could serve as a premise for automatic indexing. This exploratory study of users’ vocabulary allows participating institutions to better understand this aspect of their users’ profile.
Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Il peut être utilisé dans le cadre d'une utilisation équitable et non commerciale, à des fins d'étude privée ou de recherche, de critique ou de compte-rendu comme le prévoit la Loi. Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.