Show item record

dc.contributor.authorDa Sylva, Lyne
dc.contributor.authorTurner, James
dc.date.accessioned2013-05-28T19:34:15Z
dc.date.available2013-05-28T19:34:15Z
dc.date.issued2006-06
dc.identifier.urihttp://hdl.handle.net/1866/9618
dc.description.sponsorshipRéseau de recherche pour la gestion du contenu culturel numérique. (Responsable du réseau: Djemel Ziou, Université de Sherbrooke) (CoRIMedia). Subvention du Fonds des réseaux de recherche sur les nouveaux médias (Ministère du Patrimoine canadien)fr
dc.subjectindexation automatiquefr
dc.subjectcontenu culturel canadien sur le Webfr
dc.subjectpéritextefr
dc.subjectindexation automatique d'éléments non textuelsfr
dc.titleUsing Ancillary Text to Index Web-based Multimedia Objectsfr
dc.typeArticlefr
dc.contributor.affiliationUniversité de Montréal. Faculté des arts et des sciences. École de bibliothéconomie et des sciences de l'informationfr
dcterms.abstractPériCulture est le nom d'un projet de recherche à l'Université de Montréal qui fait partie d'un projet plus vaste basé à l'Université de Sherbrooke. Ce dernier visait à former un réseau de recherche pour la gestion du contenu culturel numérique canadien. L'objectif général de la recherche de PériCulture était d'étudier les méthodes d'indexation de contenus culturels non textuels sur le Web, plus spécifiquement des images. Les résultats de la recherche présentés ici s'appuient sur des travaux précédents en indexation d'images et en indexation automatique (de texte), par l'étude des propriétés du texte associé à des images dans un environnement réseau. Le but était de comprendre la façon dont le texte associé à des images sur des pages Web (appelé péritexte) peut être exploité pour indexer les images correspondantes. Nous avons étudié cette question dans le contexte de pages Web sélectionnées, c'est à dire : des pages de contenu culturel canadien contenant des objets multimédia auxquels était associé du texte (plus que simplement les noms de fichiers et les légendes) et qui étaient bilingues (anglais et français). Nous avons identifié les mots-clés utiles à l'indexation situés à proximité de l'objet décrit. Les termes d'indexation potentiels ont été identifiés dans diverses balises HTML et dans le texte intégral (chacun étant considéré comme une source différente de péritexte). Notre étude a révélé qu'un grand nombre de termes d'indexation utiles sont disponibles dans le péritexte de nombreux sites Web ayant un contenu culturel, et ce péritexte de différentes sources a une utilité variable dans la recherche d’information. Nos résultats suggèrent que ces termes peuvent être exploités de différentes manières dans les systèmes de recherche d’information pour améliorer les résultats de recherche.fr
dcterms.languageengfr
UdeM.VersionRioxxVersion acceptée / Accepted Manuscript
oaire.citationTitleLiterary and linguistic computing
oaire.citationVolume21
oaire.citationIssue2
oaire.citationStartPage219
oaire.citationEndPage228


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show item record

This document disseminated on Papyrus is the exclusive property of the copyright holders and is protected by the Copyright Act (R.S.C. 1985, c. C-42). It may be used for fair dealing and non-commercial purposes, for private study or research, criticism and review as provided by law. For any other use, written authorization from the copyright holders is required.