Reformulation de requêtes dans les systèmes de recherche d\'information dans des documents XML
Thèses / mémoires Ecrit par: Mataoui, M'hamed ; Université de M'hamed Bougara Boumerdes ; Boughanem, Mohand ; Publié en: 2007
Résumé: Notre travail se situe dans le contexte de la recherche d’information (RI), plus particulièrement la recherche d'information dans des documents semi structurés de type XML. La reformulation de requêtes est une phase importante dans les systèmes de recherche d’information. Elle permet en effet de récrire la requête de l’utilisateur selon les informations retrouvées par la requête initiale. De manière générale, ceci consiste, dans le cas notamment de la réinjection de la pertinence, d’extraire à partir des documents jugés pertinents par l’utilisateur, les mots-clés importants puis les rajouter à la requête initiale. L’objectif de ce projet est de proposer une solution pour adapter ce processus bien connu et bien établi dans les systèmes de recherche d’information plein texte, à la recherche d’information dans des documents XML. L’utilisation de la technique de réinjection de pertinence dans le contexte de la RI structurée nécessite la prise en charge de la dimension structurelle en plus de la dimension textuelle. Dans ce travail nous avons tenté d’apporter des réponses aux différentes questions posées, à savoir : Comment effectuer une reformulation de requêtes par réinjection de pertinence dans ce contexte? Comment extraire les meilleurs termes à partir d’unités d’information jugées pertinentes et non pertinentes par l’utilisateur, sachant que ces unités peuvent avoir des sémantiques différentes (ex : un paragraphe, une section, un titre), et peuvent être imbriquées les unes dans les autres? Quels poids doit-on assigner à ces différents termes dans ces différents cas de figures? Est-il opportun, par exemple, d’assigner le même poids à un terme provenant d’un titre et d’une section? Comment intégrer l’information structurelle dans la formation de la nouvelle requête ? Nos propositions concernent les catégories de stratégies : le ré-ordonnancement de la liste des résultats; et puis l'expansion de requêtes. Concernant la stratégie de ré-ordonnancement, nous proposons deux méthodes : le réordonnancement contextuel et le ré-ordonnancement par nom de Journal. En ce qui concerne l’expansion de requêtes, nous proposons deux méthodes : expansion par ajout de termes et expansion par ajout de contraintes structurelles. L’évaluation effectuée porte sur les méthodes de ré-ordonnancement appliquées sur des résultats renvoyés par le système de recherche d’information XFIRM en utilisant des jugements de pertinence issus de la campagne INEX. L’évaluation des formules proposées nous a permis de constater que les résultats obtenus après ré-ordonnancement sont meilleurs que ceux de l'exécution de base
Boumerdes:
Langue:
Français
Collation:
116 p. ill.
;30 cm
Diplôme:
Magister
Etablissement de soutenance:
Boumerdes, Université de M'hamed Bougara. Faculté des Sciences
Spécialité:
Informatique
Index décimal
621 .Physique appliquée (électrotechnique, génie civil, génie mécanique, ingénierie appliquée, principes physiques en ingénierie)
Thème
Informatique
Mots clés:
recherche d'information
XML (langage de balisage)
Note: Bibliogr.pp.111-116; Annexe pp.[117-131]
Reformulation de requêtes dans les systèmes de recherche d\'information dans des documents XML