img

Notice détaillée

Indexation des documents structurés en XML

Thèses / mémoires Ecrit par: Hammouche, Karima ; Bessai Mechmache, Fatma Zohra ; Ouchefoun, Houria ; Publié en: 2005

Résumé: Le développement du document électronique et du Web ont vu émerger puis s’imposer des formats de données structurés, tels que le SGML (Standard Generalized Markup Langage) et le XML (eXtensible Markup Langag), permattant de représenter l’information sous une forme plus riche que le simple contenu et adaptée à des besoins spécifiques. Ces nouveaux formats permettent de représenter conjointement l’information textuelle et l’information de structure d’un document. Les techniques d’indexation et de recherche de documents XML attirent de plus en plus l’attention puisqu’elles permettent d’accéder facilement à certaines parties des documents recherchés. Cependant, la majeure partie des systèmes de recherche d’information est basée sur un processus d’indexation qui tient compte de façon marginale de la structure des documents, et est principalement basé sur une synthèse globale du contenu du document. Ceci est du au fait que la recherche considère le document entier comme unité d’information. Pourtant, dans le cas des utilisateurs, car l’information appropriée pourrait être trouvée dans juste quelques parties d’un document. Afin d’améliorer l’efficacité des systèmes de recherche d’information quelques efforts considérables sont dépensés en essayant de définir de nouveaux modèles d’indexation et de recherche de documents structurés afin de concerner la recherche seulement sur certaines parties d’un document. Nous allons particulièrement nous intéresser à l’indexation de documents structurés en XML. Par conséquent, l’objectif de notre travail est la mise en place d’un processus d’indexation structurée support du processus d’interrogation de documents structurés.


Langue: Français
Collation: 187 p. ill. ;30 cm
Diplôme: Ingénieur d'état
Etablissement de soutenance: Blida, Université de Saad Dahlab. Faculté de Sciences
Spécialité: Système d'Information
Index décimal 621 .Physique appliquée (électrotechnique, génie civil, génie mécanique, ingénierie appliquée, principes physiques en ingénierie)
Thème Informatique

Mots clés:
XML (langage de balisage)
Indexation automatique
Structures de données (informatique)

Note: Bibliogr.pp.122-123; Annexe pp.124-185

Indexation des documents structurés en XML

Sommaire