Classification des documents médicaux basée sur le Text Mining
Thèses / mémoires Ecrit par: Dahmani, Houria ; El Maouhab, Aouaouche ; Publié en: 2012
Résumé: Avec l'avènement des ordinateurs et de l'explosion du nombre de documents stockés sur support électronique et sur le Web, qui sont plus de 80% de type texte, l'utilisation de la technologie pour faciliter le traitement et l'analyse est devenue essentielle pour aider les utilisateurs à explorer les données les masses et de les organiser. Ainsi Text Mining, et la classification automatique de texte précisément, qui consiste à attribuer un document d'une ou plusieurs catégories, est de plus en plus reconnu comme une clé la technologie, les résultats sont également utiles pour la recherche d'information en extraction de connaissances ou sur Internet (moteurs de recherche) et au sein des entreprises (classement des documents internes, des nouvelles agences, etc) .. En ce qui concerne les différentes approches de classification automatique de texte, décrit dans la état de la technique, nous avons utilisé une approche non supervisée (Kmeans algorithme) pour étiqueter nos documents et l'approche supervisée (Naive Bayes algorithme) pour classer les nouveaux documents. L'objectif principal de notre travail est de fournir un classement fiable de médecine documents.Nous utilisons MEDLINE comme corpus de textes, dans lesquels nous exerçons nos expériences.
Langue:
Français
Collation:
79 p. ill.
;30 cm.
Diplôme:
Master
Etablissement de soutenance:
Blida, Université Saad Dahlab. Faculté des Sciences
Spécialité:
Informatique
Index décimal
621 .Physique appliquée (électrotechnique, génie civil, génie mécanique, ingénierie appliquée, principes physiques en ingénierie)
Thème
Informatique
Mots clés:
Classifications documents
Exploration de données
MEDLINE (base de données)
Note: Annexe pp.[81-86]; bibliogr. pp.[87-88]