Le text mining pour la classification automatique des documents textuels
Thèses / mémoires Ecrit par: Annou, Farah ; Bessai, Fatma Zohra ; Boualbani, Lamis ; Publié en: 2022
Résumé: Face à l’accroissement de l’information disponible en ligne et le nombre de documents électroniques rédigés en langue naturelle, la catégorisation ou classification automatique de textes s’impose de plus en plus comme une technologie clé dans la gestion de l’intelligence au sein de l’entreprise. Le processus de classification d’une collection de textes consiste à étiqueter chaque texte avec une ou plusieurs classes (catégories) prédéfinies par le biais d’un algorithme d’apprentissage automatique (Machine Learning). L’objectif de notre travail est d’étudier les techniques du Text Mining et de proposer une approche basée sur le Text Mining et l’apprentissage automatique pour l’analyse et la classification de documents textuels. Après une étude comparative entre l’approche basée sur les modèles classiques (KNN, SVM, Naïf de Bayes, Régression logistique et les arbres de décision) et l’approche neuronale (ANN, CNN, RNN et LSTM bidirectionnel), nous avons choisi le réseau de neurone LSTM bidirectionnel comme solution pour la classification des documents textuels.
Alger:
Langue:
Français
Collation:
137 p. ill.
;30 cm.
Diplôme:
Master
Etablissement de soutenance:
Alger, Université des Sciences et de la Technologie Houari Boumediene. Faculté de d'Informatique
Thème
Informatique
Mots clés:
Classification
Apprentissage profond
Apprentissage automatique
Note: Annexe pp.134-137; Bibliogr.pp.[138-146]