img

Notice détaillée

Reconnaissance de l'écriture arabe manuscrite par une approche hybride

Thèses / mémoires Ecrit par: Benouareth, Abdallah ; Sellami, M. ; Publié en: 1999

Résumé: Le travail présenté dans ce mémoire s’intègre dans le cadre général de la reconnaissance automatique de l'écriture arabe manuscrite. Ce domaine est très difficile, en raison d'une part du manque de consistance de caractères, et d'autre part, lorsque les lettres sont liées à l'intérieur des mots leurs caractéristiques peuvent varier considérablement. Ce qui conduit automatiquement à une multiplication de niveaux consécutifs de reconnaissance. Ce problème peut être abordé par deux approches différentes : locale (analytique) et globale (holistique). Dans l'approche analytique le reconnaissance de mot se fait en deux grandes étapes : premièrement par extraction (localisation) et identification de chacune de ses lettres et deuxièmement par combinaison des lettres identifiées pour donner le résultat final de la reconnaissance. Parallèlement, dans l'approche globale le mot est considéré comme étant l'élément de base de la reconnaissance. Dans ce cas, la reconnaissance se fait par extraction des informations pertinentes à partir de l'allure globale du mot. A base de ces informations on effectuera la classification du mot. Pratiquement, cette approche est limitée à un lexique spécifique de mot. On constatera que chacune de ces deux approches souffre de quelques handicaps, par conséquent ne permet pas de résoudre totalement et avec satisfaction le problème de la RAE (reconnaissance automatique de l'écriture) manuscrite. Le handicap majeur de l'approche analytique est la segmentation du mot en une suite de caractères ou d'autres entités "graphèmes". Cette segmentation n'est pas toujours fiabel, elle est dans la plupart des cas sujette aux erreurs et gourmande en temps de calcul. Cependant, son avantage réside dans la possibilité de reconnaître n'importe quel mot sans recours à un lexique prédéterminé. Quant à l'approche globale, elle souffre généralement d'un manque d'information suffisamment discriminatoire, ce qui augmente exponentiellement le taux de confusion avec la taille du lexique. De ce fait, une solution hybride semble une solution intéressante pour le problème de la RAE manuscrite à vocabulaire limité, comme nous tenterons de le montrer dans notre mémoire. Nous utilisons d'une part l'approche globale qui est basée sur un nombre réduit de caractéristiques morphologiques significatives de l'écriture arabe telles que les jambages, les hampes, le nombre de composantes connexes, etc afin d'obtenir l'ensemble des mots hypothèses, i.e, l'ensemble des mots du lexique ayant des caractéristiques globales identiques à celle du mot à reconnaître (c'est à dire se confondant visuellement). D'autre part, pour sélectionner la meilleur hypothèse parmi celles générées par le niveau global d'analyse, nous segmentons le mot en entités élémentaires (graphèmes) apportant un maximum d'informations discriminantes. L'ensemble d'informations obtenu après une analyse locale du mot, permettra une représentation du mot en séquence de codes. Ces codes, considérés comme des observations d'états, seront utilisés par un classifieur HMM (Hidden Markov Model). Ainsi, chaque mot dans le lexique de la reconnaissance est modélisé par un HMM ...

Annaba:
Langue: Français
Collation: 118 p. ill. ;30 cm.
Diplôme: Magister
Etablissement de soutenance: Annaba, Université Badji Mokhtar
Spécialité: Informatique
Index décimal 006.424 .Reconnaissance optique de caractères (ROC)
Thème Informatique

Mots clés:
prétraitement
primitives globales
mots arabes manuscrits
approche globale

Note: Bibliogr. pp.110-118

Reconnaissance de l'écriture arabe manuscrite par une approche hybride

Sommaire