RECONNAISSANCE DE L’ECRITURE ARABE MANUSCRITE A BASE DES MACHINES A VECTEURS DE SUPPORTS
No Thumbnail Available
Date
2006
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
La reconnaissance de l’écriture, et particulièrement l’écriture manuscrite reste un défi
d’actualité. Différentes techniques de reconnaissance de formes ont été utilisées pour la
résolution de ce problème, certaines ont donné des résultats remarquables.
Malheureusement, les techniques classiques se basent sur le principe de minimisation du
risque empirique et souffrent des problèmes de sur-apprentissage et du grand nombre de
paramètres à fixer par l’utilisateur. Pour tenter de résoudre ces problèmes, une nouvelle
direction dans le domaine de l’apprentissage statistique a émergé de la théorie de Vapnik et
les machines à vecteurs de support et leurs applications dans le domaine de la
reconnaissance des formes.
Le travail présenté dans ce mémoire s’intègre dans le cadre général de la reconnaissance
automatique de l’écriture arabe manuscrite, et répond à la nécessité d’expérimenter une
nouvelle méthode d’apprentissage : les machines à vecteurs de support (SVM : Support
Vectors Machines), appliqué à la reconnaissance des caractères arabes manuscrits.
Avant de décider la classe d’appartenance du caractère en entrée, il est nécessaire
d’effectuer un certain nombre de traitements : binarisation, lissage, normalisation et
extraction de contour. Afin de caractériser nos images de caractères arabes, nous avons
opté pour une combinaison entre des caractéristiques statistiques provenant de la
distribution des pixels, et des caractéristiques structurelles basées sur les motifs
géométriques de l’alphabet arabe