Accélération de l’Apprentissage des SVMs pour le traitement de bases de données de grandes tailles : Application à la reconnaissance des mots arabes isolés
No Thumbnail Available
Date
2015
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
La révolution numérique a facilité considérablement la capture, la saisie et le stockage
des données à un coût pratiquement nul. Comme conséquence de ceci, des énormes
quantités de données de grandes dimensions (Images, Video …ect) sont stockées dans
des bases de données de façon continuelle. La classification de telles bases de données est
un problème délicat qui apparaît dans de nombreuses disciplines de l’informatique telle
que la reconnaissance de l’écriture arabe manuscrite. Raison pour laquelle le
développement de méthodes de classification automatiques pour ces bases de données est
primordial.
Les Séparateurs à Vaste Marge est une méthode de classification qui montre de bonnes
performances dans divers problèmes tels que le traitement d’image, la catégorisation de
textes ou le diagnostique médical et ce même sur des ensembles de données de tailles
importantes.
Néanmoins, la réalisation d’un programme d’apprentissage par SVMs se ramène à
résoudre un problème de programmation quadratique (QP) dont la taille mémoire et le
temps nécessaires pour sa résolution sont linéairement liés à la taille des exemples
utilisés. Quand on a affaire à des bases de données de grandes tailles, la mise en œuvre
des SVMs devient encore plus couteuse en espace mémoire et en temps d’exécution.
Pour surmonter cette insuffisance des SVMs, une nouvelle proposition utilisant le
partitionnement K-moyenne au sein d’un espace réduit du vecteur caractéristique des
données est développée dans thèse. Nos résultats montrent qu'il est désormais possible
d'utiliser les SVMs pour classifier des bases d’une taille d'exemples importante. La
reconnaissance des noms manuscrits des Wilayas Algériennes en est un exemple type
traité avec succès dans cette thèse.