Indexation et recherche de documents par le contenu
No Thumbnail Available
Date
2012
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Bien que les domaines de traitement d’images et de reconnaissance de formes aient fait des
progrès considérables dans différents champs d’application, les étapes de localisation et de
caractérisation adéquates d’objets restent des processus très délicats et non triviaux.
Caractériser des objets par leur forme est une tâche délicate dans plusieurs applications de
vison par ordinateur. Différentes approches théoriques très intéressantes existent mais qui,
néanmoins, restent très couteuses en terme de temps de calcul. Dans la recherche d’image par
le contenu (RIC) « Content-Based Image Retrieval (CBIR)» la forme est une caractéristique
de bas niveau. Elle doit satisfaire différentes propriétés : invariance, robustesse, compacité,
complexité faible et mesurabilité perceptible.
Dans les domaines où l’image possède un contenu complexe, mélange entre objets textuels et
objets graphiques par exemple, les images doivent être tout d’abord segmentées en
texte/graphique. On parle alors de séparation texte/graphique.
L’objectif de notre travail est de faire une étude bibliographique et expérimentale des
différentes manières de caractériser des objets qu’on rencontre dans les images. Nous nous
intéressons néanmoins à deux classes uniquement qui sont les objets textuels et non-textuels.
Nous allons étudier et implémenter un très grand nombre de descripteurs de formes très
connus dans la littérature qu’on va tester dans le domaine de la séparation texte/graphique.
Nous allons aussi présenter AdaBoost avec les arbres de décision, les réseaux de neurones
artificiels, C-means et Fuzzy C-means et les implémenter dans un même système.
Beaucoup de test vont être effectués, les classifieurs vont être testés sur chacun des
descripteurs indépendamment et en combinaison.
Nous allons également présenter et implémenter notre méthode de segmentation automatique
d’image basée sur la transformée de distance. Le résultat sera un nouveau jeu de test assez
conséquent composé d’objets textes et objets graphiques mais séparés automatiquement
évidemment avec quelques erreurs.
Nous montrerons par la suite que les résultats de validation prouvent encore une fois la
robustesse de la méthode AdaBoost avec un temps de réponse très appréciable. De point de
vue descripteurs, nous noterons que ce sont les moments de Hu qui ont donné les meilleurs
résultats