Indexation et recherche de documents par le contenu

No Thumbnail Available
Date
2012
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Bien que les domaines de traitement d’images et de reconnaissance de formes aient fait des progrès considérables dans différents champs d’application, les étapes de localisation et de caractérisation adéquates d’objets restent des processus très délicats et non triviaux. Caractériser des objets par leur forme est une tâche délicate dans plusieurs applications de vison par ordinateur. Différentes approches théoriques très intéressantes existent mais qui, néanmoins, restent très couteuses en terme de temps de calcul. Dans la recherche d’image par le contenu (RIC) « Content-Based Image Retrieval (CBIR)» la forme est une caractéristique de bas niveau. Elle doit satisfaire différentes propriétés : invariance, robustesse, compacité, complexité faible et mesurabilité perceptible. Dans les domaines où l’image possède un contenu complexe, mélange entre objets textuels et objets graphiques par exemple, les images doivent être tout d’abord segmentées en texte/graphique. On parle alors de séparation texte/graphique. L’objectif de notre travail est de faire une étude bibliographique et expérimentale des différentes manières de caractériser des objets qu’on rencontre dans les images. Nous nous intéressons néanmoins à deux classes uniquement qui sont les objets textuels et non-textuels. Nous allons étudier et implémenter un très grand nombre de descripteurs de formes très connus dans la littérature qu’on va tester dans le domaine de la séparation texte/graphique. Nous allons aussi présenter AdaBoost avec les arbres de décision, les réseaux de neurones artificiels, C-means et Fuzzy C-means et les implémenter dans un même système. Beaucoup de test vont être effectués, les classifieurs vont être testés sur chacun des descripteurs indépendamment et en combinaison. Nous allons également présenter et implémenter notre méthode de segmentation automatique d’image basée sur la transformée de distance. Le résultat sera un nouveau jeu de test assez conséquent composé d’objets textes et objets graphiques mais séparés automatiquement évidemment avec quelques erreurs. Nous montrerons par la suite que les résultats de validation prouvent encore une fois la robustesse de la méthode AdaBoost avec un temps de réponse très appréciable. De point de vue descripteurs, nous noterons que ce sont les moments de Hu qui ont donné les meilleurs résultats
Description
Keywords
Citation