Approches Ensemblistes de Classification et Sélection des Prédicteurs pour la Reconnaissance de Formes
No Thumbnail Available
Date
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Ces dernières années, les approches d’Ensemble de Classifieurs (EdC) ou les systèmes
multi-classifieurs ont attiré l’attention de la communauté de l’apprentissage automatique en
tant que technique de classification significative. Trois mécanismes fondamentaux
régissent la création d’un système multi-classifieurs : la génération d’un ensemble des
classifieurs diversifiés, la sélection des classifieurs et finalement la combinaison des sorties
des classifieurs sélectionnés. La sélection de classifieurs est une phase fondamentale dans
le processus d’optimisation d’un système multi-classifieurs. Le travail de recherche
présenté dans cette thèse concerne le développement d’approches de construction
d’ensemble de classifieurs se basant sur le compromis « diversité-précision».
Dans un premier temps, un système multi-classifieurs combinant la méthode Random
Subspace et la sélection statique est proposé pour la classification des images médicales.
L’étape de sélection de classifieurs de cette approche est basée sur l’utilisation de
différentes mesures de diversité pour l’évaluation de la compétence des sous-ensembles
candidats. Notre deuxième contribution concerne la proposition d’une nouvelle approche
de sélection statique de classifieurs basée sur l’intégration de la méthode mRMR
(minimum Redundancy Maximum Relevance) et les mesures de diversité en utilisant
différents algorithmes de recherche.
Nous avons observé que cette approche de sélection a choisi un seul EdC pour classer
tous les échantillons de test ou de généralisation. Cependant, il n y a aucune garantie que
l’EdC sélectionné est l’ensemble le plus susceptible pour classer un échantillon non étiqueté. À ce titre, notre dernière contribution porte sur une nouvelle approche de
sélection dynamique de prédicteurs permettant de choisir, pour chaque exemple à classer,
l’EdC le plus confiant pour décider la classe d’appartenance. Cette approche vise à
améliorer la performance de classification des bases de données médicales déséquilibrées
en combinant les approches d’échantillonnage des données d’apprentissage et la sélection
dynamique de prédicteurs.