Approche hybride pour l'apprentissage automatique incrémental
No Thumbnail Available
Date
2019-03-15
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Le travail présenté dans ce document se situe dans le cadre général de l’apprentissage automatique
et, plus précisément, celui de l'apprentissage incrémental qui propose une alternative d’évolutivité
et d’adaptation dynamique pour intégrer de nouvelles connaissances, de nouvelles données ou pour
restructurer des problèmes déjà partiellement appris. L’objectif principal de l'apprentissage
incrémental est de disposer d’un système capable d’apprendre de nouvelles informations (nouvelles
données, nouvelles classes...) sans pour autant oublier les connaissances déjà acquises.
Suite à notre étude des concepts et méthodes de l’apprentissage incrémental ainsi que des travaux
relatifs à l’apprentissage incrémental supervisé, notamment dans le domaine de la reconnaissance
de formes, nous avons constaté le manque de propositions d’hybridation et de combinaison de ces
méthodes. Dans ce cadre, nous comparons et combinons deux algorithmes d’apprentissage
supervisé le SVM incrémental et le réseau neuronal incrémental Learn++. Le système proposé, que
nous avons nommé ISVM-Learn++, a montré des bonnes capacités d'apprentissage incrémental sur
plusieurs jeux de données et a permis d’obtenir des résultats satisfaisants.
Après une étude approfondie des méthodes d’apprentissage non supervisé ou clustering,
notamment celles proposées dans un cadre incrémental, nous nous sommes intéressés
particulièrement au DBSCAN (Density-Based Spatial Clustering of Applications with Noise). Nous
proposons AMF-IDBSCAN, une version améliorée de cet algorithme qui construit de manière
incrémentale les clusters de formes et de tailles différentes dans de grands ensembles de données
et élimine la présence de bruit et de valeurs aberrantes. L'algorithme AMF-IDBSCAN proposé utilise
le canopy clustering pour pré-regrouper les ensembles de données afin de réduire le volume de
données, applique un DBSCAN incrémental pour regrouper les exemples d'apprentissage et la
technique AMF (Adaptive Median Filtering) pour réduire les données aberrantes ou bruits en les
remplaçant par les médianes choisies. Les résultats expérimentaux obtenus, sur plusieurs bases de
données, montrent que notre algorithme donne de bons résultats par rapport au DBSCAN et à
certaines de ses extensions proposées dans la littérature.