Les approches ensemblistes pour la classification multi-label des données à grandes échelles
No Thumbnail Available
Date
2024
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Université Badji Mokhtar Annaba
Abstract
L'étude de recherche menée dans cette thèse s'articule autour de deux nouvelles approches ensemblistes: ConfBoost et DisEMLC. L'objectif visé par ces deux approches est de développer des systèmes robustes et généralisables, capables de relever les défis surmentionnés, tout en assurant la scalabilité des DML. L'approche ConfBoost constitue un méta-modèle qui combine plusieurs Classifieurs Ensemble Multi-Label complémentaires et hétérogènes, tels qu'ECC, EPS, RAKEL, RF-PCT. Cette approche repose sur un paradigme de Stacking pondéré, utilisant une pondération des labels couplée à des seuils ajustés. Des expériences approfondies menées sur des ensembles de données Multi-Label de référence ont mis en évidence l'efficacité et le potentiel de ConfBoost en tant que méthode avancée pour les tâches de Classification Multi-Label.
Description
Keywords
approche distribuée; apprentissage Ensemble; classification multi-label;
mapreduce; label pondéré; stacking; seuillage ajusté