Semi-Supervised Multi-Label Feature Selection
No Thumbnail Available
Date
2017
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
I
l n’y avait jamais eu un temps o`u les donn´ees sont aussi faciles `a collecter et
`a enregistrer que maintenant. Avec l’avenement et le d´eveloppement rapide
des technologies num´eriques, les donn´ees sont devenues `a la fois un bien pr´ecieux
et tr`es abondant. Cependant, avec une telle profusion, se posent des questions
relatives `a la qualit´e de ces donn´ees. Des donn´ees bruit´ees et sans un quelconque
apport informationnel sont devenues le goulot d’´etranglement de l’apprentissage
automatique. La plus probable source de bruit est souvent due `a des variables non
pertinentes et/ou redondantes. A cet ´egard, la s´election de variables (caract´eris- `
tiques), habituellement utilis´ee comme une ´etape de pr´etraitement, est devenue
le pilier de l’apprentissage automatique, notamment lorsqu’il s’agit de donn´ees `a
grande ´echelle.
N´eanmoins, cette s´election est constamment mise `a l’´epreuve par de nouveaux
probl`emes ´emergents. R´ecemment, diverses applications du monde r´eel ont mis
`a disposition des donn´ees constitu´ees d’une large quantit´e d’instances non eti quet´ees ainsi qu’un nombre tr´es r´eduit d’instances multi-´etiquettes, ce qui a donn´e
naissance `a l’apprentissage semi-supervis´e multi-label. D’une part, les donn´ees
multi-´etiquettes apparaissent dans des domaines o`u les objets sont souvent class´es
dans plusieurs cat´egories `a la fois sans aucune contrainte d’exclusion mutuelle.
D’autre part, les di