Fouille de graphes: Algorithme combinatoire et Application
No Thumbnail Available
Date
2015
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Cette thèse traite d’un problème difficile qui est la découverte des motifs (modèles)
intéressants à base de contraintes, en s’intéressant principalement à la découverte des
sous-graphes connexes fréquents et partiellement à la découverte de modèles intéressants
à base de contraintes. Les concepts fondamentaux du processus d’énumération, ainsi que
l’espace de recherche combinatoire, ont été étudiés et présentés.
Pour la découverte des sous-graphes connexes fréquents, les différentes difficultés liées
au problème concernant la représentation des graphes, les opérations et l’espace de re cherche ont été explorés ainsi que la majorité des techniques de découverte. Les contribu tions de la thèse concernent une classe particulière des graphes, qui ont un étiquetage non
redondant d’arêtes, et se matérialisent par la proposition de deux approches de décou verte de sous graphes connexes fréquents fermés. Le principal apport était la restriction de
l’espace de recherche en minimisant le nombre des sous-graphes non intéressants (c.-à-d.
fréquents non fermés) visités avant de récupérer tous les sous-graphes fréquents fermés. En
plus de cette restriction de l’espace de recherche, chacune des deux approches adopte sa
propre représentation des graphes. L’une permet de réduire le problème d’isomorphisme
de graphes et de sous graphes, à une relation d’équivalence et d’inclusion d’ensemble,
en s’appuyant sur un encodage des graphes à étiquetage d’arêtes non redondant en des
ensembles d’items. Quant à la seconde approche, elle permet de résoudre efficacement le
test d’isomorphisme de graphes et de sous graphes pour le moyen des cas, et même en
un temps linéaire pour le meilleur des cas, et ce en représentant les graphes comme des
tableaux d’adjacences.
Pour la découverte de modèles intéressants à base de contraintes, une approche qui
permet l’amélioration de la qualité d’un modèle ( arbre de décision dans notre cas) lors de
la phase d’augmentation a été proposée. La contribution primaire porte essentiellement
sur la résolution des problèmes de construction d’un arbre de décision, liés à la complexité
du modèle et au sur-apprentissage ; par recherche de la combinaison optimale composée
d’un sous-ensemble d’attributs et un sous-ensemble d’exemples d’apprentissage sans avoir
recours à la phase d’élagage