Fouille de graphes: Algorithme combinatoire et Application

Nour El Islem KARABADJI

Fouille de graphes: Algorithme combinatoire et Application

Files

These-Karabadji-Nour-El-Islem.pdf (9.63 MB)

Date

2015

Authors

Nour El Islem KARABADJI

Abstract

Cette thèse traite d’un problème difficile qui est la découverte des motifs (modèles) intéressants à base de contraintes, en s’intéressant principalement à la découverte des sous-graphes connexes fréquents et partiellement à la découverte de modèles intéressants à base de contraintes. Les concepts fondamentaux du processus d’énumération, ainsi que l’espace de recherche combinatoire, ont été étudiés et présentés. Pour la découverte des sous-graphes connexes fréquents, les différentes difficultés liées au problème concernant la représentation des graphes, les opérations et l’espace de re cherche ont été explorés ainsi que la majorité des techniques de découverte. Les contribu tions de la thèse concernent une classe particulière des graphes, qui ont un étiquetage non redondant d’arêtes, et se matérialisent par la proposition de deux approches de décou verte de sous graphes connexes fréquents fermés. Le principal apport était la restriction de l’espace de recherche en minimisant le nombre des sous-graphes non intéressants (c.-à-d. fréquents non fermés) visités avant de récupérer tous les sous-graphes fréquents fermés. En plus de cette restriction de l’espace de recherche, chacune des deux approches adopte sa propre représentation des graphes. L’une permet de réduire le problème d’isomorphisme de graphes et de sous graphes, à une relation d’équivalence et d’inclusion d’ensemble, en s’appuyant sur un encodage des graphes à étiquetage d’arêtes non redondant en des ensembles d’items. Quant à la seconde approche, elle permet de résoudre efficacement le test d’isomorphisme de graphes et de sous graphes pour le moyen des cas, et même en un temps linéaire pour le meilleur des cas, et ce en représentant les graphes comme des tableaux d’adjacences. Pour la découverte de modèles intéressants à base de contraintes, une approche qui permet l’amélioration de la qualité d’un modèle ( arbre de décision dans notre cas) lors de la phase d’augmentation a été proposée. La contribution primaire porte essentiellement sur la résolution des problèmes de construction d’un arbre de décision, liés à la complexité du modèle et au sur-apprentissage ; par recherche de la combinaison optimale composée d’un sous-ensemble d’attributs et un sous-ensemble d’exemples d’apprentissage sans avoir recours à la phase d’élagage

URI

https://dspace.univ-annaba.dz//handle/123456789/2675

Collections

Thèses de doctorat

Full item page