Modélisation sémantique et indexation
No Thumbnail Available
Date
2016
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
La désambiguïsation lexicale est une tâche fondamentale pour la plupart des
applications de traitement automatique des langages naturels. Plusieurs solutions ont
été proposées pour certain langues notamment l’anglais ou le français, mais les études
dans ce domaine pour la langue arabe restent limitées. Le principal obstacle est le
manque de ressources et l’ambigüité de la langue. Dans ce manuscrit, nous présentons
les étapes pour construire une base lexicale, en exploitant les ressources Web comme
Wiktionnaire et le WordNet qui sont devenues des sources intéressantes pour
l'extraction d'information. Nous présentons ensuite la notion d’algorithme local et
d’algorithme global pour la désambiguïsation sémantique des textes arabes. Un
algorithme local permet de calculer la proximité sémantique entre deux objets
lexicaux, cependant l’algorithme global permet de propager ces mesures locales à un
niveau supérieur. Nous nous servons de cette notion pour confronter un algorithme à
colonies de fourmis à d’autres méthodes issues de l’état de l’art. En les évaluant sur
un corpus. Les résultats obtenus nous ont menée à découvrir les facteurs qui ont
influencé la performance de ce système qui seront sujets d’éventuelle amélioration
dans nos future travaux de recherches.