Expansion de requête à l'aide d'une ontologie Arabe dans le domaine juridique
No Thumbnail Available
Date
2006
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Notre mémoire traite la problématique de la recherche d'information sur le Web, celle en Arabe
en particulier plus spécialement dans le domaine juridique.
Les moteurs de recherche actuels se basent, dans leur recherche, sur des mots clés, ces mots sont
traités syntaxiquement, la sémantique est omise d'où un grand nombre de documents retournés non
pertinents ce qu'on appelle bruit.
Différentes techniques ont été proposées pour réduire le taux de ce bruit et améliorer la précision de
la recherche.
Nous avons présenté un grand nombre de ces techniques et nous avons opté pour celle que nous
avons jugée intéressante pour notre cas, en l'occurrence l'expansion de la requête à l'aide d'une
ontologie.
La raison de notre choix est que d'un coté les ontologies représentent un avenir prometteur pour le
Web sémantique, qui est à son tour, l'héritier supposé du Web actuel, d'un autre coté les ontologies
n'ont pas encore été expérimentées dans la recherche d'information en langue Arabe, dans le domaine
juridique (du moins jusqu'à la rédaction de ce travail).
Nous traitons donc, dans ce travail le problème de la construction d'une ontologie en langue Arabe
dans le domaine juridique, dans le but d'étendre une requête Arabe et la soumettre à un processus de
recherche pour réduire le bruit et améliorer la précision.
Mondialisation oblige, nous tentons de permettre à un utilisateur potentiel d'effectuer une recherche
avec une requête Arabe pour l'obtention de documents Anglais ou Français, ceci en soumettant sa
requête à un système de traduction automatique libre d'utilisation sur le Web, tel que Tarjim, ainsi
que l'expansion de la requête traduite à l'aide de la base lexicale qui représente une ontologie
générique.
Nous décrivons les différentes étapes de la construction manuelle de notre ontologie relative au
domaine juridique, à l’aide de l’éditeur d’ontologies Protégé-2000 et ce à partir d'articles publiés sur
le Web concernant spécialement le domaine cité.
Nous avons essayé d'établir la hiérarchie avec la méthode descendante, nous essayons de donner à
chaque concept sa définition et nous comptons lui attacher ses variantes les plus représentatives du
domaine juridique.
Nous traitons à la fin quelques exemples illustratifs concernant l'expansion de la requête, pour essayer de
donner une évaluation préliminaire de l'approche adoptée.