Un Environnement de Traduction Automatique du Texte Arabe vers la Langue des Signes Algérienne (LSA)
No Thumbnail Available
Date
2009
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
En Algérie la communauté des sourds-muets compte dans les 80 000 personnes, (environ 71 800
personnes présentant des handicaps auditifs sont recensées en Algérie) et à l’instar des autres pays du
monde, simplement une minorité d’entre eux maitrise le langage écrit, alors que la quasi totalité des
supports d’information que se soit dans le domaine éducatif où dans les autres domaines de la vie ne
prennent pas en charge la spécificité de cette communauté, qui utilise dans la plupart de leurs temps
un langage des signes LS comme outils de communication. Ainsi le développement d’un
environnement de communication destiné à la communauté des sourds-muets basé essentiellement
sur la langue des signes devient une nécessité morale et socio-économique. Notre projet consiste à
développer un environnement informatique de traduction automatique du texte arabe vers la langue
des signes algérienne LSA (exploitant le dictionnaire des signes algérien en cours de constitution),
comme support de communication accessible via les standards existants en terme de visualisation sur
PC (Pages Web, Logiciels de visualisations .Etc.) afin de maximiser l’interopérabilité et facilite
l’accès à l’information textuelle arabe par un maximum d’utilisateurs.
Pour le texte arabe en entrée, le système en première étape prend en charge un sous ensemble du
langage arabe écrit et qui est utilisé dans les premiers cycles de l’éducation nationale et ayant comme
caractéristiques syntaxiques et sémantiques prédéterminées.
L’architecture du système envisagé s’articule autour de :
1. Extraction du sens du Texte Arabe en entrée via les différentes étapes d’analyse (lexicale,
syntaxique, sémantique) du texte arabe en se basant sur les fonctionnalités (morphologique,
syntaxique, sémantiques) propres à la langue arabe. Dans cette phase nous exploitons une
ressource linguistique largement utilisée, c’est la base lexicale WordNet. Pour la langue arabe le
(Arabic WordNet : projet réalisé entre 2005-2007) est récement mise en service (2008) et nous
pensons selon nous information que notre travail est le premier dans le domaine du TALN à
utilisé cette ressource lexicale.
2. Génération d’une représentation structurée de l’énoncé en captant le contenu sémantique du texte
en se basant sur des formalismes de représentation de connaissances les plus adaptés au
Traitement Automatique de la Langue Naturelle (TALN).
3. Transfert sémantique vers une représentation appropriée du langage des signes exprimant
l’agencement des entités élémentaires constituant les signes, cette représentation doit être
capable de couvrir l’espace de signation et de représenter les phénomènes propres au langage des
signes tels que les configurations non manuelles, les relations spatiales entre les entités LS et les
verbes directionnels. Une phrase gestuelle sera donc représentée.
4. Génération de l’énoncé LS en se basant sur un dictionnaire graphique des signes et sur un
traitement linguistique propre au LS, produisant ainsi des séquences d’unités gestuelles
synchronisées. Les séquences à signer transcrits seront exécutées par un personnage de synthèse
3D (Avatar) simulant un signeur naturel, en tenant compte à la représentation des gestes
(caractéristiques structurelles et sémantiques) et aux trajectoires de mouvement. La mise en
scène du signeur virtuel (Avatar) est basée sur l’utilisation des techniques standards de
modélisation (3D, VRML) et d’animation graphique 3D accessible via les supports informatique
usuelles.
Ce Projet de recherche a donc eu pour objectif d’offrir un outil gestuel d’accès à l’information en
vue de favoriser un meilleur développement institutionnel, culturel et social de la communauté des
Sourds en Algérie.