INTELLIGENCE ARTIFICIELLE
No Thumbnail Available
Date
2007
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
l'intelligence Artificielle (IA) continue de connaître des développements importants dans le
domaine de la modélisation des processus cognitifs. Un des axes intéressant de ces
développements est l’orientation vers les approches hybrides qui incorporent plusieurs
paradigmes dans un même système.
Les modèles de Markov cachés (HMM – Hidden Markov Models) sont de nos jours l’approche la plus
utilisée en reconnaissance de la parole. Pourtant, ils souffrent de nombreuses hypothèses contraignantes
parmi lesquelles le fait que les vecteurs acoustiques sont supposés non corrélés ou encore l’hypothèse
sur la distribution des densités de probabilités de chaque état HMM (distributions discrètes ou multi gaussiennes). Ces hypothèses peuvent être contournées en utilisant un perceptron multi-couches (MLP
– Multi Layer Perceptrons). Ce réseau de neurones estime les probabilités a posteriori utilisées par
chaque état des HMM. Les modèles hybrides HMM/MLP ont déjà été utilisés avec succès pour
l’Anglais britannique et américain aussi bien que pour le Français. Dans ce travail, nous rapportons les
résultats obtenus des modèles hybrides HMM/MLP utilisés pour l’entraînement et la reconnaissance de
la parole Arabe isolée sur une base personnelle qui permet de rejoindre les capacités discriminantes, la
résistance au bruit des MLP et la souplesse des HMM afin d’obtenir de meilleures performances que
les HMM classiques. De très bons résultats du système hybride ont été obtenus par rapport à un
reconnaisseur classique utilisant les HMM discrets.
De nombreuses expériences ont déjà montré qu’une forte amélioration du taux de reconnaissance des
systèmes HMM (Modèles de Markov cachés) traditionnels est observée lorsque plus de données
d’entraînement sont utilisées. En revanche, l’augmentation du nombre de données d’entraînement pour
les modèles hybrides HMM/ANN (Modèles de Markov cachés/Réseaux de neurones artificiels)
s’accompagne d’une forte augmentation du temps nécessaire à l’entraînement des modèles mais pas ou
peu des performances du système. Pour pallier cette limitation, nous rapportons dans ce travail les
résultats obtenus avec une nouvelle méthode d’entraînement basée sur la fusion de données. Cette
méthode a été appliquée dans un système de reconnaissance de la parole arabe. Ce dernier est basé
d’une part, sur une segmentation floue (application de l’algorithme c-moyennes floues) et d’une autre
part, sur une segmentation à base des algorithmes génétiques. L’intégration de ces algorithmes dans le
reconnaisseur hybride a offert une amélioration significative de la performance du système hybride
proposé.