INTELLIGENCE ARTIFICIELLE

No Thumbnail Available
Date
2007
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
l'intelligence Artificielle (IA) continue de connaître des développements importants dans le domaine de la modélisation des processus cognitifs. Un des axes intéressant de ces développements est l’orientation vers les approches hybrides qui incorporent plusieurs paradigmes dans un même système. Les modèles de Markov cachés (HMM – Hidden Markov Models) sont de nos jours l’approche la plus utilisée en reconnaissance de la parole. Pourtant, ils souffrent de nombreuses hypothèses contraignantes parmi lesquelles le fait que les vecteurs acoustiques sont supposés non corrélés ou encore l’hypothèse sur la distribution des densités de probabilités de chaque état HMM (distributions discrètes ou multi gaussiennes). Ces hypothèses peuvent être contournées en utilisant un perceptron multi-couches (MLP – Multi Layer Perceptrons). Ce réseau de neurones estime les probabilités a posteriori utilisées par chaque état des HMM. Les modèles hybrides HMM/MLP ont déjà été utilisés avec succès pour l’Anglais britannique et américain aussi bien que pour le Français. Dans ce travail, nous rapportons les résultats obtenus des modèles hybrides HMM/MLP utilisés pour l’entraînement et la reconnaissance de la parole Arabe isolée sur une base personnelle qui permet de rejoindre les capacités discriminantes, la résistance au bruit des MLP et la souplesse des HMM afin d’obtenir de meilleures performances que les HMM classiques. De très bons résultats du système hybride ont été obtenus par rapport à un reconnaisseur classique utilisant les HMM discrets. De nombreuses expériences ont déjà montré qu’une forte amélioration du taux de reconnaissance des systèmes HMM (Modèles de Markov cachés) traditionnels est observée lorsque plus de données d’entraînement sont utilisées. En revanche, l’augmentation du nombre de données d’entraînement pour les modèles hybrides HMM/ANN (Modèles de Markov cachés/Réseaux de neurones artificiels) s’accompagne d’une forte augmentation du temps nécessaire à l’entraînement des modèles mais pas ou peu des performances du système. Pour pallier cette limitation, nous rapportons dans ce travail les résultats obtenus avec une nouvelle méthode d’entraînement basée sur la fusion de données. Cette méthode a été appliquée dans un système de reconnaissance de la parole arabe. Ce dernier est basé d’une part, sur une segmentation floue (application de l’algorithme c-moyennes floues) et d’une autre part, sur une segmentation à base des algorithmes génétiques. L’intégration de ces algorithmes dans le reconnaisseur hybride a offert une amélioration significative de la performance du système hybride proposé.
Description
Keywords
Citation