La recherche des paramétres de la trace acoustique et son application dans la reconnaissance de la parole

No Thumbnail Available
Date
2008
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
La première étape dans un système de reconnaissance automatique de la parole (RAP) est l’analyse acoustique et le traitement du signal qui transforment le signal parole en une séquence de vecteurs acoustiques, Cette représentation doit être adaptée pour la reconnaissance, on conservons dans les vecteurs acoustiques que l' information lexicale et de supprimer toutes autres informations, telles que variabilité intra et interlocuteur, les bruit ambiants etc. La représentation utilisée généralement en reconnaissance est basée sur des coefficients cepstraux (LPCC, MFCC, PLP). Bien que les coefficients cepstraux soient utilisés en raison de leurs propriétés de représentation, notamment la décorrélation des coefficients, ils souffrent de plusieurs limitations. En particulier ils sont sensibles aux conditions d’acquisition du signal et à l’environnement acoustique (problème de robustesse). A cause de cette sensibilité, la performance d’un système RAP est dégradée, elle est encore plus dégradée quand les conditions de l’apprentissage et de l’utilisation du système sont différentes. Le but de ce travail est d’étudier et de mettre en œuvre des paramètres (représentations) robustes aux différences entre les conditions acoustiques d’apprentissage et d’évolution. Ces paramètres seront évalués sur un système de reconnaissance automatique des chiffres arabe. Une attention particulière sera prêtée aux méthodes d’extractions des paramètres robustes (CMS, CGN, RASTAPLP, MBLPCC, LPC MFCC).
Description
Keywords
Citation