La recherche des paramétres de la trace acoustique et son application dans la reconnaissance de la parole
No Thumbnail Available
Date
2008
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
La première étape dans un système de reconnaissance automatique de la parole (RAP) est
l’analyse acoustique et le traitement du signal qui transforment le signal parole en une
séquence de vecteurs acoustiques, Cette représentation doit être adaptée pour la
reconnaissance, on conservons dans les vecteurs acoustiques que l' information lexicale et
de supprimer toutes autres informations, telles que variabilité intra et interlocuteur, les
bruit ambiants etc.
La représentation utilisée généralement en reconnaissance est basée sur des coefficients
cepstraux (LPCC, MFCC, PLP). Bien que les coefficients cepstraux soient utilisés en
raison de leurs propriétés de représentation, notamment la décorrélation des coefficients,
ils souffrent de plusieurs limitations. En particulier ils sont sensibles aux conditions
d’acquisition du signal et à l’environnement acoustique (problème de robustesse). A cause
de cette sensibilité, la performance d’un système RAP est dégradée, elle est encore plus
dégradée quand les conditions de l’apprentissage et de l’utilisation du système sont
différentes. Le but de ce travail est d’étudier et de mettre en œuvre des paramètres
(représentations) robustes aux différences entre les conditions acoustiques d’apprentissage
et d’évolution. Ces paramètres seront évalués sur un système de reconnaissance
automatique des chiffres arabe. Une attention particulière sera prêtée aux méthodes
d’extractions des paramètres robustes (CMS, CGN, RASTAPLP, MBLPCC, LPC MFCC).