Amélioration du signal de la parole par les filtres de Kalman
No Thumbnail Available
Date
2022-04-02
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Les algorithmes d’amélioration de la parole ont été utilisés avec succès dans
nombreux domaines tels que les téléphones portables, les téléphones mains
libres, la téléconférence, la communication dans la cabine de voiture, les pro thèses auditives et les services vocaux automatisés basés sur la reconnaissance
et la synthèse de la parole.
Des nombreuses approches sont présentées dans la littérature. Cette thèse
se concentre sur l’amélioration de la parole dégradée par un bruit blanc ou un
bruit coloré d’un seul canal de réception (réception par mono-capteur).
Dans ce travail, nous sommes concernés par une nouvelle conception de
filtrage de Kalman itératif où les paramètres d’un modèle prédictif linéaire
sont estimés à partir d’un signal de parole bruité. Cependant, lorsque le seul
signal disponible est corrompu par un bruit, les performances d’amélioration
du filtre de Kalman dépendent de la précision des estimations des coefficients
de prédiction linéaire (LPCs) et de la variance d’excitation. Néanmoins, on
sait que l’analyse de la parole par la prédiction linéaire (LPC) est sensible à
la présence de bruit additif.
Pour surmonter ce problème, nous présentons une analyse et une appli cation de la méthode d’amélioration des formants (FEM) basée sur les co efficients LPC en modifiant le spectre d’amplitude logarithmique du modèle
LPC puis en réévaluant les nouveaux LPCs pour les implémenter au filtre de
Kalman. Ces derniers LPCs sont des indicateurs utiles de la performance du
filtre de Kalman.
Dans les algorithmes ci-dessus, le modèle vocal est supposé linéaire. Les
modèles du signal de parole non linéaires sont également considérés dans cette
thèse. Pour résoudre le problème du modèle non linéaire, nous étudions deux
algorithmes d’amélioration (entraînement au filtre Kalman étendu et au filtre
de Kalman non parfumé (UKF) d’un perceptron multicouche (MLP)).
Nos expériences d’amélioration utilisent le corpus vocal NOIZEUS où les
méthodes proposées atteignent des bons résultats (objectifs et subjectifs) en
comparant par des autres méthodes d’amélioration.