Séparation et classification des sources audio
No Thumbnail Available
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Université Badji Mokhtar Annaba
Abstract
La reconnaissance des sons est devenue un domaine de recherche très actif ces dernières années, et elle soulève de nombreuses problématiques. Comme tout problème de reconnaissance, le choix des méthodes d‘extraction de caractéristiques et de classification est l’un des problèmes les plus posés par ces systèmes car un bon choix de ces dernières influence positivement tout le système, et inversement. Le choix d’une méthode donnée dans un système de reconnaissance se fait soit selon des travaux antérieurs issus de l’état de l’art, ou bien par expérimentation en tenant compte des critères imposés par l’application visée ce qui conduit à enrichir l’état de l’art de nouveau. Les domaines d’application de la reconnaissance des sons sont divers et multiples, et un point commun pour la plupart d’entre eux est la télésurveillance. En effet, la télésurveillance peut avoir lieu soit à l’intérieur, ou à l’extérieur, et c’est le premier cas qui nous intéresse et plus précisément la télésurveillance des personnes âgées ou handicapés vivant seules. La mise à disposition d’un système de télésurveillance audio pour cette catégorie est d’une grande importance et c’est l’objet de cette thèse. Par ailleurs, synthétiser des travaux antérieurs, étudier les sons qui peuvent avoir lieu dans un appartement, la recherche de méthodes appropriées pour la reconnaissance des sons et l’étude de la faisabilité des méthodes issues des domaines voisins, notamment la reconnaissance de la parole et de la musique, font aussi partie des objectifs principaux de ce travail. En effet, Nous effectuons une étude comparative des travaux existants puis nous présentons l’architecture du système de reconnaissance des sons, mais avant de se faire, un corpus de sons de la vie courante est proposé. Les machines à vecteurs support (SVM) constituent notre premier centre d’intérêt vu leur puissance de séparation des différentes classes, combinés avec des paramètres acoustiques basés sur les MFCC (Mel Frequency Cepstral Coefficients). Le choix des SVM comme méthode de classification est le résultat d’une étude sur des travaux antérieurs où, vis-à-vis de notre application, le compromis entre la complexité des algorithmes et les performances du système est l’un des critères les plus notables. De plus, la plupart des applications pour la maison intelligente sont intégrées dans un produit matériel dont la puissance de calcul ne peut pas correspondre à celle d'un PC. Dans un premier temps, nous nous sommes intéressés à la construction d’une base de données pour les sons de la vie courante dans un habitat en partant du problème de l’absence d’une base de données standard. Cependant, dans un objectif de comparaison avec d’autres travaux une autre base de données a été utilisée. Les
expérimentations réalisées dans cette thèse montrent l’efficacité des SVM et les MFCC pour la reconnaissance des sons de la vie courante qui sont de nature très diversifiés, et malgré que les tests effectués restent perfectibles vu la taille limitée de la base de données utilisée, ils sont encourageants et ouvrent la voie à plusieurs autres travaux et voire d’autres sujets de recherche.
Description
Keywords
reconnaissance de sons; télésurveillance