La fouille de données audio
No Thumbnail Available
Date
2013
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Résumé
La diffusion et la distribution de la musique en ligne devenant de plus en plus importantes.
Les bases de données commerciales et personnelles, augmentent de façon considérable. Il est
devenu nécessaire de disposer d’outilspermettantdeclasse retd’accéderàcesbasesen
effectuant des analyses par le contenu musical.
Le travail présenté dans notre thèse consiste à savoir, en ces temps où il est coutume de dire
que les goûts de nos jeunes sontmédiocres,sivraimentleschanteursqu’ilspré fèrent ne
disposent pas de grandes qualités vocales, ce travail entre dans le cadre de fouille de données
audio incluant des données hétérogènes. Le travail peut être divisé en deux parties.
Pour la première partie nous traitons les données audio pour faire une classification des voix
des chanteurs algériens. Il existe deux catégories de classification des voix chantées (type et
qualité), chaque catégorie dispose de plusieurs classes. Dans ce cadre nous avons proposé
trois systèmes pour la classification des voix chantées.
Pour le première système nousavonsproposéd’utilis er un vecteur de 130 paramètres avec les
GMM « Gaussian Mixture Models », dans le deuxième système nous avons proposé un
algorithme de sélection des caractéristiques et de nombre de gaussienne et dans le troisième
système nous avons proposé d’utiliser un vecteur de caractéristiques qui contient les
descripteurs de MPEG-7 + les descripteurs Non-MPEG-7 et T2 FGMMs « Type 2 Fuzzy
Gaussian Mixture Models » pour la modélisation et la classification. En utilisant les résultats
de la classification des voix chantées avec les statistiques sur chaque chanteur une nouvelle
base de données a était créée.
La deuxième partie du travail consiste à fouiller les données pour répondre à notre question de
départ « est ce que les goûts de nos jeunes sont médiocres ». Dans cette partie nous avons
proposé une nouvelle méthode de fouille de données, basé sur les arbres de décision et
appelée : Multi Decision Tree (MDT). Finalement, nous avons utilisé la méthode MDT pour
fouiller notre base de données