Supercapacitors based on nanostructured materials
No Thumbnail Available
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Université Badji Mokhtar Annaba
Abstract
Les avancées technologiques et les énormes capacités de stockage de données ont rendu disponible de grands ensemble de données audio. La parole prend une place prépondérante dans ces données, toutefois, l’exploitation de ces données nécessite le développement d’outils adéquats, car ces données sont le plus souvent des données brutes ni étiquetées ni annotées, et qui contiennent beaucoup de bruit, de diverses natures. Une des applications possibles pour tirer profit de ces données est la détection de mots clés qui pourrait participer à la construction de systèmes de recherche d’information, ou de pilotage de système automatique telle que la commande vocale. Dans ce contexte, ce travail propose une approche non supervisée pour la détection de mots clés dans un flux audio. Notre objectif est de créer un système automatique capable de reconnaître des mots-clés spécifiques sans avoir besoin de données préétiquetées. De cette problématique se sont détachées deux propositions,. La première s’inscrit dans l’approche classique qui s’adosse exclusivement sur l’aspect acoutsitque du signal. Ici, dans la phase de détection, un algorithme de calcul dynamique de distance est utilisé pour mesurer la similarité entre chaque segment parole du flux à prospecter et le mot clé à rechercher. La seconde proposition tire profit des nouvelles méthodes issues du deep learning. Ici, nous proposons une nouvelle méthode non supervisée qui se base sur les techniques du traitement d’image et de la vision par ordinateur portée par un réseau de neurones convolutionnel, pour permettre la détection non supervisée de mots à rechercher qui ne sont pas connus d’avance par le système. Des expériences sont menées pour évaluer nos propositions aussi bien sur le corpus parole proposé par l’association internationale de phonétique (IPA) que sur le très célebre Google Speech Command corpus. Les résultats que nous avons obtenu sont prometteurs et ouvrent la voie à d’autres expérimentations qui adressent le manque d’étiquettage et d’annotation des données parole.
Description
Keywords
détection de mots clés parlés; réseau de neurones convolutionnel (CNN); approche non supervisée