Approche Hybride pour la Reconnaissance de la Parole
No Thumbnail Available
Date
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Le développement de systèmes de reconnaissance de la
parole continue et à grand vocabulaire nécessite la
disponibilité de grands corpus vocaux segmentés et étiquetés en
petites unités (généralement des phonèmes). La langue Arabe
étant une langue peu dotée de ressources, la segmentation
automatique du signal de la parole semble une bonne
alternative pour rendre de telles ressources disponibles. Dans
notre travail, notre principale contribution consiste à réaliser
un système de segmentation automatique en vue de construire
un corpus annoté pour une fin de construction d’un système de
reconnaissance. Dans cette approche, les modèles de Markov
cachés génèrent les segments phonétiques avec leurs frontières
et les SVMs (Support Vector Machines) corrigent ces frontières
et éventuellement leurs étiquettes. Enfin, pour valider cette
approche nous avons construit un corpus de parole appelé
« ArabPhone ». les résultats obtenus sont encourageants et
peuvent être améliorés en considérant les spécificités de la
langue Arabe.