Detection et identification des occlusives a l'aide de la transformee en ondelettes.

Auteurs
Date de publication
1995
Type de publication
Thèse
Résumé Le travail presente dans cette these s'insere dans le cadre du decodage acoustico-phonetique de la parole. Dans ce cadre, deux etapes ont ete dissociees: la detection et la reconnaissance des occlusives du francais a l'aide de la transformee en ondelettes. Dans une etape de detection, nous avons cherche a approximer la barre d'explosion des occlusives par une impulsion. La validation de ce modele s'effectue en analysant les fonctions de correlation entre le module de la transformee en ondelettes du signal de parole et celui de l'ondelette analysante. Pour les occlusives sourdes (respectivement sonores), un taux de detection egal a 89,5% (respectivement 67,6%) est associe a un taux de fausses alarmes de 10,5% (respectivement 32,4%). L'interet de notre systeme de detection est double. Il permet d'une part, la localisation de la barre d'explosion avec une erreur comprise entre 0,2 ms et 1 ms selon la structure frequentielle de l'occlusive. D'autre part, il permet de mesurer le caractere plus ou moins impulsionnel de l'occlusive. Bien que robuste, le systeme de detection s'avere moins performant pour des signaux bruites. Une reduction prealable du niveau du bruit de fond n'ameliore pas systematiquement les taux de detection. Utilisant la detection de la barre d'explosion, le systeme de reconnaissance repose sur l'analyse statistique de la moyenne des coefficients d'ondelettes sur un support temporel egal a une milliseconde. Trois analyses ont ete evaluees: l'analyse discriminante, les arbres de segmentation et les arbres de vraisemblance maximale. L'analyse discriminante se caracterise par un taux d'identification superieure a 74% pour une reconnaissance contextuelle. De plus, elle permet de reconnaitre 70% des fausses detections du module de detection. En raison de l'evaluation et des performances de chacune de ces methodes, seuls les taux de reconnaissance de cette analyse sont compares a ceux de dix systemes decrits dans la litterature. Pour un intervalle de confiance egal a 99%, sept presentent des performances non significativement differentes. Cette comparaison demontre que le lissage frequentiel haute frequence de la transformee en ondelettes n'est pas comme on aurait pu le supposer, un handicap majeur pour la reconnaissance des occlusives sourdes.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr