BAUDRY Marc

< Retour à ILB Patrimoine
Thématiques des productions
Affiliations
  • 1998 - 1999
    Université Rennes 1
  • 2003
  • 2002
  • 1999
  • 1995
  • Développement d'un système automatique de synthèse de la parole à partir du texte arabe standard voyellé.

    Sofiane BALOUL, Marc BAUDRY
    2003
    Le travail de cette thèse est une contribution à l'étude et au développement d'un système de synthèse de la parole à partir du texte arabe standard voyellé basé sur le diphone. Cette contribution intervient à différents niveaux de ce système : construction de la base acoustique, analyse syntaxique, conversion graphème-phonème et génération de la prosodie. L'analyse morpho-syntaxique implémentée repose sur l'utilisation d'un lexique partiel, l'étiquetage par défaut et la propagation de déductions contextuelles. Elle permet le découpage du texte en tronçons (intermédiaires entre le mot et la phrase) non récursifs. L'interface syntaxe-prosodie permet ensuite de distribuer les pauses et de générer les paramètres prosodiques de hauteur et de durée. L'ensemble de ces traitements est intégré dans le système multilingue de synthèse de la parole à partir du texte de la société Elan Speech.
  • Proposition d'un schéma d'analyse/synthèse adaptatif dans le plan temps-fréquence basé sur des critères entropiques : application au codage audio par transformée.

    Gilles GONON, Marc BAUDRY, Silvio MONTRESOR
    2002
    Les représentations adaptées contribuent à l'étude et au traitement des informations portées par les signaux en permettant une analyse pertinente différente pour chaque signal. Ce travail de thèse porte sur l'élaboration d'une représentation utilisant successivement des segmentations temporelle et fréquentielle adaptées au signal plus souple que les solutions existantes. Ce schéma est appliqué dans un codeur perceptuel par transformée de type haute fidélité. Le signal est d'abord segmenté temporellement. Le critère utilisé est basé sur un estimateur d'entropie locale, dont il fournit un indice des variations, propice à une segmentation automatique séparant les zones transitoires et les zones stationnaires. Les tranches temporelles ainsi délimitées sont alors décomposées en paquets d'ondelettes et une recherche de la meilleure base permet l'adaptation en fréquence de la représentation. Une extension de la recherche de meilleure base est proposée pour augmenter le dictionnaire des bases disponibles par rapport au cas dyadique. À l'issue de cette analyse le signal est localisé dans des atomes du plan temps-fréquence. Un codeur d'architecture orginale incluant notre représentation est ensuite présenté, ainsi que le détail de son implémentation. Ce codeur est évalué par des tests subjectifs comparant les sons compressés aux originaux et au standard MPEG1-III pour un débit de 96 kbit/s. Les résultats montrent que l'utilisation du schéma de représentation adapté dans un codeur est compétitif avec les solutions des codeurs standards alors que de nombreuses améliorations sont possibles.
  • Les options : applications à l'économie des ressources et de l'environnement.

    Marc BAUDRY, Christian MOUTON
    1999
    De nombreuses politiques environnementales fonctionnent selon le principe de seuils de pollution au dela desquels sont declenchees des mesures de protection de l'environnement. Or, la theorie economique dit peu de choses quant a leur bien fonde. L'objet de ce travail est de combler cette lacune. La reconnaissance du role joue par les changements technologiques dans la lutte contre la pollution constitue le fil conducteur de la reponse proposee. La caracteristique majeure de ces changements est leur irreversibilite. Elle prend toute son importance lorsque la pollution consideree est une pollution de stock : une approche dynamique du probleme est donc proposee. Elle se double d'une approche stochastique destinee a integrer l'incertitude sur l'evolution de la pollution et de ses effets. Une premiere partie du travail est consacree a la presentation et a la discussion des outils utilises. Initialement developpee pour traiter des choix d'investissement, la recente theorie dite des <> s'avere etre un outil d'analyse particulierement adequat des questions d'irreversibilite et d'incertitude en matiere de ressources et d'environnement. Une synthese de la notion d'option reelle et de celles de quasi-valeur d'option et de prix d'option, plus anciennes et specifiques a l'economie des ressources et de l'environnement, est proposee. Elle permet de mieux dissocier les effets de l'irreversibilite de ceux de l'incertitude. Une fois ces precisions apportees, un modele justifiant l'utilisation de seuils de pollution d'un point de vue economique est developpe tout au long de laseconde partie. Le modele se distingue des modeles usuels d'options reelles par le fait que la decision consideree ici, le changement technologique, affecte l'evolution de la variable d'interet du probleme, la pollution. Les aspects technologiques et l'interet d'une taxe environnementale sont plus particulierement approfondis. Une application au cas de l'effet de serre illustre le propos.
  • Etude de la parametrisation du signal de parole a partir de representations en ondelettes.

    Christophe GERARD, Marc BAUDRY
    1995
    L'etape de parametrisation consiste a representer le signal par un jeu de parametres reduit, pertinent et robuste. Face a la transformee de fourier a court terme, les representations en ondelettes presentent des proprietes interessantes pour parametriser le signal de parole. L'objet de notre travail est donc de determiner l'apport des representations en ondelettes en reconnaissance de parole. Afin de valider nos parametrisations dans des systemes de reconnaissance existants, nous nous sommes replaces dans le cadre de l'analyse a trames de taille fixe. L'ondelette de morlet s'avere particulierement adaptee au signal traite, de part sa repartition frequentielle adaptable ainsi que sa localisation temps-frequence minimale en vertu du principe d'incertitude. Les parametrisations realisees sont constituees d'un seul coefficient energetique dans chaque bande de frequence, et pour chaque fenetre d'analyse. Plusieurs variantes ont ete testees: coefficient moyen ou maximum, decomposition en ondelettes discretes ou continues, echelle frequentielle logarithmique ou psychoacoustique, maximums synchrones ou asynchrones, domaine spectral ou pseudo-cepstral. La conclusion de notre etude permet d'etablir que les parametrisations en ondelettes mises en uvre sont, au plus, aussi robustes que les mfcc (mel frequency cepstrum coefficients). Plus precisement, il ressort que le cadre operatoire employe est trop reducteur pour mettre en exergue l'apport attendu des representations en ondelettes dans le cadre de la parametrisation. Meme si des ameliorations peuvent etre apportees aux parametrisations realisees, le cadre operatoire de predilection des representations en ondelettes reste l'analyse a duree variable, ce qui necessitera de developper des systemes de reconnaissances avec des architectures specifiques.
  • Detection et identification des occlusives a l'aide de la transformee en ondelettes.

    Francois MALBOS, Marc BAUDRY
    1995
    Le travail presente dans cette these s'insere dans le cadre du decodage acoustico-phonetique de la parole. Dans ce cadre, deux etapes ont ete dissociees: la detection et la reconnaissance des occlusives du francais a l'aide de la transformee en ondelettes. Dans une etape de detection, nous avons cherche a approximer la barre d'explosion des occlusives par une impulsion. La validation de ce modele s'effectue en analysant les fonctions de correlation entre le module de la transformee en ondelettes du signal de parole et celui de l'ondelette analysante. Pour les occlusives sourdes (respectivement sonores), un taux de detection egal a 89,5% (respectivement 67,6%) est associe a un taux de fausses alarmes de 10,5% (respectivement 32,4%). L'interet de notre systeme de detection est double. Il permet d'une part, la localisation de la barre d'explosion avec une erreur comprise entre 0,2 ms et 1 ms selon la structure frequentielle de l'occlusive. D'autre part, il permet de mesurer le caractere plus ou moins impulsionnel de l'occlusive. Bien que robuste, le systeme de detection s'avere moins performant pour des signaux bruites. Une reduction prealable du niveau du bruit de fond n'ameliore pas systematiquement les taux de detection. Utilisant la detection de la barre d'explosion, le systeme de reconnaissance repose sur l'analyse statistique de la moyenne des coefficients d'ondelettes sur un support temporel egal a une milliseconde. Trois analyses ont ete evaluees: l'analyse discriminante, les arbres de segmentation et les arbres de vraisemblance maximale. L'analyse discriminante se caracterise par un taux d'identification superieure a 74% pour une reconnaissance contextuelle. De plus, elle permet de reconnaitre 70% des fausses detections du module de detection. En raison de l'evaluation et des performances de chacune de ces methodes, seuls les taux de reconnaissance de cette analyse sont compares a ceux de dix systemes decrits dans la litterature. Pour un intervalle de confiance egal a 99%, sept presentent des performances non significativement differentes. Cette comparaison demontre que le lissage frequentiel haute frequence de la transformee en ondelettes n'est pas comme on aurait pu le supposer, un handicap majeur pour la reconnaissance des occlusives sourdes.
Les affiliations sont détectées à partir des signatures des publications identifiées dans scanR. Un auteur peut donc apparaître affilié à plusieurs structures ou tutelles en fonction de ces signatures. Les dates affichées correspondent seulement aux dates des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr