BACRY Emmanuel

< Retour à ILB Patrimoine
Affiliations
  • 2012 - 2019
    Détermination de Formes Et Identification
  • 2012 - 2019
    Centre de mathématiques appliquées
  • 1991 - 1992
    Université Paris Diderot
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2006
  • 1992
  • L'apprentissage automatique et les données de santé massives.

    Emmanuel BACRY, Stephane GAIFFAS
    Healthcare and Artificial Intelligence | 2020
    Pas de résumé disponible.
  • ZiMM : Un modèle d'apprentissage profond pour les rechutes à long terme et floues avec des données de réclamations non cliniques.

    Anastasiia KABESHOVA, Yiyang YU, Bertrand LUKACS, Emmanuel BACRY, Stephane GAIFFAS
    Journal of Biomedical Informatics | 2020
    Pas de résumé disponible.
  • Processus de Hawkes multivariés épars et à faible rang.

    Emmanuel BACRY, Martin BOMPAIRE, Stephane GAIFFAS, Jean francois MUZY
    Journal of Machine Learning Research | 2020
    Nous considérons le problème de dévoiler la structure implicite du réseau des interactions entre les nœuds (comme les interactions entre les utilisateurs dans un réseau social), en se basant uniquement sur des timestamps à haute fréquence. Notre inférence est basée sur la minimisation de la perte des moindres carrés associée à un modèle de Hawkes multivarié, pénalisé par L1 et la norme de trace du tenseur d'interaction. Nous fournissons une première analyse théorique pour ce problème, qui inclut la sparsité et les pénalisations induisant un faible rang. Ce résultat implique une nouvelle inégalité de concentration pour les martingales matricielles en temps continu avec une variance observable, qui est un résultat d'intérêt indépendant et un large éventail d'applications possibles puisqu'il étend aux martingales matricielles d'anciens résultats restreints au cas scalaire. L'une des conséquences de notre analyse est la construction de pénalisations L1 et de la norme de trace fortement ajustées, qui conduisent à une mise à l'échelle de la variabilité de l'information disponible pour chaque utilisateur en fonction des données. Des expériences numériques illustrent les améliorations significatives obtenues par l'utilisation de ces pénalisations basées sur les données.
  • SCALPEL3 : une bibliothèque open-source évolutive pour les bases de données de demandes de remboursement de soins de santé.

    Emmanuel BACRY, Stephane GAIFFAS, Fanny LEROY, Maryan MOREL, Dinh phong NGUYEN, Youcef SEBIAT, Dian SUN
    International Journal of Medical Informatics | 2020
    Pas de résumé disponible.
  • Différencier l'asthme de la bronchopneumopathie chronique obstructive (BPCO) dans les bases de données médico-économiques : mythe ou réalité ?

    Milka MARAVIC, Raphael SIGOGNE, Arnaud BOURDIN, Nicolas ROCHE, Sara MOUNIR, Dejan MILIC, Morgan GEOFFROY, Stephane GAIFFAS, Emmanuel BACRY
    Epidemiology | 2019
    Pas de résumé disponible.
  • Apprentissage automatique basé sur les processus de Hawkes et l'optimisation stochastique.

    Martin BOMPAIRE, Emmanuel BACRY, Stephane GAIFFAS, Alexandre GRAMFORT, Emmanuel BACRY, Stephane GAIFFAS, Alexandre GRAMFORT, Julien MAIRAL, Hansen NIELS RICHARD, Guillaume GARRIGOS, Julien MAIRAL, Hansen NIELS RICHARD
    2019
    Le fil rouge de cette thèse est l'étude des processus de Hawkes. Ces processus ponctuels décryptent l'inter-causalité qui peut avoir lieu entre plusieurs séries d'événements. Concrètement, ils déterminent l'influence qu'ont les événements d'une série sur les événements futurs de toutes les autres séries. Par exemple, dans le contexte des réseaux sociaux, ils décrivent à quel point l'action d'un utilisateur, par exemple un Tweet, sera susceptible de déclencher des réactions de la part des autres.Le premier chapitre est une brève introduction sur les processus ponctuels suivie par un approfondissement sur les processus de Hawkes et en particulier sur les propriétés de la paramétrisation à noyaux exponentiels, la plus communément utilisée. Dans le chapitre suivant, nous introduisons une pénalisation adaptative pour modéliser, avec des processus de Hawkes, la propagation de l'information dans les réseaux sociaux. Cette pénalisation est capable de prendre en compte la connaissance a priori des caractéristiques de ces réseaux, telles que les interactions éparses entre utilisateurs ou la structure de communauté, et de les réfléchir sur le modèle estimé. Notre technique utilise des pénalités pondérées dont les poids sont déterminés par une analyse fine de l'erreur de généralisation.Ensuite, nous abordons l'optimisation convexe et les progrès réalisés avec les méthodes stochastiques du premier ordre avec réduction de variance. Le quatrième chapitre est dédié à l'adaptation de ces techniques pour optimiser le terme d'attache aux données le plus couramment utilisé avec les processus de Hawkes. En effet, cette fonction ne vérifie pas l'hypothèse de gradient-Lipschitz habituellement utilisée. Ainsi, nous travaillons avec une autre hypothèse de régularité, et obtenons un taux de convergence linéaire pour une version décalée de Stochastic Dual Coordinate Ascent qui améliore l'état de l'art. De plus, de telles fonctions comportent beaucoup de contraintes linéaires qui sont fréquemment violées par les algorithmes classiques du premier ordre, mais, dans leur version duale ces contraintes sont beaucoup plus aisées à satisfaire. Ainsi, la robustesse de notre algorithme est d'avantage comparable à celle des méthodes du second ordre dont le coût est prohibitif en grandes dimensions.Enfin, le dernier chapitre présente une nouvelle bibliothèque d'apprentissage statistique pour Python 3 avec un accent particulier mis sur les modèles temporels. Appelée tick, cette bibliothèque repose sur une implémentation en C++ et les algorithmes d'optimisation issus de l'état de l'art pour réaliser des estimations très rapides dans un environnement multi-cœurs. Publiée sur Github, cette bibliothèque a été utilisée tout au long de cette thèse pour effectuer des expériences.
  • Dépistage des médicaments pour le risque de fracture osseuse : une étude longitudinale à l'échelle nationale utilisant la base de données nationale des demandes de remboursement du SNDS.

    Emmanuel BACRY
    International Journal of Population Data Science | 2019
    Pas de résumé disponible.
  • Modèles de Hawkes réactifs aux files d'attente pour le flux d'ordres.

    Peng WU, Marcello RAMBALDI, Jean francois MUZY, Emmanuel BACRY
    2019
    Pas de résumé disponible.
  • L'auto-exclusion chez les joueurs de poker en ligne : effet sur le temps et l'argent par rapport à des témoins appariés.

    A DUGRAVOT, Henri PANJO, Amine BENYAMINA, Stephane GAIFFAS, Emmanuel BACRY, Luquiens AMANDINE
    International Journal of Environmental Research and Public Health | 2019
    Pas de résumé disponible.
  • ConvSCCS : modèle convolutif de séries de cas auto-contrôlées pour la détection d'événements indésirables décalés.

    Maryan MOREL, Emmanuel BACRY, Stephane GAIFFAS, Agathe GUILLOUX, Fanny LEROY
    Biostatistics | 2019
    La disponibilité accrue de grandes bases de données de dossiers médicaux électroniques offre la possibilité d'améliorer le dépistage des risques sanitaires. La plupart des détections post-marketing des effets indésirables des médicaments (EIM) reposent sur les déclarations spontanées des médecins, ce qui entraîne une sous-déclaration. Pour relever ce défi, nous développons un modèle évolutif pour estimer l'effet de multiples caractéristiques longitudinales (exposition aux médicaments) sur un résultat longitudinal rare. Notre procédure est basée sur un modèle de régression conditionnelle de Poisson, également connu sous le nom de série de cas auto-contrôlée (SCCS). Pour surmonter la nécessité d'une spécification précise des périodes de risque, nous modélisons l'intensité des résultats en utilisant une convolution entre les expositions et les fonctions de pas, qui sont pénalisées en utilisant une combinaison de groupe-Lasso et de variation totale. À notre connaissance, il s'agit du premier modèle SCCS avec une intensité flexible capable de traiter plusieurs caractéristiques longitudinales dans un seul modèle. Nous montrons que cette approche améliore l'état de l'art en termes d'erreur absolue moyenne et de temps de calcul pour l'estimation des risques relatifs sur des données simulées. Nous appliquons cette méthode à un problème de détection d'EIM, en utilisant une cohorte de patients diabétiques extraite de la grande base de données nationale française de l'assurance maladie (SNIIRAM), une base de données de réclamations contenant les remboursements médicaux de plus de 53 millions de personnes. Ce travail a été réalisé dans le cadre d'un partenariat de recherche entre l'Ecole Polytechnique et la CNAMTS (en charge du SNIIRAM).
  • Démêler et quantifier les contributions des participants au marché à la volatilité.

    Marcello RAMBALDI, Emmanuel BACRY, Jean francois MUZY
    Quantitative Finance | 2019
    Pas de résumé disponible.
  • L'auto-exclusion chez les joueurs de poker en ligne : Effets sur les dépenses en temps et en argent par rapport à des témoins appariés.

    Amandine LUQUIENS, Aline DUGRAVOT, Henri PANJO, Amine BENYAMINA, Stephane GAIFFAS, Emmanuel BACRY
    International Journal of Environmental Research and Public Health | 2019
    Aucune donnée comparative n'est disponible pour rendre compte de l'effet de l'auto-exclusion en ligne. L'objectif de cette étude était d'évaluer l'effet de l'auto-exclusion dans les jeux de poker en ligne par rapport à des témoins appariés, après la fin de la période d'auto-exclusion. Méthodes : Nous avons inclus tous les joueurs qui se sont auto-exclus pour la première fois sur une période de 7 ans (n = 4887) sur un site de poker, et des joueurs appariés pour le sexe, l'âge et la durée du compte (n = 4451). Nous rapportons les effets dans le temps de l'auto-exclusion après sa fin, sur l'argent (pertes nettes) et le temps passé (durée de la session) en utilisant une procédure d'analyse de variance entre modèles mixtes avec et sans l'interaction du temps et de l'auto-exclusion. Les analyses ont été effectuées sur l'ensemble de l'échantillon, sur les sous-groupes les plus impliqués en termes de temps ou d'argent (quartiles supérieurs) et parmi les auto-exclus de courte durée (<3 mois). Résultats : Des effets significatifs de l'auto-exclusion et de l'auto-exclusion de courte durée ont été trouvés pour l'argent et le temps passé sur 12 mois. Parmi les joueurs les plus impliqués financièrement, aucun effet significatif sur le montant dépensé n'a été trouvé. Parmi les joueurs qui étaient les plus impliqués en termes de temps, un effet significatif a été trouvé sur le temps passé. Les auto-exclusions de courte durée n'ont pas montré d'effet significatif sur les joueurs les plus impliqués. Conclusions : L'auto-exclusion semble efficace à long terme. Cependant, l'effet sur l'argent dépensé des auto-exclusions et des auto-exclusions de courte durée devrait être étudié plus en détail chez les joueurs les plus impliqués.
  • Différencier l'asthme de la bronchopneumopathie chronique obstructive (BPCO) dans les bases de données médico-économiques : mythe ou réalité ?

    Milka MARAVIC, Raphael SIGOGNE, Nicolas ROCHE, Sarah MOUNIR, Dejan MILIC, Morgan GEOFFROY, Stephane GAIFFAS, Emmanuel BACRY, Arnaud BOURDIN
    ERS International Congress | 2019
    Pas de résumé disponible.
  • SCALPEL3 : une bibliothèque open-source évolutive pour les bases de données de demandes de remboursement de soins de santé.

    Emmanuel BACRY, Stephane GAIFFAS, Maryan MOREL, D.p. NGUYEN, Youcef SEBIAT, Dian SUN, Fanny LEROY
    2019
    Pas de résumé disponible.
  • ZiMM : un modèle d'apprentissage profond pour les événements indésirables à long terme avec des données de réclamations non cliniques.

    Emmanuel BACRY, Stephane GAIFFAS, Anastasiia KABESHOVA, Yiyang YU
    2019
    Pas de résumé disponible.
  • Optimisation double pour les objectifs contraints convexes sans les hypothèses de gradient-Lipschitz.

    Stephane GAIFFAS, Martin BOMPAIRE, Emmanuel BACRY
    2019
    Pas de résumé disponible.
  • ConvSCCS : modèle convolutif de cas-séris auto-contrôlé pour la détection d'événements adverses décalés.

    Maryan MOREL, Emmanuel BACRY, Stephane GAIFFAS, Agathe GUILLOUX, Fanny LEROY
    Biostatistics | 2019
    Pas de résumé disponible.
  • Découverte de la causalité à partir de cumulants intégrés de Hawkes multivariés.

    Massil ACHAB, Emmanuel BACRY, Stephane GAIFFAS, Jean francois MUZY, Iacopo MASTROMATTEO
    Journal of Machine Learning Research | 2018
    Nous concevons une nouvelle méthode non paramétrique qui permet d'estimer la matrice des noyaux intégrés d'un processus de Hawkes multivarié. Cette matrice encode non seulement les influences mutuelles de chaque nœud du processus, mais démêle également les relations de causalité entre eux. Notre approche est la première qui conduit à une estimation de cette matrice sans aucune modélisation paramétrique ni estimation des noyaux eux-mêmes. Par conséquent, elle peut donner une estimation des relations de causalité entre les nœuds (ou les utilisateurs), sur la base de l'horodatage de leurs activités (sur un réseau social par exemple), sans connaître ou estimer la forme de la durée de vie des activités. Dans ce but, nous introduisons une méthode d'appariement des moments qui s'adapte aux cumulants intégrés d'ordre 2 et 3 du processus. Une analyse théorique nous permet de prouver que cette nouvelle technique d'estimation est cohérente. De plus, nous montrons, par des expériences numériques, que notre approche est en effet très robuste par rapport à la forme des noyaux et donne des résultats intéressants sur la base de données MemeTracker et sur les données du carnet d'ordres financier.
  • Description et évaluation de la fiabilité des motifs d'auto-exclusion déclarés par les joueurs de poker en ligne dans une cohorte utilisant des données de jeu basées sur les comptes.

    Amandine LUQUIENS, Delphine VENDRYES, Henri jean AUBIN, Amine BENYAMINA, Stephane GAIFFAS, Emmanuel BACRY
    BMJ Open | 2018
    Pas de résumé disponible.
  • Inégalités de concentration pour les martingales matricielles en temps continu.

    Emmanuel BACRY, Stephane GAIFFAS, Jean francois MUZY
    Probability Theory and Related Fields | 2017
    Pas de résumé disponible.
  • Apprentissage statistique pour s?quences d??v?nements ? l?aide de processus ponctuels.

    Massil ACHAB, Emmanuel BACRY, St?phane GA?FFAS, Nicolas VAYATIS, Emmanuel BACRY, St?phane GA?FFAS, Vincent RIVOIRARD, Manuel GOMEZ RODRIGUEZ, Nils richard HANSEN
    2017
    Le but de cette th?se est de montrer que l'arsenal des nouvelles m?thodes d'optimisation permet de r?soudre des probl?mes d'estimation difficile bas?s sur les mod?les d'?v?nements.Alors que le cadre classique de l'apprentissage supervis? traite les observations comme une collection de couples de covariables et de label, les mod?les d'?v?nements ne regardent que les temps d'arriv?e d'?v?nements et cherchent alors ? extraire de l'information sur la source de donn?e.Ces ?v?nements dat?s sont ordonn?s de fa?on chronologique et ne peuvent d?s lors ?tre consid?r?s comme ind?pendants.Ce simple fait justifie l'usage d'un outil math?matique particulier appel? processus ponctuel pour apprendre une certaine structure ? partir de ces ?v?nements.Deux exemples de processus ponctuels sont ?tudi?s dans cette th?se.Le premier est le processus ponctuel derri?re le mod?le de Cox ? risques proportionnels:son intensit? conditionnelle permet de d?finir le ratio de risque, une quantit? fondamentale dans la litt?rature de l'analyse de survie.Le mod?le de r?gression de Cox relie la dur?e avant l'apparition d'un ?v?nement, appel? d?faillance, aux covariables d'un individu.Ce mod?le peut ?tre reformul? ? l'aide du cadre des processus ponctuels.Le second est le processus de Hawkes qui mod?lise l'impact des ?v?nements pass?s sur la probabilit? d'apparition d'?v?nements futurs.Le cas multivari? permet d'encoder une notion de causalit? entre les diff?rentes dimensions consid?r?es.Cette th?se est divis?e en trois parties.La premi?re s'int?resse ? un nouvel algorithme d'optimisation que nous avons d?velopp?.Il permet d'estimer le vecteur de param?tre de la r?gression de Cox lorsque le nombre d'observations est tr?s important.Notre algorithme est bas? sur l'algorithme SVRG (Stochastic Variance Reduced Gradient) et utilise une m?thode MCMC (Monte Carlo Markov Chain) pour approcher un terme de la direction de descente.Nous avons prouv? des vitesses de convergence pour notre algorithme et avons montr? sa performance num?rique sur des jeux de donn?es simul?s et issus de monde r?el.La deuxi?me partie montre que la causalit? au sens de Hawkes peut ?tre estim?e de mani?re non-param?trique gr?ce aux cumulants int?gr?s du processus ponctuel multivari?.Nous avons d?velopper deux m?thodes d'estimation des int?grales des noyaux du processus de Hawkes, sans faire d'hypoth?se sur la forme de ces noyaux. Nos m?thodes sont plus rapides et plus robustes, vis-?-vis de la forme des noyaux, par rapport ? l'?tat de l'art. Nous avons d?montr? la consistence statistique de la premi?re m?thode, et avons montr? que la deuxi?me peut ?tre r?duite ? un probl?me d'optimisation convexe.La derni?re partie met en lumi?re les dynamiques de carnet d'ordre gr?ce ? la premi?re m?thode d'estimation non-param?trique introduite dans la partie pr?c?dente.Nous avons utilis? des donn?es du march? ? terme EUREX, d?fini de nouveaux mod?les de carnet d'ordre (bas?s sur les pr?c?dents travaux de Bacry et al.) et appliqu? la m?thode d'estimation sur ces processus ponctuels.Les r?sultats obtenus sont tr?s satisfaisants et coh?rents avec une analys? ?conom?trique.Un tel travail prouve que la m?thode que nous avons d?velopp? permet d'extraire une structure ? partir de donn?es aussi complexes que celles issues de la finance haute-fr?quence.
  • Concentration pour les martingales matricielles en temps continu et activité microscopique des réseaux sociaux.

    Emmanuel BACRY, Stephane GAIFFAS, J. f. MUZY
    Probability Theory and Related Fields | 2017
    Pas de résumé disponible.
  • Le rôle du volume dans la dynamique du carnet de commandes : une analyse multivariée du processus de Hawkes.

    Marcello RAMBALDI, Emmanuel BACRY, Fabrizio LILLO
    Quantitative Finance | 2016
    Nous montrons que les processus de Hawkes multivariés, couplés à la procédure d'estimation non paramétrique non paramétrique proposée pour la première fois par Bacry et Muzy (2015). Nous montrons que les processus multivariés de Hawkes couplés à la procédure d'estimation non paramétrique ordres et leur taille, observées dans un marché à carnet d'ordres limité. Nous appliquons cette Nous appliquons cette méthodologie aux données du carnet d'ordres à haute fréquence des contrats à terme négociés à EUREX. Plus précisément, nous démontrons comment cette approche permet non seulement d'analyser l'interaction entre les différents types d'ordres (ordres au marché, ordres à cours limité annulations) mais aussi d'inclure d'autres quantités pertinentes, telles que la taille de l'ordre, dans l'analyse. l'analyse, en montrant également que les modèles simples supposant l'indépendance entre le volume et le temps ne conviennent pas. l'indépendance entre le volume et le temps ne sont pas appropriés pour décrire les données.
  • Inférence du champ moyen des processus du point de Hawkes.

    Emmanuel BACRY, Stephane GAIFFAS, Iacopo MASTROMATTEO, Jean francois MUZY
    Journal of Physics A: Mathematical and Theoretical | 2016
    Nous proposons une méthode d'estimation rapide et efficace qui est capable de les paramètres d'un processus ponctuel de Hawkes de dimension d à partir d'un ensemble d'observations. d'observations. Nous exploitons une approximation du champ moyen qui est valable lorsque les fluctuations de l'intensité stochastique sont faibles. Nous montrons que c'est notamment le cas dans les situations où les interactions sont suffisamment faibles, lorsque la dimension du système est élevée ou lorsque les fluctuations s'auto-entretiennent en raison du grand nombre d'événements passés. en raison du grand nombre d'événements passés qu'elles impliquent. Dans un tel régime, l l'estimation d'un processus de Hawkes peut être ramenée à un problème de moindres carrés pour lequel nous fournissons une solution analytique. pour lequel nous fournissons une solution analytique. Bien que cet estimateur soit biaisé, nous montrons que sa précision peut être comparable à celle de l'estimateur du processus de Hawkes. que sa précision peut être comparable à celle de l'estimateur du maximum de vraisemblance tout en tandis que sa vitesse de calcul est considérablement améliorée. Nous Nous donnons un contrôle théorique sur la précision de notre nouvelle approche et illustrons Nous donnons un contrôle théorique sur la précision de notre nouvelle approche et illustrons son efficacité en utilisant des ensembles de données synthétiques, afin d'évaluer l'erreur l'erreur d'estimation statistique des paramètres.
  • Estimation des noyaux de Hawkes à décroissance lente : application à la dynamique du carnet d'ordres à haute fréquence.

    Emmanuel BACRY, Thibault JAISSON, Jean francois MUZY, Jean-francois MUZY
    Quantitative Finance | 2016
    Nous présentons une version modifiée de la procédure d'estimation non paramétrique du noyau de Hawkes étudiée dans Bacry et Muzy [arXiv:1401.0903, 2014] qui est adaptée aux noyaux lentement décroissants. Nous montrons sur des simulations numériques impliquant un nombre raisonnable d'événements que cette méthode permet d'estimer fidèlement un noyau décroissant en loi de puissance sur au moins six décennies. Nous proposons ensuite un modèle de Hawkes à huit dimensions pour tous les événements associés au premier niveau d'un carnet d'ordres d'actifs. L'application de notre procédure d'estimation à ce modèle nous permet de découvrir les principales propriétés de la dynamique couplée des ordres de négociation, de limite et d'annulation en relation avec les variations du prix moyen.
  • Statistiques du premier et du second ordre : caractérisation des processus de Hawkes et estimation non paramétrique.

    Emmanuel BACRY, Jean francois MUZY
    IEEE Transactions on Information Theory | 2016
    Pas de résumé disponible.
  • Application des processus stochastiques aux enchères en temps réel et à la propagation d'information dans les réseaux sociaux.

    Remi LEMONNIER, Nicolas VAYATIS, Nicolas VAYATIS, Manuel GOMEZ RODRIGUEZ, Florent KRZAKALA, Marc HOFFMANN, Emmanuel BACRY, Manuel GOMEZ RODRIGUEZ, Florent KRZAKALA, Marc HOFFMANN
    2016
    Dans cette thèse, nous étudions deux applications des processus stochastiques au marketing internet. Le premier chapitre s’intéresse au scoring d’internautes pour les enchères en temps réel. Ce problème consiste à trouver la probabilité qu’un internaute donné réalise une action d’intérêt, appelée conversion, dans les quelques jours suivant l’affichage d’une bannière publicitaire. Nous montrons que les processus de Hawkes constituent une modélisation naturelle de ce phénomène mais que les algorithmes de l’état de l’art ne sont pas applicables à la taille des données typiquement à l’œuvre dans des applications industrielles. Nous développons donc deux nouveaux algorithmes d’inférence non-paramétrique qui sont plusieurs ordres de grandeurs plus rapides que les méthodes précédentes. Nous montrons empiriquement que le premier a de meilleures performances que les compétiteurs de l’état de l’art, et que le second permet une application à des jeux de données encore plus importants sans payer un prix trop important en terme de pouvoir de prédiction. Les algorithmes qui en découlent ont été implémentés avec de très bonnes performances depuis plusieurs années à 1000 mercis, l’agence marketing d’avant-garde étant le partenaire industriel de cette thèse CIFRE, où ils sont devenus un actif important pour la production. Le deuxième chapitre s’intéresse aux processus diffusifs sur les graphes qui constituent un outil important pour modéliser la propagation d’une opération de marketing viral sur les réseaux sociaux. Nous établissons les premières bornes théoriques sur le nombre total de nœuds atteint par une contagion dans le cadre de graphes et dynamiques de diffusion quelconques, et montrons l’existence de deux régimes bien distincts : le régime sous-critique où au maximum $O(sqrt{n})$ nœuds seront infectés, où $n$ est la taille du réseau, et le régime sur-critique ou $O(n)$ nœuds peuvent être infectés. Nous étudions également le comportement par rapport au temps d’observation $T$ et mettons en lumière l’existence de temps critiques en-dessous desquels une diffusion, même sur-critique sur le long terme, se comporte de manière sous-critique. Enfin, nous étendons nos travaux à la percolation et l’épidémiologie, où nous améliorons les résultats existants.
  • Inférence du champ moyen des processus du point de Hawkes.

    Emmanuel BACRY, Stephane GAIFFAS, Iacopo MASTROMATTEO, Jean francois MUZY
    Journal of Physics A: Mathematical and Theoretical | 2016
    Nous proposons une méthode d'estimation rapide et efficace qui est capable de récupérer avec précision les paramètres d'un processus ponctuel de Hawkes à d -dimensions à partir d'un ensemble d'observations. Nous exploitons une approximation du champ moyen qui est valable lorsque les fluctuations de l'intensité stochastique sont faibles. Nous montrons que c'est notamment le cas lorsque les interactions sont suffisamment faibles, lorsque la dimension du système est élevée ou lorsque les fluctuations s'auto-entretiennent en raison du grand nombre d'événements passés qu'elles impliquent. Dans un tel régime, l'estimation d'un processus de Hawkes peut être ramenée à un problème de moindres carrés pour lequel nous fournissons une solution analytique. Bien que cet estimateur soit biaisé, nous montrons que sa précision peut être comparable à celle de l'estimateur du maximum de vraisemblance, tandis que sa vitesse de calcul est considérablement améliorée. Nous donnons un contrôle théorique sur la précision de notre nouvelle approche et illustrons son efficacité en utilisant des ensembles de données synthétiques, afin d'évaluer l'erreur d'estimation statistique des paramètres.
  • Processus linéaires en haute dimension : Espace des phases et propriétés critiques.

    Iacopo MASTROMATTEO, Emmanuel BACRY, Jean francois MUZY
    Physical Review E | 2015
    Pas de résumé disponible.
  • Les processus de Hawkes en finance.

    Emmanuel BACRY, Iacopo MASTROMATTEO, Jean francois MUZY
    Market Microstructure and Liquidity | 2015
    Pas de résumé disponible.
  • Impacts sur le marché et cycle de vie des ordres des investisseurs.

    Emmanuel BACRY, Adrian IUGA, Matthieu LASNIER, Charles albert LEHALLE
    Market Microstructure and Liquidity | 2015
    Pas de résumé disponible.
  • Analyse des processus intermittents avec des moments de diffusion.

    Jean francois MUZY, Emmanuel BACRY, Stephane MALLAT, Joan BRUNA
    The Annals of Statistics | 2015
    Les moments de diffusion fournissent des modèles non paramétriques de processus aléatoires avec des incréments stationnaires. Il s'agit de valeurs attendues de variables aléatoires calculées avec un opérateur non expansif, obtenu par l'application itérative de transformées en ondelettes et de non-linéarités de module, qui préserve la variance. On montre que les moments de diffusion du premier et du second ordre caractérisent les propriétés d'intermittence et d'autosimilarité des processus à plusieurs échelles. On montre que les moments de diffusion des processus de Poisson, des mouvements browniens fractionnaires, des processus de Lévy et des marches aléatoires multifractales ont une décroissance caractéristique. La méthode généralisée des moments simulés est appliquée aux moments de diffusion pour estimer les modèles générateurs de données. Des applications numériques sont présentées sur des séries temporelles financières et sur la dissipation d'énergie d'écoulements turbulents.
  • Modélisation Stochastique des carnets d'ordres.

    Aymen JEDIDI, Frederic ABERGEL, Jim GATHERAL, Frederic ABERGEL, Bernard LAPEYRE, Mathieu ROSEMBAUM, Emmanuel BACRY, Jean philippe BOUCHARD, Bernard LAPEYRE, Mathieu ROSEMBAUM
    2014
    Cette thèse étudie quelques aspects de la modélisation stochastique des carnets d'ordres. Nous analysons dans la première partie un modèle dans lequel les temps d'arrivées des ordres sont Poissoniens indépendants. Nous démontrons que le carnet d'ordres est stable (au sens des chaines de Markov) et qu'il converge vers sa distribution stationnaire exponentiellement vite. Nous en déduisons que le prix engendré dans ce cadre converge vers un mouvement Brownien aux grandes échelles de temps. Nous illustrons les résultats numériquement et les comparons aux données de marché en soulignant les succès du modèle et ses limites. Dans une deuxième partie, nous généralisons les résultats à un cadre où les temps d'arrivés sont régis par des processus auto et mutuellement existants, moyennant des hypothèses sur la mémoire de ces processus. La dernière partie est plus appliquée et traite de l'identification d'un modèle réaliste multivarié à partir des flux des ordres. Nous détaillons deux approches : la première par maximisation de la vraisemblance et la seconde à partir de la densité de covariance, et réussissons à avoir une concordance remarquable avec les données. Nous appliquons le modèle ainsi estimé à deux problèmes concrets de trading algorithmique, à savoir la mesure de la probabilité d'exécution et le coût d'un ordre limite.
  • Modèle de Hawkes pour la dynamique des prix et des transactions à haute fréquence.

    Emmanuel BACRY, Jean francois MUZY
    Quantitative Finance | 2014
    Nous introduisons un processus de Hawkes multivarié qui rend compte de la dynamique des prix du marché à travers l'impact des arrivées d'ordres au niveau microstructurel. Notre modèle est un processus ponctuel principalement caractérisé par quatre noyaux associés, respectivement, à l'auto-excitation des arrivées d'ordres, à la réversion moyenne des changements de prix, à l'impact des arrivées d'ordres sur les variations de prix et à la rétroaction des changements de prix sur l'activité de négociation. Il permet de prendre en compte à la fois les faits stylisés de la microstructure des prix du marché (y compris l'arrivée aléatoire des mouvements de prix, la grille de prix discrète, la réversion moyenne à haute fréquence, le comportement des fonctions de corrélation à diverses échelles de temps) et les faits stylisés de l'impact du marché (principalement la forme concave de type racine carrée/relaxation de l'impact du marché d'un méta ordre). En outre, il permet d'estimer le profil complet de l'impact sur le marché à partir de données anonymes sur le marché. Nous montrons que ces noyaux peuvent être estimés empiriquement à partir des intensités moyennes conditionnelles empiriques. Nous fournissons des exemples numériques, une application à des données réelles et des comparaisons avec des approches antérieures.
  • Impacts sur le marché et cycle de vie des ordres des investisseurs.

    Emmanuel BACRY, Adrian IUGA, Matthieu LASNIER, Charles albert LEHALLE
    SSRN Electronic Journal | 2014
    Dans ce papier, nous utilisons une base de données d'environ 400 000 métaordres émis par des investisseurs et négociés électroniquement sur les marchés européens en 2010 afin d'étudier l'impact du marché à différentes échelles. A l'échelle intraday, nous confirmons un impact temporaire de racine carrée dans la participation quotidienne, et nous mettons en lumière un facteur de durée dans $1/T^{\gamma}$ avec $\gamma \simeq 0.25$. L'inclusion de ce facteur dans les ajustements renforce la forme de racine carrée de l'impact. Nous observons une loi de puissance pour l'impact transitoire avec un exposant compris entre 0,5$ (pour les métaordres longs) et 0,8$ (pour les plus courts). De plus, nous montrons que le marché n'anticipe pas la taille des méta-ordres. La décroissance intra-journalière semble présenter deux régimes (bien que difficile à identifier précisément) : un régime "lent" juste après l'exécution du méta-ordre suivi d'un régime plus rapide. À l'échelle quotidienne, nous montrons que les mouvements de prix après un méta-ordre peuvent être répartis entre les réalisations des rendements attendus qui ont déclenché la décision d'investissement et un impact idiosynchrone qui décroît lentement jusqu'à zéro. De plus, nous proposons une classe de modèles jouets basés sur les processus de Hawkes (les modèles d'impact de Hawkes, HIM) pour illustrer notre raisonnement. Nous montrons comment le modèle Impulsif-HIM, malgré sa simplicité, intègre des caractéristiques attrayantes telles que le caractère transitoire et la décroissance de l'impact. Ce dernier est paramétré par un paramètre $C$ ayant une interprétation macroscopique : le rapport entre la réaction contrariante (c'est-à-dire la décroissance de l'impact) et la réaction "grégaire" (c'est-à-dire l'amplification de l'impact).
  • Modélisation et analyse statistique de la formation des prix à travers les échelles, Market impact.

    Relu adrian IUGA, Marc HOFFMANN, Damien LAMBERTON, Marc HOFFMANN, Emmanuel BACRY, Romuald ELIE, Fabrizio LILLO, Francois ROUEFF
    2014
    Le développement des marchés électroniques organisés induit une pression constante sur la recherche académique en finance. L'impact sur le prix d'une transaction boursière portant sur une grande quantité d'actions sur une période courte est un sujet central. Contrôler et surveiller l'impact sur le prix est d'un grand intérêt pour les praticiens, sa modélisation est ainsi devenue un point central de la recherche quantitative de la finance. Historiquement, le calcul stochastique s'est progressivement imposé en finance, sous l'hypothèse implicite que les prix des actifs satisfont à des dynamiques diffusives. Mais ces hypothèses ne tiennent pas au niveau de la ``formation des prix'', c'est-à-dire lorsque l'on se place dans les échelles fines des participants de marché. Des nouvelles techniques mathématiques issues de la statistique des processus ponctuels s'imposent donc progressivement. Les observables (prix traité, prix milieu) apparaissent comme des événements se réalisant sur un réseau discret, le carnet d'ordre, et ceci à des échelles de temps très courtes (quelques dizaines de millisecondes). L'approche des prix vus comme des diffusions browniennes satisfaisant à des conditions d'équilibre devient plutôt une description macroscopique de phénomènes complexes issus de la formation des prix. Dans un premier chapitre, nous passons en revue les propriétés des marchés électroniques. Nous rappelons la limite des modèles diffusifs et introduisons les processus de Hawkes. En particulier, nous faisons un compte rendu de la recherche concernant le maket impact et nous présentons les avancées de cette thèse. Dans une seconde partie, nous introduisons un nouveau modèle d'impact à temps continu et espace discret en utilisant les processus de Hawkes. Nous montrons que ce modèle tient compte de la microstructure des marchés et est capable de reproduire des résultats empiriques récents comme la concavité de l'impact temporaire. Dans le troisième chapitre, nous étudions l'impact d'un grand volume d'action sur le processus de formation des prix à l'échelle journalière et à une plus grande échelle (plusieurs jours après l'exécution). Par ailleurs, nous utilisons notre modèle pour mettre en avant des nouveaux faits stylisés découverts dans notre base de données. Dans une quatrième partie, nous nous intéressons à une méthode non-paramétrique d'estimation pour un processus de Hawkes unidimensionnel. Cette méthode repose sur le lien entre la fonction d'auto-covariance et le noyau du processus de Hawkes. En particulier, nous étudions les performances de cet estimateur dans le sens de l'erreur quadratique sur les espaces de Sobolev et sur une certaine classe contenant des fonctions « très » lisses.
  • Propriétés empiriques et modélisation d’actifs en haute fréquence.

    Riadh ZAATOUR, Frederic ABERGEL, Bernard LAPEYRE, Frederic ABERGEL, Fulvio BALDOVIN, Emmanuel BACRY, Stephane TYC, Bernard LAPEYRE, Fulvio BALDOVIN
    2013
    Cette thèse explore théoriquement et empiriquement certains aspects de la formation et de l’évolution des prix des actifs financiers observés en haute fréquence. Nous commençons par l’étude de la dynamique jointe de l’option et de son sous-jacent. Les données haute fréquence rendant observable le processus de volatilité réalisée du sous-jacent, nous cherchons à savoir si cette information est utilisée pour fixer les prix des options. Nous trouvons que le marché ne l’exploite pas. Les modèles de volatilité stochastique sont donc à considérer comme des modèles à forme réduite. Cette étude permet néanmoins de tester la pertinence d’une mesure de couverture empirique que nous appelons delta effectif. C’est la pente de la régression des rendements des prix de l’option sur ceux du sous-jacent. Elle fournit un indicateur de couverture assez satisfaisant et indépendant de toute modélisation. Pour la dynamique des prix, nous nous tournons dans les chapitres suivants vers des modèles plus explicites de la microstructure du marché. L’une des caractéristiques de l’activité de marché est son regroupement, ou clustering. Les processus de Hawkes, processus ponctuels présentant cette caractéristique, fournissent donc un cadre mathématique adéquat pour l’étude de cette activité. La représentation Markovienne de ces processus, ainsi que leur caractère affine quand le noyau est exponentiel, permettent de recourir aux puissants outils analytiques que sont le générateur infinitésimal et la formule de Dynkin pour calculer différentes quantités qui leur sont reliées, telles que les moments ou autocovariances du nombre d’évènements sur un intervalle donné. Nous commençons par un cadre monodimensionnel, assez simple pour éclairer la démarche, mais suffisamment riche pour permettre des applications telles que le groupement des instants d’arrivée d’ordres de marché, la prévision de l’activité de marché à venir sachant l’activité passée, ou la caractérisation de formes inhabituelles, mais néanmoins observées, de signature plot où la volatilité mesurée décroît quand la fréquence d’échantillonnage augmente. Nos calculs nous permettent aussi de rendre la calibration des processus de Hawkes instantanée en recourant à la méthode des moments. La généralisation au cas multidimensionnel nous permet ensuite de capturer, avec le clustering, le phénomène de retour à la moyenne qui caractérise aussi l’activité de marché observée en haute fréquence. Des formules générales pour le signature plot sont alors obtenues et permettent de relier la forme de celui-ci à l’importance relative du clustering ou du retour à la moyenne. Nos calculs permettent aussi d’obtenir la forme explicite de la volatilité associée à la limite diffusive, connectant la dynamique de niveau microscopique à la volatilité observée macroscopiquement, par exemple à l’échelle journalière. En outre, la modélisation des activités d’achat et de vente par des processus de Hawkes permet de calculer l’impact d’un méta ordre sur le prix de l’actif. On retrouve et on explique alors la forme concave de cet impact ainsi que sa relaxation temporelle. Les résultats analytiques obtenus dans le cas multidimensionnel fournissent ensuite le cadre adéquat à l’étude de la corrélation. On présente alors des résultats généraux sur l’effet Epps, ainsi que sur la formation de la corrélation et du lead lag.
  • Quelques théorèmes limites pour les processus de Hawkes et application aux statistiques financières.

    E. BACRY, S. DELATTRE, M. HOFFMANN, Jean francois MUZY, J.f. MUZY
    Stochastic Processes and their Applications | 2013
    Résumé Dans le contexte de la statistique des processus aléatoires, nous prouvons une loi des grands nombres et un théorème central limite fonctionnel pour les processus de Hawkes multivariés observés sur un intervalle de temps [ 0 , T ] lorsque T ? ? . Nous montrons en outre le comportement asymptotique de la covariation des incréments des composantes d'un processus de Hawkes multivarié, lorsque les observations sont imposées par un schéma discret avec une maille ? sur [ 0 , T ] jusqu'à un certain décalage temporel supplémentaire ? . Le comportement de cette fonctionnelle dépend de la taille relative de ? et ? par rapport à T et permet de rendre compte de la structure du second ordre. À titre d'application, nous développons nos résultats dans le contexte des statistiques financières. Nous avons introduit dans Bacry et al. (2013) [7] un modèle stochastique microscopique pour les variations d'un actif financier multivarié, basé sur les processus de Hawkes et qui est confiné à vivre sur une grille de ticks. Nous dérivons et caractérisons la limite de diffusion macroscopique exacte de ce modèle et montrons en particulier sa capacité à reproduire les faits stylisés empiriques importants tels que l'effet Epps et l'effet lead?lag. De plus, notre approche permet de suivre ces effets à travers les échelles en termes mathématiques rigoureux.
  • Modèle de cascade aléatoire dans la limite de l'échelle intégrale infinie comme l'exponentielle d'un bruit non stationnaire1/fnoise : Application aux fluctuations de la volatilité sur les marchés boursiers.

    Jean francois MUZY, Rachel BAILE, Emmanuel BACRY
    Physical Review E | 2013
    Pas de résumé disponible.
  • Modèle log-normal continu en cascade des rendements des actifs : propriétés d'agrégation et estimation.

    Emmanuel BACRY, Alexey KOZHEMYAK, Jean francois MUZY
    Quantitative Finance | 2013
    Les modèles multifractaux et les cascades aléatoires ont été utilisés avec succès pour modéliser les rendements des actifs. En particulier, la cascade continue log-normale est un modèle parcimonieux qui s'est avéré reproduire la plupart des faits stylisés observés. Dans cet article, nous étudions plusieurs questions statistiques liées à ce modèle. Nous présentons d'abord une revue rapide, mais étendue, de ses principales propriétés et montrons que la plupart de ces propriétés peuvent être étudiées analytiquement. Nous développons ensuite une théorie de l'approximation dans la limite de petite intermittence λ-super-2 ≪ 1, c'est-à-dire lorsque le degré de multifractalité est petit. Cela nous permet de prouver que les distributions de probabilité associées à ces processus possèdent certaines propriétés d'agrégation très simples à travers les échelles de temps. Un tel contrôle des propriétés des processus à différentes échelles de temps nous permet d'aborder le problème de l'estimation des paramètres. Nous montrons qu'il faut distinguer deux régimes asymptotiques différents : le premier, appelé "asymptotique à basse fréquence", correspond à la prise d'un échantillon dont la taille globale augmente, tandis que le second, appelé "asymptotique à haute fréquence", correspond à l'échantillonnage du processus à un taux d'échantillonnage croissant. Le premier cas conduit à des estimateurs convergents, alors que dans l'asymptotique haute fréquence, la situation est beaucoup plus complexe : seul le coefficient d'intermittence λ-super-2 peut être estimé à l'aide d'un estimateur cohérent. Cependant, nous montrons que, dans des situations pratiques, on peut détecter la nature du régime asymptotique (basse fréquence versus haute fréquence) et par conséquent décider si les estimations des autres paramètres sont fiables ou non. Nous appliquons nos résultats aux séries de rendements quotidiens du marché des actions (actions individuelles et indices) et illustrons une application possible à la prédiction de la volatilité et de la valeur à risque conditionnelle.
  • Modélisation du bruit de microstructure avec des processus ponctuels mutuellement excitants.

    Emmanuel BACRY, Sylvain DELATTRE, Marc HOFFMANN, Jean francois MUZY
    Quantitative Finance | 2013
    Nous introduisons un nouveau modèle stochastique pour les variations des prix des actifs au niveau tick-by-tick en dimension 1 (pour un seul actif) et 2 (pour une paire d'actifs). La construction est basée sur des processus de points marqués et s'appuie sur des inten- sités stochastiques linéaires auto- et mutuellement excitantes telles qu'introduites par Hawkes. Nous associons un processus de comptage aux sauts positifs et négatifs du prix d'un actif. En couplant convenablement les intensités stochastiques des variations à la hausse et à la baisse des prix de plusieurs actifs simultanément, nous pouvons reproduire le bruit de microstructure (i.e. une forte réversion moyenne microscopique au niveau de quelques secondes à quelques minutes) et l'effet Epps (i.e. la décorrélation des incréments aux échelles microscopiques) tout en préservant un comportement de diffusion brownien standard aux grandes échelles. Plus efficacement, nous obtenons des formules analytiques à forme fermée pour le tracé de la signature moyenne et la corrélation de deux incréments de prix qui permettent de suivre à travers les échelles l'effet de la réversion moyenne jusqu'à la limite diffusive du modèle. Nous montrons que les résultats théoriques sont cohérents avec les ajustements empiriques sur les contrats à terme Euro-Bund et Euro-Bobl dans plusieurs situations.
  • Modélisation du bruit de microstructure avec des processus ponctuels mutuellement excitants.

    Emmanuel BACRY, Sylvain DELATTRE, Marc HOFFMANN, Jean francois MUZY
    Quantitative Finance | 2013
    Pas de résumé disponible.
  • Quelques propriétés de la corrélation entre les actifs financiers à haute fréquence.

    Nicolas HUTH, Frederic ABERGEL, Matteo MARSILI, Frederic ABERGEL, Fabrizio LILLO, Mathieu ROSENBAUM, Emmanuel BACRY, Michel CROUHY, Fabrizio LILLO, Mathieu ROSENBAUM
    2012
    Le but de cette thèse est d’approfondir les connaissances académiques sur les variations jointes des actifs financiers à haute fréquence en les analysant sous un point de vue novateur. Nous tirons profit d’une base de données de prix tick-by-tick pour mettre en lumière de nouveaux faits stylises sur la corrélation haute fréquence, et également pour tester la validité empirique de modèles multivariés. Dans le chapitre 1, nous discutons des raisons pour lesquelles la corrélation haute fréquence est d’une importance capitale pour le trading. Par ailleurs, nous passons en revue la littérature empirique et théorique sur la corrélation à de petites échelles de temps. Puis nous décrivons les principales caractéristiques du jeu de données que nous utilisons. Enfin, nous énonçons les résultats obtenus dans cette thèse. Dans le chapitre 2, nous proposons une extension du modèle de subordination au cas multivarié. Elle repose sur la définition d’un temps événementiel global qui agrège l’activité financière de tous les actifs considérés. Nous testons la capacité de notre modèle à capturer les propriétés notables de la distribution multivariée empirique des rendements et observons de convaincantes similarités. Dans le chapitre 3, nous étudions les relations lead/lag à haute fréquence en utilisant un estimateur de fonction de corrélation adapte aux données tick-by-tick. Nous illustrons sa supériorité par rapport à l’estimateur standard de corrélation pour détecter le phénomène de lead/lag. Nous établissons un parallèle entre le lead/lag et des mesures classiques de liquidité et révélons un arbitrage pour déterminer les paires optimales pour le trading de lead/lag. Enfin, nous évaluons la performance d’un indicateur basé sur le lead/lag pour prévoir l’évolution des prix à court terme. Dans le chapitre 4, nous nous intéressons au profil saisonnier de la corrélation intra-journalière. Nous estimons ce profil sur quatre univers d’actions et observons des ressemblances frappantes. Nous tentons d’incorporer ce fait stylise dans un modèle de prix tick-by-tick base sur des processus de Hawkes. Le modèle ainsi construit capture le profil de corrélation empirique assez finement, malgré sa difficulté à atteindre le niveau de corrélation absolu.
  • Microstructure des marchés et modélisation du flux de trading.

    Khalil AL DAYRI, Emmanuel BACRY
    2011
    Pas de résumé disponible.
  • Modélisation de séries financières à l'aide de processus invariants d'échelles. Application à la prédiction du risque.

    Alexey KOZHEMYAK, Emmanuel BACRY
    2006
    Pas de résumé disponible.
  • Utilisation de la transformation en ondelettes pour l'analyse de signaux fractals et pour la resolution d'equations aux derivees partielles.

    Emmanuel BACRY, Claude BARDOS
    1992
    Ce memoire se compose de deux parties independantes. Dans la premiere partie, nous nous interessons a l'etude d'objets fractals a l'aide de la transformation en ondelettes continue. Nous nous appliquons notamment a etendre aux signaux le formalisme multifractal des mesures singulieres. Le nouveau formalisme obtenu permet d'etudier l'importance relative des differents types de singularites intervenant dans un signal singulier. De nombreuses applications numeriques portant aussi bien sur des signaux generes par ordinateur que sur des signaux experimentaux provenant d'experiences de turbulence pleinement developpee viennent illustrer nos propos. Dans la seconde partie de ce memoire, nous presentons un schema numerique adaptatif en espace et en temps pour la resolution des equations aux derivees partielles. Ce schema est base sur l'utilisation de bases orthogonales d'ondelettes. La structure de multiresolution engendree par de telles bases permet, de facon naturelle, d'adapter la finesse de la grille spatiale d'un schema numerique a la regularite locale de la solution et d'obtenir ainsi un schema adaptatif en espace. Il s'agit pour nous ici d'adapter non seulement la finesse de la grille spatiale mais aussi celle de la grille temporelle afin de concentrer l'effort numerique dans les regions de l'espace ou de fortes singularites apparaissent. Des tests numeriques concernant la stabilite, la complexite et la precision sont effectues sur l'equation de burgers.
Les affiliations sont détectées à partir des signatures des publications identifiées dans scanR. Un auteur peut donc apparaître affilié à plusieurs structures ou tutelles en fonction de ces signatures. Les dates affichées correspondent seulement aux dates des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr