Apprentissage statistique pour s?quences d??v?nements ? l?aide de processus ponctuels.

Auteurs
Date de publication
2017
Type de publication
Thèse
Résumé Le but de cette th?se est de montrer que l'arsenal des nouvelles m?thodes d'optimisation permet de r?soudre des probl?mes d'estimation difficile bas?s sur les mod?les d'?v?nements.Alors que le cadre classique de l'apprentissage supervis? traite les observations comme une collection de couples de covariables et de label, les mod?les d'?v?nements ne regardent que les temps d'arriv?e d'?v?nements et cherchent alors ? extraire de l'information sur la source de donn?e.Ces ?v?nements dat?s sont ordonn?s de fa?on chronologique et ne peuvent d?s lors ?tre consid?r?s comme ind?pendants.Ce simple fait justifie l'usage d'un outil math?matique particulier appel? processus ponctuel pour apprendre une certaine structure ? partir de ces ?v?nements.Deux exemples de processus ponctuels sont ?tudi?s dans cette th?se.Le premier est le processus ponctuel derri?re le mod?le de Cox ? risques proportionnels:son intensit? conditionnelle permet de d?finir le ratio de risque, une quantit? fondamentale dans la litt?rature de l'analyse de survie.Le mod?le de r?gression de Cox relie la dur?e avant l'apparition d'un ?v?nement, appel? d?faillance, aux covariables d'un individu.Ce mod?le peut ?tre reformul? ? l'aide du cadre des processus ponctuels.Le second est le processus de Hawkes qui mod?lise l'impact des ?v?nements pass?s sur la probabilit? d'apparition d'?v?nements futurs.Le cas multivari? permet d'encoder une notion de causalit? entre les diff?rentes dimensions consid?r?es.Cette th?se est divis?e en trois parties.La premi?re s'int?resse ? un nouvel algorithme d'optimisation que nous avons d?velopp?.Il permet d'estimer le vecteur de param?tre de la r?gression de Cox lorsque le nombre d'observations est tr?s important.Notre algorithme est bas? sur l'algorithme SVRG (Stochastic Variance Reduced Gradient) et utilise une m?thode MCMC (Monte Carlo Markov Chain) pour approcher un terme de la direction de descente.Nous avons prouv? des vitesses de convergence pour notre algorithme et avons montr? sa performance num?rique sur des jeux de donn?es simul?s et issus de monde r?el.La deuxi?me partie montre que la causalit? au sens de Hawkes peut ?tre estim?e de mani?re non-param?trique gr?ce aux cumulants int?gr?s du processus ponctuel multivari?.Nous avons d?velopper deux m?thodes d'estimation des int?grales des noyaux du processus de Hawkes, sans faire d'hypoth?se sur la forme de ces noyaux. Nos m?thodes sont plus rapides et plus robustes, vis-?-vis de la forme des noyaux, par rapport ? l'?tat de l'art. Nous avons d?montr? la consistence statistique de la premi?re m?thode, et avons montr? que la deuxi?me peut ?tre r?duite ? un probl?me d'optimisation convexe.La derni?re partie met en lumi?re les dynamiques de carnet d'ordre gr?ce ? la premi?re m?thode d'estimation non-param?trique introduite dans la partie pr?c?dente.Nous avons utilis? des donn?es du march? ? terme EUREX, d?fini de nouveaux mod?les de carnet d'ordre (bas?s sur les pr?c?dents travaux de Bacry et al.) et appliqu? la m?thode d'estimation sur ces processus ponctuels.Les r?sultats obtenus sont tr?s satisfaisants et coh?rents avec une analys? ?conom?trique.Un tel travail prouve que la m?thode que nous avons d?velopp? permet d'extraire une structure ? partir de donn?es aussi complexes que celles issues de la finance haute-fr?quence.
Thématiques de la publication
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr