Sélection optimale de modèles à base localisée en régression hétéroscédastique.

Auteurs
Date de publication
2016
Type de publication
Article de conférence
Résumé La notion de base localisée est un concept fécond en théorie de l'approximation linéaire, qui uni…e entre autres les histogrammes, les polynômes par morceaux et les ondelettes à support compact. Nous considérons donc le problème de sélection du nombre de coefficients non nuls dans un développement en base localisée, pour l'estimation non-paramétrique d'une fonction de régression, avec design aléatoire et bruit hetéroscédastique. Nous démontrons alors par l'établissement d'inégalités oracles l'optimalité asymptotique de l'heuristique de pente et d'une stratégie de pénalisation V-fold. Nous montrons aussi que la procédure classique de validation croisée V-fold est asymptotiquement sous-optimale au sens où elle retrouve à l'in…ni l'oracle construit à partir d'une fraction des données initiales égale à (V-1)/V. Nous concluons l'exposé par une étude simulatoire sur des modèles d'ondelettes, où nous notons une différence sensible entre les résultats asymptotiques du cadre théorique et la pratique à distance finie. En effet, la validation croisée V-fold et sa variante par pénalisation donnent dans nos expérimentations des résultats comparables alors que la supériorité asymptotique de la pénalisation est avérée.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr