Apprentissage automatique ou économétrie pour l'évaluation du crédit : Obtenons le meilleur des deux mondes *.

Auteurs
Date de publication
2020
Type de publication
Autre
Résumé Les arbres de décision et les méthodes d'ensemble connexes comme la forêt aléatoire sont des outils de pointe dans le domaine de l'apprentissage automatique pour l'évaluation du crédit. Bien qu'il soit démontré qu'ils sont plus performants que la régression logistique, ils manquent d'interprétabilité, ce qui réduit considérablement leur utilisation dans le secteur de la gestion du risque de crédit, où les décideurs et les régulateurs ont besoin de fonctions de notation transparentes. Cet article propose d'obtenir le meilleur des deux mondes, en introduisant une nouvelle méthode de notation du crédit, simple et interprétable, qui utilise les informations des arbres de décision pour améliorer les performances de la régression logistique. Formellement, les règles extraites de divers arbres de décision à courte profondeur construits avec des couples de variables prédictives sont utilisées comme prédicteurs dans une régression logistique pénalisée ou régularisée. En modélisant de tels effets de seuil univariés et bivariés, nous obtenons une amélioration significative des performances du modèle pour la régression logistique tout en préservant son interprétation simple. Des applications utilisant des ensembles de données simulées et quatre ensembles de données réelles de défauts de paiement montrent que notre nouvelle méthode surpasse les régressions logistiques traditionnelles. De plus, elle se compare de manière compétitive à la forêt aléatoire, tout en fournissant une fonction de notation interprétable. Classification JEL : G10 C25, C53.
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr