Modélisation de l'expression des gènes à partir de données de séquence ADN.

Auteurs
  • TAHA May
  • BESSIERE Chloe
  • PETITPREZ Florent
  • VANDEL Jimmy
  • MARIN Jean michel
  • BREHELIN Laurent
  • LEBRE Sophie
  • LECELLIER Charles henri
Date de publication
2017
Type de publication
Article de conférence
Résumé L'expression des gènes est étroitement contrôlée pour assurer une grande variété de fonctions et de types cellulaires. Le développement des maladies, en particulier les cancers, est invariablement lié à la dérégulation de ces contrôles. Notre objectif est de modéliser le lien entre l'expression des gènes et la composition nucléotidique des différentes régions régulatrices du génome. Nous proposons d'aborder ce problème dans un cadre de régression avec une approche Lasso couplée à un arbre de régression. Nous utilisons exclusivement des données de séquences et nous apprenons un modèle différent pour chaque type cellulaire. Nous montrons (i) que les différentes régions régulatrices apportent des informations diffé-rentes et complémentaires et (ii) que la seule information de leur composition nucléotidique permet de prédire l'expression des gènes avec une erreur comparable à celle obtenue en utilisant des données expérimentales. En outre, le modèle linéaire appris n'est pas aussi performant pour tous les gènes, mais modélise mieux certaines classes de gènes avec des compositions nucléotidiques particulières.
Thématiques de la publication
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr