Annotation et analyse différentielle de l'épissage alternatif en utilisant l'assemblage de novo de données RNAseq.

Auteurs
  • BENOIT PILVEN Clara
  • MARCHET Camille
  • CHAUTARD Emilie
  • LIMA Leandro
  • LAMBERT Marie pierre
  • SACOMOTO Gustavo
  • REY Amandine
  • BOURGEOIS Cyril
  • AUBOEUF Didier
  • LACROIX Vincent
Date de publication
2016
Type de publication
Préprint
Résumé Les analyses à l'échelle du génome révèlent que plus de 90 % des gènes humains multi exoniques produisent au moins deux transcrits par épissage alternatif (EA). Diverses méthodes bioinformatiques sont disponibles pour analyser l'épissage alternatif à partir de données RNAseq. La plupart des méthodes commencent par la mise en correspondance des lectures avec un génome de référence annoté, mais certaines commencent par un assemblage de novo des lectures. Dans cet article, nous présentons une comparaison systématique d'une approche de cartographie en premier ( FaRLine ) et d'une approche d'assemblage en premier ( KisSplice ). Ces deux approches sont basées sur les événements, car elles se concentrent sur les régions des transcriptions qui varient dans leur contenu en exon. Nous avons appliqué ces méthodes à un ensemble de données RNAseq provenant d'une lignée cellulaire de neuroblastome SK-N-SH (ENCODE) différenciée ou non par l'acide rétinoïque. Nous avons constaté que les prédictions des deux pipelines se chevauchaient (70% des événements de saut d'exon étaient communs), mais avec des différences notables. L'approche fondée sur l'assemblage a permis de trouver davantage de nouvelles variantes, notamment de nouveaux exons et sites d'épissage non annotés. Elle a également prédit des AS dans des familles de gènes paralogues. L'approche " mapping first " a permis de trouver plus de variantes d'épissage faiblement exprimées et a été plus efficace pour prédire les exons chevauchant des éléments répétés. Ce travail démontre que l'annotation des SA avec une seule approche conduit à manquer un grand nombre de candidats. Nous montrons également que ces candidats ne peuvent pas être négligés, puisque beaucoup d'entre eux sont régulés de manière différentielle entre les conditions, et peuvent être validés expérimentalement. Nous préconisons donc l'utilisation combinée des deux approches, mapping-first et assembly-first, pour l'annotation et l'analyse différentielle des AS à partir de données RNAseq.
Éditeur
Cold Spring Harbor Laboratory
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr