Capture de séquence

Identification de mutations causales par capture de séquence

Les dispositifs et méthodes actuels de cartographie permettent de localiser les gènes responsables de la variabilité génétique avec une précision de l’ordre du cM, soit de l’ordre du million de bases d’ADN.

Dans cet intervalle, il existe fréquemment plusieurs milliers de polymorphismes dont, le plus souvent, un seul correspond à la variabilité recherchée. L’identification de cette mutation causale constitue l’un des grands défis de la génétique d’aujourd’hui et de demain, à la fois pour leur utilisation et pour comprendre la construction du phénotype.

Une méthode a été développée, reposant sur plusieurs étapes principales :

  • La capture de la région chromosomique étudiée chez différents individus de génotypes variés
  • Le séquençage de cette région en tirant profit des nouvelles générations de séquençage à haut débit
  • L’analyse bioinformatique pour mettre en évidence les polymorphismes trouvés et sélectionner les plus probables
  • La validation de la mutation supposée causale

Par rapport au séquençage du génome complet, cette approche a l’avantage de permettre le séquençage et l’analyse d’un nombre plus important d’individus et donc l’exploration d’une large variabilité génétique à un locus donné, augmentant ainsi la probabilité de trouver la mutation causale parmi les nombreux polymorphismes possibles.

Le CRB Gadie a développé cette expertise dans le cadre du programme CapSeqAn en l’appliquant à trois régions : Gène sans cornes chez le bovin, Système majeur d’histocompatibilité de la poule, Gène de susceptibilité au mélanome chez le porc, en collaboration avec trois équipes de GABI : G2B, PSGen et GIS, et avec le Centre National de Génotypage. Gabi conduit également d’autres programmes de captures, par exemple pour le syndrome d’hypoplasie généralisée capréoliforme (SHGC) et pour des QTL de susceptibilité à l’ostéchondrose.

La phase de capture s’effectue avec des puces Nimblegen spécialement dédiée à chaque étude. Sur cette puce sont déposées des oligonucléotides couvrant toute la région étudiée, après exclusion des séquences répétées pour éviter des captures non spécifiques. Les séquences capturées pour un certain nombre d’individus différents sont ensuite séquencées avec une méthode à haut débit. L’assemblage est réalisé, en général, par rapport à un génome de référence préexistant et l’ensemble des polymorphismes sont répertoriés. Deux grandes approches sont utilisées ensuite pour tenter d’identifier la mutation causale ou plutôt, dans un premier temps, d’éliminer celles qui ne le sont pas. Une première grande méthode est l’exclusion de tous les polymorphismes incompatibles avec le statut des animaux. Par exemple, on peut éliminer les SNP à l’état homozygote chez des animaux hétérozygotes pour le caractère, et réciproquement. La seconde approche est la recherche in silico de l’effet possible des variants, à la lumière des différentes annotations de la séquence : exons, introns, promoteurs, zones régulatrices, sites de transcription, etc… L’objectif est de suffisamment réduire le nombre de mutations candidates pour limiter le travail de génotypage sur une grande population de validation puis, après une nouvelle phase d’élimination, le travail de validation fonctionnelle.

Date de modification : 14 septembre 2023 | Date de création : 01 avril 2010 | Rédaction : D. Boichard - Edition P. Huan