Offre de thèse UMR GABI et Unité GenPhySE

Offre de thèse "Décrypter les variations phénotypiques des trois espèces de ruminants et comprendre leur évolution à l’aide de pangénomes."

Le projet de thèse proposé permet d’établir une nouvelle structuration des données génomiques sous la forme d'un graphe de pangénome. Il permet la compression sans perte de l'information de plusieurs centaines de génomes tout en préservant l'organisation chromosomique des gènes bovins, ovins et caprins. Ce nouveau type de ressources a prouvé son utilité chez la tomate pour améliorer la puissance de détection des variants génétiques à l’origine des variations phénotypiques d’intérêt agronomique.

Environnement de travail, missions et activités
Vous serez accueilli(e) dans l’équipe Génétique et Génomique Bovine (G2B) au sein de l’unité Génétique Animale et Biologie Intégrative (UMR-1313 GABI ; https://www6.jouy.inrae.fr/gabi) et dans l’équipe Génomique de Ruminants Ovins et Caprins (GenROC) au sein de l’unité Génétique Physiologie et Systèmes d’Elevage (GenPhySE ; https://genphyse.toulouse.inra.fr/). La direction de thèse sera assurée par Mekki Boussaha et Gwenola Tosser-Klopp.

L'équipe G2B conduit des travaux sur l'analyse de la variabilité génétique et sur son exploitation en sélection génomique. Les recherches menées visent à contribuer à la durabilité de la production bovine dans ses dimensions économique, sociale et environnementale. Les travaux reposent largement sur le séquençage à haut débit et sur une base de plusieurs milliers de séquences en lectures courtes et longues.

Les recherches de l'équipe GenROC sont consacrées à l'identification des gènes et polymorphismes sous-jacents aux caractères quantitatifs chez les ovins et les caprins et à la compréhension des mécanismes moléculaires conduisant aux phénotypes observés

Vous serez plus particulièrement en charge de :

  • Générer des graphes de pangénome des trois espèces bovine, ovine et caprine à partir de différentes sources de données de séquences génomiques déjà disponibles et à avenir (lectures courtes, lectures longues, assemblages spécifiques de plusieurs races dans chacune des 3 espèces)
  • Explorer les caractéristiques de ces pangénomes et étudier les variations de structure dans les 3 espèces
  • Comparer les résultats entre les 3 espèces pour identifier éventuellement des gènes/familles de gènes communs impactés par les variants structuraux (SV).
  • Evaluer l’impact de ces variations de structure sur des phénotypes d’intérêt (données liées à la production laitière, traces de sélection, caractéristiques morphologiques, …).

L’enjeu de ce projet est d’améliorer la compréhension de la structure, du fonctionnement et de l’évolution des génomes des ruminants domestiques, grâce à l’exploitation de pangénomes, dont la construction est rendue possible par les lectures longues des séquences haut-débit. L’étude de la diversité génétique intra et inter-espèces a un intérêt pour les filières. En effet, elle permet de cibler des régions génomiques impliquées dans les performances recherchées par les éleveurs ou encore mettre en lumière des spécificités de race.

Le projet de thèse proposé permet d’établir une nouvelle structuration des données génomiques sous la forme d'un graphe de pangénome. Il permet la compression sans perte de l'information de plusieurs centaines de génomes tout en préservant l'organisation chromosomique des gènes bovins, ovins et caprins. Ce nouveau type de ressources a prouvé son utilité chez la tomate pour améliorer la puissance de détection des variants génétiques à l’origine des variations phénotypiques d’intérêt agronomique.

Les travaux réalisés dans ce projet apporteront une contribution significative à la recherche sur les espèces de ruminants, en particulier sur l’évolution de leur génome et la cartographie des loci associés à des caractères.

Les outils bio-informatiques dédiés à la construction du graphe et à la recherche de SV sont accessibles à partir de la plateforme genotoul-bioinfo. Les pipelines développés durant la thèse seront immédiatement mis à disposition sur la plateforme genotoul-bioinfo et seront utilisables pour l’analyse de génomes d'autres espèces, étendant considérablement l'impact des résultats du projet.

Prévoir quelques déplacements et courts séjours entre les 2 centres INRAE de Jouy-en-Josas et de Toulouse.

Formations et compétences recherchées
Master/Ingénieur (Bac+5)
Formation recommandée : Master ou équivalent (Bac +5) en bio-informatique

Connaissances souhaitées : génétique et génomique chez les eucaryotes

Expérience appréciée : analyses bio-informatiques des séquences génomiques haut débit

Aptitudes recherchées : Avoir un intérêt particulier pour la génétique et la génomique animale, avoir une expérience en programmation (en langage python et R) et des connaissances pratiques avec des clusters de calcul, aptitude à la rédaction d'articles scientifiques et la communication orale. Bonne maitrise de l'anglais requise.

Contacts :

Date de modification : 14 septembre 2023 | Date de création : 16 mars 2023 | Rédaction : INRAE - Edition P. Huan