Thèse OT-25907
Intégration de méthodes d’inférence démographique et de pédigrées en génomique des populations d’animaux d’élevage
32320 Castanet-Tolosan
Retour à la liste des résultats
Présentation INRAE
L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.
Environnement de travail, missions et activités
L’inférence démographique est un outil central pour la reconstruction de l’histoire génétique d’une population. Récemment, plusieurs nouvelles approches ont fait entrer cet outil dans une nouvelle ère, celle de l’utilisation exhaustive des données de séquence génome-entier. On peut classer ces approches en deux catégories : d’une part, les inférences démographiques basées sur des arbres de coalescence reconstruits1 (ARGs) et d’autre part, les inférences basées sur de l’apprentissage profond2,3 (deep learning). Néanmoins, sans autre source d’information, il est difficile d’appréhender le degré d’exactitude réel de ces méthodes. Dans le cas des populations d’espèces d’élevage, nous disposons d’information supplémentaires sur leur histoire génétique : leur origine géographique et historique et surtout des informations généalogiques précises sur plusieurs générations, les pédigrées. Cet ensemble de relations offre donc la possibilité de confronter les histoires démographiques inférées à l’histoire exacte, quoiqu’incomplète, de la population.
Notre projet, dans cette thèse, est d’utiliser les informations contenues dans les pédigrées pour, d’une part, confronter les résultats obtenus avec les nouvelles approches d’inférence démographique et, d’autre part, utiliser ces informations généalogiques pour affiner les méthodes de reconstruction d’ARGs. Nous proposons dès lors un programme de recherche décliné en trois tâches principales : (i) s’approprier les nouvelles approches (ARG, deep learning) en inférence démographique sur des jeux de données caprins et ovins, (ii) comparer ces approches ensemble, en particulier évaluer leurs inférences de la taille efficace d’une population à l’aune des informations généalogiques, et (iii) intégrer ces informations dans l’inférence des ARGs.
- Kelleher, J. et al. Inferring whole-genome histories in large population datasets. Nature Genetics 51, 1330–1338 (2019).
- Schrider, D. R. & Kern, A. D. Supervised Machine Learning for Population Genetics: A New Paradigm. Trends in Genetics 34, 301–312 (2018).
- Korfmann, K., Gaggiotti, O. E. & Fumagalli, M. Deep learning in population genetics. Genome Biology and Evolution 15, evad008 (2023).
Vous serez accueilli.e au sein de l’équipe CHAMADE de l’UMR GenPhySE (https://genphyse.inrae.fr/), située dans le centre de recherches Occitanie-Toulouse (31320, Castanet-Tolosan). L’équipe de recherche CHAMADE se positionne dans le Pôle scientifique « Diversité et Sélection » de l’UMR et s’intéresse à des questions méthodologiques dans le champ de la génomique des populations, de l’évaluation génétique des espèces animales et dans la génétique quantitative et évolutive. Une collaboration avec l’équipe BioInfo du Laboratoire Interdisciplinaire des Sciences du Numérique (LISN, Université de Paris-Saclay) est en outre prévue sur les approches de deep learning pour l’inférence démographique.
Formations et compétences recherchées
Formation recommandée : Master en génétique/génomique des populations, ou bioinformatique, ou statistiques appliquées
Connaissances souhaitées : Connaissances avancées en génétique/génomique des populations, connaissances minimales en biologie et génétique
Expérience appréciée : Stage de mémoire (ou tout autre expérience équivalente) en génomique des populations (càd expérience en grands jeux de données génomiques, sur des questions populationnelles – structure, métissage, histoire, etc.)
Aptitudes recherchées : Programmation en Linux/Bash et en au moins un langage tel que Python, R ou Matlab. Des compétences avancées en Python, en particulier sur l’utilisation de librairies de deep learning (PyTorch, Tensorflow) ne sont pas demandées mais seront hautement appréciées.
Votre qualité de vie à INRAE
En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :
- jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
- d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
- d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
- de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
- d'activités sportives et culturelles ;
- d'une restauration collective.
Modalités pour postuler
J'envoie mon CV et ma lettre de motivation
Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr