Post-doctorat : spécialité Intelligence Artificielle – génomique

63000 Clermont-Ferrand

Retour à la liste des résultats

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

Au sein de l'équipe PaléoEVO de l'Unité Mixte de Recherche UCA-INRAE Génétique Diversité Ecophysiologie des Céréales (GDEC), nous menons des recherches en paléogénomique pour étudier la diversité génétique passée chez le blé via l’analyse d’ADN ancien (aDNA) de restes archéologiques. Adossé à cette équipe de recherche, PALEOLAB est un laboratoire confiné, dédié à l’analyse de restes archéo-botaniques (urlr.me/YhGkvK, Pont et al. 2019 doi : 10.1186/s13059-019-1627-1). Vous participerez au programme DATA (UCA/I-Site) dans le domaine de l’exploitation de l’Intelligence Artificielle pour la génomique pour retracer l’adaptation passée des blés et ouvrir des pistes sur la conception des blés de demain adaptés aux changements globaux. Ce projet associe deux laboratoires : 

  1. Unité Mixte de Recherche Génétique Diversité Ecophysiologie des Céréales (GDEC) – UCA-INRAE – Clermont-Ferrand (Caroline Pont, Pierre-Louis Stenger et Jérôme Salse) ;
  2. Laboratoire d'Informatique, Modélisation et d'Optimisation des Systèmes (LIMOS) UCA – Clermont-Ferrand (Engelbert Mephu Nguifo, professeur à l’ISIMA). 

L’équipe d’accueil (UMR GDEC) assure l’accès aux outils bio-informatiques nécessaires à la pleine réalisation du projet (https://hub.mesocentre.uca.fr/docs/cluster/hpc2/). Vous serez sous la responsabilité de Caroline Pont, et entouré.e d’ingénieur.e.s, doctorant.e.s et postdoctorant.e.s spécialisé.e.s en paléogénomique. 

Vous serez plus particulièrement en charge de :

Réaliser le benchmarking et le développement d’outils d’intelligence artificielle pour la génomique permettant l’analyse de la diversité génétique ancienne des blés, de sa comparaison avec la diversité génétique mondiale des blés modernes et l’identification de diversités génétiques anciennes et modernes plus particulièrement associées à des origines géographiques particulières et leurs contraintes environnementales associées. Les données d’ADN ancien restant très parcellaires et hétérogènes (données incomplètes, fragmentées, de faible couverture génomique) l’utilisation de deep learning ou l’élaboration de réseaux de neurones artificiels notamment (Graph Neural Network, GNN) peut permettre de prédire les types de blé, en fonction de leur nature génétique, adaptées à des environnements donnés. Des outils sont maintenant disponibles (Sun et al. 2024 ; Zhang et al. 2023) démontrant le potentiel de l'application du machine learning pour la reconstruction d'arbres phylogénétiques à l’aide du jeu d’apprentissage moderne.

Les données d’entraînement disponibles correspondent à :

  1. 1 420 accessions modernes de blés (couvrant 6 espèces dont T. aestivum, T. durum et T. timopheevii) apportant des données génétiques (3 923 023 polymorphismes de séquences) et des données « passeport » (pays d’origine, date d’enregistrement du cultivar) définissant une structuration géographique de la diversité génétique des espèces (cf publication Sow et al. 2025, doi.org/10.1038/s41477-025-02128-0) ;
  2. des données phénotypiques associées (Heading Date, Plant Height, Grain Weight) ;
  3. des données climatiques disponibles sur ClimateDT (https://www.ibbr.cnr.it//climate-dt/) correspondant à 19 variables bioclimatiques et la grille altitudinale disponibles dans la base de données Worldclim (Hijmans et al. 2005, Fick et al. 2017) ;
  4. des données archéologiques d’échantillons anciens de blés (T. aestivum, T. dicoccum, T. durum, T. timopheevii, T. monococcum…) couvrant 5 000 ans de domestication-sélection, et provenant principalement de sites palafittiques UNESCO de France (cf projet ArkaoAG, https://anr.fr/Projet-ANR-20-CE27-0013).

Références :

Pont et al. 2019 doi: 10.1186/s13059-019-1627-1

Sow MD et al. 2025 doi: 10.1038/s41477-025-02128-0. Epub 2025 Nov 17. 

Secomandi et al. 2025 doi.org/10.1038/s41588-024-02029-6

Hijmans et al. 2025 doi.org/10.1002/joc.1276

Stephen et al. 2017 doi.org/10.1002/joc.5086

Sun et al. 2024 doi: 10.1371/journal.pcbi.1011351

Zhang et al. 2023 arXiv :2302.08840v1

Vous pourrez travailler sur deux sites distants de 5 kilomètres.

Formations et compétences recherchées

Doctorat

Formation recommandée : doctorat dans le domaine de la bio-informatique / intelligence artificielle / modélisation-intégration des données / génomique-génétique. 

Connaissances souhaitées : 

- maîtrise de langages de programmation (Bash, Python, R, Gitlab, Conda, Snakemake, cluster de calcul type HPC en environnement Unix, …) ainsi que des outils d’interfaçage appliqués aux systèmes d'exploitation en génomique (Galaxy) ;

- exploration des séquences et gestion des NGS (variant calling/comparaison/mapping de séquences/ identification de barcode via Kmer/Blast/BWA/bowtie) et utilisation de banque de données génomiques (NCBI, nt core, …), alignement de séquences et phylogénie/phylogénomique, analyse de structure (Megan, Structure), génétique des populations ;

- biostatistique (machine learning, glm, modèles multivariés, ...) ;

- génomique comparative et génomique évolutive des populations. 

Expérience appréciée : bio-informatique / intelligence artificielle / modélisation-intégration des données / génomique-génétique.

Aptitudes recherchées : rigueur scientifique, autonomie, motivation, communication.

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

-  jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein) ;
- d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
- d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
- de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
- d'activités sportives et culturelles ;
- d'une restauration collective.

 

Le site de Crouël est directement desservi par la ligne de bus T2C numéro E4.

Modalités pour postuler

J'envoie mon CV et ma lettre de motivation

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr

Référence de l'offre

  • Contrat : Postdoc
  • Durée : 6 mois renouvelables
  • Début du contrat : 01/05/2026
  • Rémunération : A partir de 3 135,81€ brut mensuel
  • N° de l'offre : OT-28438
  • Date limite : 03/03/2026

Contact

Venir en France

Notre guide des accueils internationaux