Stage : Estimation de paramètres génétiques dans un modèle multivarié à copule avec une méthode de descente de gradient stochastique

31320

Retour à la liste des résultats

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

En génétique animale, de nombreux phénotypes sont souvent mesurés et analysés conjointement, pouvant combiner des caractères de production, de reproduction et de ‘bien-être’. Ces caractères d’intérêt peuvent être fortement corrélés. La prédiction du potentiel génétique des animaux, combinant ces caractères, repose alors sur des modèles linéaires mixtes multivariés.  Ces modèles issus de la génétique quantitative, permettent de séparer les effets génétiques des effets environnementaux et de sélectionner des individus multi-performants pour produire les animaux de demain, répondant aux attentes sociales, environnementales ainsi que des agriculteurs. Ils sont classiquement basés sur des conditions de normalité jointe des vecteurs phénotypiques, rarement vérifiées en pratique. Dans un article récent (Rohmer et al. 2022), nous avons montré que dans le cas de caractères multivariés, la non-adéquation de la normalité du modèle, couplé à un processus de sélection reproducteurs, pouvait entraîner des biais conséquents dans les estimations des paramètres génétiques. Dans un précédant stage, valorisé par un article scientifique ainsi que par un poster de conférence (Rohmer et al. 2025), nous avons développé un algorithme d’estimation adapté au cadre du modèle à copule non-Gaussienne, plus adéquat dans le cas de caractères bivariés sous sélection. Plus précisément, une stratégie de descente de gradient stochastique a été développée pour l’estimation des paramètres génétiques.

Dans ce second stage, nous souhaiterions étendre le modèle à la dimension supérieure pour traiter l’aspect multi-caractères. L’algorithme d’optimisation numérique sera adapté par une étape de pré-conditionnement par la matrice de Fisher en suivant un article récent (Baey et al. 2023) pour le rendre plus robuste à une plus grande dimension. De nouvelles simulations seront attendues, ainsi que la participation au développement potentiel d’un package R. Enfin d’un point de vue méthodologique, le stagiaire participera à la réflexion autour du choix de modèle à copule en fonction des données. 

Références :

Rohmer, T., Ricard, A. & David, I. (2022), ‘Copula miss-specification in REML multivariate genetic animal model estimation’, Genetics Selection Evolution 54(1)⟨hal-03681151⟩

Rohmer, T., Bruning, V.,  Kuhn, E. (2025) G+E copula model to improve the estimation of the genetic parameters in bivariate mixed model. Article⟨hal-04995008⟩, poster de conference: https://hal.inrae.fr/hal-04633406v1

Baey, C., Delattre, M., Kuhn, E., Leger, J.-B., Lemler, S. (2023) Efficient preconditioned stochastic gradient descent for estimation in latent variable models. 40th International Conference on Machine Learning (ICML 2023), Honolulu, United States. ⟨hal-04131641⟩
 

Ce stage s’intègre dans le projet ANR AgriCoolTools  https://agricooltools.mathnum.inrae.fr/. Vous serez accueilli(e) au sein de l’équipe Chamade de l’unité GenPhySE d’INRAE de Toulouse et vous travaillerez en étroite collaboration avec l’équipe Dynenvie de l’unité MaIAGE d’INRAE de Jouy-en-Josas. Dans le cadre de cette collaboration, il sera possible de prévoir deux séjours de quelques jours à l’UR MaIAGE d’INRAE à Jouy-en-Josas.

Vous serez plus particulièrement en charge de :

  • Adapter un algorithme de gradient stochastique aux modèles multivariés
  • Implémenter l’algorithme en R
  • Étudier les performances en termes d’estimation et de prédiction au travers de simulations
  • Développer une stratégie de choix de modèle à copules adaptée au cadre multivariée

 

Formations et compétences recherchées

Master/Ingénieur (Bac+5)

Formation recommandée : Master de mathématiques appliquées ou statistiques

Connaissances souhaitées : estimation statistique, modèle linéaire mixte, bonne maîtrise du logiciel R. Un interêt pour les applications en agronomie est souhaitée.

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

- 2.5j de congés par mois au prorata du temps de présence (pour un temps plein)
- d'activités sportives et culturelles ;
- d'une restauration collective.

Modalités pour postuler

J'envoie mon CV et ma lettre de motivation

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr

Référence de l'offre

  • Contrat : Stage
  • Durée : 6 mois
  • Début du contrat : 01/02/2026
  • Rémunération : 4.35 €/heure (35h par semaine)
  • N° de l'offre : OT-27615
  • Date limite : 01/03/2026

Le centre

Occitanie-Toulouse

UMR GenPhySE

31320

Site web

Contact

Venir en France

Notre guide des accueils internationaux