Stage : Analyse multivariée de données métabolomiques longitudinales pour l’identification de profiles métaboliques et de biomarqueurs appliquée aux études nutritionnelles de cinétique postprandiale

63122 Saint-Genès-Champanelle

Retour à la liste des résultats

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

L’objectif général du stage est de développer et tester des approches multivariées de traitements de données de séries temporelles en métabolomique. En effet, la métabolomique, dernière-née des approches omiques, est aujourd’hui reconnue comme un outil puissant de phénotypage permettant d’avoir une vision intégrée du métabolisme, notamment, l’analyse des évolutions du métabolome sanguin en phase post-prandiale (après le repas) qui constitue une approche innovante d’exploration de la variabilité inter-individuelle.

Cependant, l’analyse de ces jeux de données massifs et complexes, comporte de nombreux défis, notamment du fait de leur nature (bruit, colinéarité, grand nombre de variables). En effet, les données sont produites sur :

  • des séries temporelles courtes (3 à 10 points de temps) ;
  • un nombre d’individus restreint (plusieurs dizaines) ;
  • un nombre de variables très élevé (plusieurs centaines voire des milliers).

Si des approches par modèles mixtes existent et répondent parfaitement au cas d’étude dans une optique univariée, des méthodes multivariées fiables manquent encore pour traiter ces données. De plus, de par la grande quantité de variables et le peu d’individus, les approches univariées manquent de puissance statistique et ne permettent pas une analyse globale du métabolisme des individus. Dans ce contexte, nous proposons d’explorer des méthodes d’analyse de séries temporelles en métabolomique, permettant à la fois de pouvoir identifier des variables avec des évolutions similaires mais également des individus ayant une réponse similaire.

L’objectif spécifique du stage sera de repartir des travaux de Bodein et al. (2022) qui proposent aujourd’hui une première approche, timeOmics, une solution pour répondre aux besoins de méthodes multivariées d’analyse de données omiques longitudinales. Cette approche consiste à modéliser chaque variable par un modèle mixte linéaire par morceaux (LMMS) sur les individus et le temps. Puis les cinétiques moyennes par variable sont analysées par des analyse multivariées PCA ou PLS, en considérant chaque point de temps comme un échantillon. Une limite identifiée est de réduire la dimension inter-individuelle avant l’analyse multivariée. Ainsi, une alternative serait de plutôt proposer une réduction de la dimension temporelle. De plus une exploration de différentes méthodes de clustering à partir des modélisation LMMS serait nécessaire tout comme l’enrichissement de la méthode de modélisation avec par exemple des modèles mixtes non-linéaires.

Précisions : Vos travaux seront appliqués aux séries temporelles de données métabolomiques issues de l’analyse d’échantillons sanguins humains. Sera pour cela mise à disposition les données d’une cohorte dont l’objectif scientifique est l’identification de marqueurs de réponse métabolique post-prandiale à des programmes d’activité physique et nutritionnels chez la personne âgée à petit appétit. Cette cohorte dispose de 70 cinétiques pré- et post-intervention.

Les objectifs sont :

  1. d’appliquer et adapter l’approche timeOmics sur les cinétique basales (avant intervention) pour identifier des clusters de métabolites ;
  2. de proposer une solution pour identifier des clusters d’individus sur les métabolites les plus représentatifs de leurs propres clusters ;
  3. d’explorer les améliorations possibles à l’approche timeOmics (modélisation, méthodes de clustering, réduction de la dimension temporelle au profit de la dimension inter-individuelle) ;
  4. de développer une méthode pour comparer ces analyses faites en pré- et post-intervention.

Tous ces objectifs seront à réaliser en collaboration et sous la supervision de l’encadrant du stage : Etienne JULES

Formations et compétences recherchées

Licence/Master (Bac+3/5)

Formation recommandée : Master 1 ou équivalent en lien avec les statistiques et leurs développement informatique

Connaissances et compétences souhaitées :

  • bonne connaissance et pratique du langage R ou Python (les deux seraient appréciés) ;
  • connaissance et appétence pour les bonnes pratiques de programmation informatique ;
  • être capable d’appréhender raisonnablement les concepts de méthodes statistiques non nécessairement maîtrisées initialement, de même pour l’utilisation de solutions logicielles ;
  • connaissance des bases de versionnement de code / forge logicielle (Git).

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

- 2,5 jours de congés par mois de présence ;
- d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
- d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
- de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
- d'activités sportives et culturelles ;
- d'une restauration collective.

Le site de Theix situé à Saint-Genès-Champanelle est desservi par une ligne T2c (numéro P39) ainsi qu’une ligne de transport à la demande, il est également équipé de stationnements et de services dédiés à la pratique du vélo.

Modalités pour postuler

J'envoie mon CV et ma lettre de motivation

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr

Référence de l'offre

  • Contrat : Stage
  • Durée : 6 mois
  • Début du contrat : 02/03/2026
  • Rémunération : 4,50€ par heure de présence effective
  • N° de l'offre : OT-27972
  • Date limite : 15/12/2026

Contact

Venir en France

Notre guide des accueils internationaux