Apprentissage OT-11697

Master 2 - Mention Bioinformatique parcours Bio-informatique Modélisation et Statistique (BIMS)

78352 Jouy-en-Josas Cedex

Retour à la liste des résultats

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 268 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

Développement de méthodes pour la détection de flux de souches et de gènes à partir de données métagénomiques shotgun le long d’une chaîne de production alimentaire

Contexte scientifique spécifique

Les écosystèmes microbiens complexes sont composés de plusieurs centaines ou milliers d’espèces différentes. Afin d’accéder à la diversité de ces écosystèmes, les technologies de séquençage métagénomique shotgun permettent d’obtenir des millions de lectures de courte taille (environ 100 bases), provenant des génomes présents dans l’écosystème. L’analyse de ces données nécessite des méthodes spécifiques pour identifier les espèces présentes dans ces écosystèmes. Cela permet de comparer les espèces présentes dans les échantillons. Le grand nombre de données disponibles de nos jours permet désormais d’aller plus loin dans les analyses et d’étudier la diversité au sein même des espèces bactériennes dans les échantillons métagénomiques. C’est sur cette thématique que l’équipe StatInfOmics travaille depuis quatre ans, et a mis en place un workflow d’analyse afin d’identifier les polymorphismes présents dans les souches d’un échantillon.
Le projet étendard INRAE TANDEM, porté par l’UMRF (INRAE Aurillac), (janvier 2021-décembre 2023) a pour objectif d’identifier les flux de micro-organismes le long de la chaîne de production des fromages, depuis la prairie jusqu’au microbiote intestinal de souris. Des expérimentations seront réalisées sur des chaînes de production d’un système intensif, et d’un système agro-écologique, où une perturbation sera introduite au sein de la chaîne. 10 compartiments successifs seront analysés par métagénomique amplicon (sol, effluents d’élevage, herbe, rumen, fécès, air, trayon, lait, fromage, fèces de rat à microbiote humanisé), et 4 par métagénomique shotgun (fromage, lait, rumen, microbiote intestinal).
Dans le cadre de ce projet, l’équipe StatInfOmics va prendre en charge le développement de méthodes d’analyses pour analyser finement les flux de micro-organismes et de gènes le long de la chaîne de production alimentaire à partir de données métagénomiques shotgun. Pour développer cette méthodologie, les données d’un projet précédent (MINDS) sont déjà disponibles et permettront le développement des méthodes d’analyse sans attendre la collecte des données du projet.

Mission (s) de l’apprenti.e

La première mission de l’apprenti.e sera de développer des méthodes pour de détecter des flux de souches et de gènes à partir de données de polymorphisme intra-espèce dans les données métagénomiques. Nous souhaitons, à partir de notre workflow d’analyse, développer une méthode qui serait plus précise que les méthodes actuelles fondées sur la comparaison des espèces présentes entre échantillons. Notre méthode s’appuie sur l’utilisation de génomes de référence pour l’identification des espèces, et sur l’identification des polymorphismes au sein de chaque espèce pour comparer les différentes souches observées dans les échantillons et leurs abondances relatives.  Il sera nécessaire de créer une banque de génomes de référence adaptée aux écosystèmes étudiés (en utilisant des génomes séquencés ou avec de l’assemblage métagénomique). On utilisera ensuite des modèles de mélange hiérarchiques prenant en compte l’évolution à courte échelle temporelle pour représenter la présence de souches voisines dans des échantillons apparentés, avec une structure spécifique pour prendre en compte la discontinuité introduite par la perturbation en milieu d’expérience.

Ces méthodes seront ensuite appliquées aux 252 échantillons du projet afin de comparer les échantillons le long de la chaîne alimentaire et d’identifier des flux de micro-organismes. Nous construirons des réseaux de co-occurence de souches, et comparerons ensuite les souches et flux identifiés entre les deux systèmes d’élevage (intensif et agro-écologique) et avec et sans perturbation.  

Nous souhaitons ensuite identifier des flux de gènes d’intérêt, qui seront identifiés en collaboration avec l’UMRF  ( par exemple : marqueurs de pathogénicité, gènes de résistances aux antibiotique, gènes d’intérêt technologiques) entre les différents compartiments de la chaîne alimentaire. Les méthodes mises en place précédemment seront appliquées aux flux de gènes d’intérêt et nous comparerons ces flux entre les différents systèmes d’élevage. L’interprétation des résultats sera faite en collaboration avec l’UMRF.

L’apprenti.e sera intégré.e dans le projet TANDEM, réalisé en collaboration entre 10 unités INRAE, et travaillera en particulier avec l’UMRF.

Formations et compétences recherchées

Licence/Master (Bac+3/5)

Modalités pour postuler

J'envoie mon CV et ma lettre de motivation

Référence de l'offre

  • Contrat : Apprentissage
  • Durée : 1 an
  • Début du contrat : 31/08/2021
  • N° de l'offre : OT-11697
  • Date limite : 30/09/2021
Le centre Ile-de-France - Jouy-en-Josas - Antony

UR 1404 MaIAGE Mathématiques et Informatique Appliquées du Génome à l'Environnement 78352 Jouy-en-Josas Cedex

Contact