MOBILITÉ CAMOB20-IE-MICA-1

Ingénieur-e d'études en fouille de données haut-débit de bioprocédés

92761 ANTONY

Retour à la liste des postes de la campagne

Présentation d'INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche placé sous la double tutelle du ministère en charge de l’agriculture et du ministère en charge de la recherche. 

C'est un acteur majeur de la recherche et de l’innovation créé le 1er janvier 2020. Institut de recherche finalisé issu de la fusion entre l’Inra et Irstea, INRAE rassemble une communauté de 12 000 personnes, avec 268 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. 

L’institut se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal, et se classe 11ème mondial en écologie-environnement. Face à l’augmentation de la population, au changement climatique, à la raréfaction des ressources et au déclin de la biodiversité, INRAE construit des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

L'activité s'exercera au sein de l'unité de recherche PROSE (Procédés biotechnologiques au Service de l'Environnement) située à Antony (92) et qui comporte 20 agents permanents. L'activité de l'unité PROSE porte d'une part sur la compréhension et l'optimisation du fonctionnement de procédés de biotechnologie environnementale (stations de traitement et de valorisation des eaux usées, stockage et méthanisation de déchets). Un autre volet de l'activité de PROSE porte sur la conception et l'évaluation de procédés innovants tels que les procédés bioélectrochimiques, sur lesquels l'unité coordonne ou a coordonné plusieurs projets, dont un projet "Investissements d'Avenir". L'UR PROSE développe depuis plusieurs années des méthodes originales couplant chimie analytique et biologie moléculaire et plus récemment des approches métaomiques, afin d'approfondir notre connaissance du fonctionnement des microbiotes des procédés de biotechnologie environnementale. Ces approches ont pour but d'optimiser la gestion des bioprocédés existants et de développer les bioprocédés du futur.
Afin de valoriser les jeux de données métaomiques dans une perspective de biotechnologie, le développement d'entrepôts permettant une organisation appariée de ces nouvelles données avec les métadonnées des procédés associées et la mise en œuvre de nouvelles méthodes d'analyse conjointe sont les défis sur lesquels nous travaillons depuis plusieurs années. En s'appuyant sur un premier entrepôt de données, nous déployons des méthodes intégratives de fouille de données afin d'affiner notre compréhension du fonctionnement des microbiotes de bioprocédés et d'identifier la structuration de l'espace des données à l'aide d'approches biostatistiques. L'objectif est d'être en mesure de développer à terme des outils de diagnostic ou de contrôle de ces procédés biotechnologiques qui tirent parti des évolutions rapides des technologies d'analyse et de séquençage.
Vous serez inséré-e dans cette dynamique en ayant pour mission d'organiser la collecte, la gestion, la préparation des données et leur traitement au moyen des outils statistiques et informatiques les mieux adaptés au contexte des projets menés au sein de l'unité PROSE. Vous travaillerez en étroite collaboration avec les porteurs de projets de l'unité et plus particulièrement les chercheurs déjà impliqués dans le développement de l'entrepôt de données et des outils de fouille de données. Vous contribuerez en particulier au déploiement de méthodes biostatistiques et d'apprentissage machine. Vous serez intégré·e au sein du pôle analytique (6 agents) qui regroupe les activités analytiques en écologie microbienne, chimie et bioinformatique. Afin d'adapter la conception et la gestion de l'entrepôt de données au contexte des projets de l'unité vous y développerez des interactions fortes avec les analyticiens générant les données et avec l'ingénieur d'étude en charge du développement des pipelines bioinformatiques de traitement des données métaomiques.
Dans ce cadre, vous exercerez les activités suivantes :
-Organiser la chaîne de traitement des données, de la collecte à leur analyse à l'aide d'approches statistiques et d'apprentissage machine.
-Choisir et appliquer les méthodes existantes les plus pertinentes sur des corpus de données.
-Déterminer les logiciels les mieux adaptés et les plus performants pour l'étude ou le projet en cours.
-Développer des programmes spécifiques pour prendre en compte les particularités d'une étude de fouille de données.
-Assurer la mise en œuvre d'études de fouille de données.
-Apporter le conseil aux utilisateurs qui ont besoin de mettre en œuvre des méthodes et des outils de fouille de données.
-Rédiger des documentations pour les utilisateurs des chaînes de traitement.
-Participer à la rédaction des rapports et des synthèses de présentation des résultats des fouilles de données.
-Effectuer des présentations et des formations pour assurer un transfert de compétences.

Vous serez rattaché·e au CATI BOOM. Le poste ouvre droit au bénéfice de la modulation d'IFSE liée à l'expertise informatique (Prime de Fonction Informatique) de niveau Analyste si vous êtes déjà reconnu·e et en exercice sur fonction Analyste.

Dans un premier temps il sera important d'interagir avec les informaticiens de la DSI d'IRSTEA ayant coordonné la conception de l'entrepôt de données.

Formations et compétences recherchées

Une première expérience en conception et gestion de bases de données (par exemple utilisation d'outils tels que PostgreSQL, et Elasticsearch) serait un plus, de même qu'une première expérience en fouille de données.
Connaissances et compétences opérationnelles.
Connaissances de bon niveau en statistiques.
Une connaissance des méthodes d'apprentissage machine.
Maîtrise de techniques et outils statistiques et informatiques de collecte et traitement de données.
Programmation informatique dans plusieurs langages (R et Python seraient un plus).
Construire et gérer une base de données.
Rédiger la documentation pour les utilisateurs.
Réaliser des synthèses.
Qualités et savoir être.
Sens de l'initiative.
Sens critique.
Sens de l'organisation.
Sens relationnel.
Capacité de conceptualisation.
Capacité de raisonnement analytique.
Curiosité intellectuelle.

Modalités pour postuler

  1. Je télécharge le guide Guide et annexe technique pdf - 1.82 MB
  2. Je note le numéro du profil CAMOB20-IE-MICA-1
  3. Je m'inscris GO

Référence de l'offre

  • N° profil : CAMOB20-IE-MICA-1
  • Corps : IE
  • Catégorie : A
  • Emploi-type : E2D46
    Référentiel des emplois types
  • Numéro du concours : CAMOB20-IE-MICA-1

En savoir plus