Optimisation d’un prototype logiciel open source pour l’automatisation du traitement des données expérimentales des stations de traitement des eaux usées

92160 Antony

Retour à la liste des résultats

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

Contexte                                                                                                                  

Au sein d’INRAE, l’unité PROSE mène des recherches sur les biotechnologies environnementales, depuis l’échelle des communautés microbiennes jusqu’à celle des procédés (stations d’épuration, digesteurs anaérobies et procédés bioélectrochimiques pour la bioraffinerie), en articulation avec les grands enjeux sociétaux de développement durable, d’économie circulaire et de bioéconomie.

Les stations d’épuration modernes génèrent des volumes importants de données (capteurs, prélèvements ponctuels ou campagnes de mesure), qui concernent les concentrations des divers polluants et les débits. Qu’elles soient utilisées pour analyser les performances des procédés ou pour alimenter des modèles dynamiques représentant leur fonctionnement, un processus de validation de la qualité de ces données est indispensable.

Actuellement, ce processus est effectué manuellement selon des procédures spécifiques à chaque utilisateur, ou via des plateformes logicielles commerciales, fermées et peu accessibles aux professionnels du domaine. 

Projet VAliDE

Le projet VAliDE (Validation Automatisée des Données Expérimentales dans le domaine du traitement et de la valorisation des eaux résiduaires urbaines) vise à combler ce manque. Porté par INRAE REVERSAAL, en collaboration avec l’unité INRAE PROSE et le laboratoire Deep (INSA de Lyon), il ambitionne de créer un outil d’accès libre et transparent qui permettra le traitement automatisé des données de fonctionnement et améliorera la fiabilité des données. 

Sujet du stage

Un prototype logiciel sous Python a été développé pour permettre de formater les données, détecter et corriger des erreurs de plausibilité, de cohérence et de valeurs aberrantes et imputer les données manquantes, à l’aide de différentes méthodes statistiques et machine learning (IQR, Tukey ajusté, Isolation Forest + SHAP, LOF, MICE, ARIMA, KNN et imputation itérative par forêts aléatoires). Une évaluation de cette première version du code Python doit être réalisée pour évaluer et comparer les méthodes employées. Pour cela, INRAE PROSE dispose de plusieurs jeux de données fiables et consolidés de variables d’entrée et de sorties de stations d’épuration.

Les objectifs du stage sont :

  1. Tester le prototype logiciel sur des jeux de données des stations d’épuration afin de de comparer différentes méthodes de traitement et d’imputation.
  2. Consolider l’outil en intégrant des variables supplémentaires, notamment le débit d’eau, pour évaluer l’effet des temps de pluie/sec sur les performances de traitement. Une phase de test et de validation sur les mêmes jeux de données sera également menée.

Déroulement du stage

Les principales étapes de ce stage sont :

  1. Etude bibliographique – contexte de l’étude
  2. Prise en main du prototype logiciel sous Python
  3. Campagne de tests du prototype logiciel sur plusieurs jeux de données
  4. Perturbation des jeux de données pour analyser la réponse des modèles
  5. Intégration de variables supplémentaires pour enrichir les modèles
  6. Evaluer des résultats avec et sans ces variables
  7. Analyse des résultats et rédaction d’un rapport de synthèse.

Formations et compétences recherchées

Master/Ingénieur (Bac+5)
  • Elève Ingénieur / Master 2, en Génie des Procédés avec de très bonnes aptitudes pour l’analyse statistique et le traitement des données, ou en Data Science / Analyse de données avec un bagage en Génie des Procédés.
  • Bonnes compétences en programmation sur Python et R
  • Rigueur et goût pour la recherche opérationnelle
  • Capacité à travailler de manière autonome tout en interagissant avec l’équipe d’encadrement.Elève Ingénieur / Master 2, en Génie des Procédés avec de très bonnes aptitudes pour l’analyse statistique et le traitement des données, ou en Data Science / Analyse de données avec un bagage en Génie des Procédés.
  • Bonnes compétences en programmation sur Python et R
  • Rigueur et goût pour la recherche opérationnelle
  • Capacité à travailler de manière autonome tout en interagissant avec l’équipe d’encadrement.

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

-  jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
- d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
- d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
- de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
- d'activités sportives et culturelles ;
- d'une restauration collective.

Modalités pour postuler

J'envoie mon CV et ma lettre de motivation

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr

stage_inrae_prose_vf.docxdocx - 977.08 KB

Référence de l'offre

  • Contrat : Stage
  • Durée : 6 mois
  • Début du contrat : 01/02/2026
  • Rémunération : 600€/mois environ
  • N° de l'offre : OT-27656
  • Date limite : 31/12/2025

Le centre

Ȋle-de-France-Jouy-en-Josas-Antony

PROSE

92160 Antony

Site web

Contact

Venir en France

Notre guide des accueils internationaux