OFFRE DE STAGE : Appariement automatisé de données alimentaires

91120 Palaiseau

Retour à la liste des résultats

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

Vous serez accueilli·e au sein de l’Unité Mixte de recherche PSAE (Paris-Saclay Applied Economics), située sur le campus AgroParisTech à Palaiseau, dans l’équipe ODALIM (Outils et Données en ALIMentation) qui est en charge d’une plateforme éponyme multidimensionnelle sur l’alimentation. ODALIM a pour but d’intégrer des données de consommation, nutritionnelles, sanitaires, sensorielles et environnementales, ainsi que des outils nécessaires à l'interopérabilité et à la diffusion de toutes ces données.

Afin de faciliter l’interopérabilité des bases de données agro-alimentaires, ODALIM a développé un outil d’appariement dénommé MatchingCore. Cet outil est basé sur des technologies NLP récentes, en particulier les Large Language Models (LLM). Les suggestions d’appariement de l’outil sont également accompagnées d’indicateurs qui permettent d’apprécier la pertinence des propositions faites. Votre stage s’inscrit dans un projet de long-terme portant sur les possibilités apportées par les technologies NLP pour améliorer les performances d’un modèle non supervisé dédié à l’appariement de référentiels de produits alimentaires. Vos missions consisteront à étudier, améliorer et utiliser l’outil MatchingCore afin de produire de nouveaux appariements essentiels aux futures recherches menées au sein d’INRAE pour comprendre les liens entre alimentation, santé et environnement.

Votre serez encadrée par le responsable opérationnel de la plateforme, et travaillerez en étroite collaboration avec la data-scientiste de l’équipe et le chercheur expert en technologies NLP de PSAE.

Cette offre est un stage de 3-6 mois pour l’année 2026.

Plus d’informations sur : https://odalim.inrae.fr

Aperçu des missions et activités détaillées :

  • Dans un premier temps, vous vous approprierez MatchingCore et prendrez connaissance des bases hébergées par ODALIM (achats de ménages, valeurs nutritionnelles, ingrédients, impact environnemental).
  • Dans un second temps, vous serez amené·e à effectuer des appariements entre ces bases en vous appuyant sur MatchingCore et votre connaissance de l’offre alimentaire.
  • La qualité des appariements réalisés sera au coeur de votre travail. Vos retours d’expérience quant aux performances de MatchingCore dans les tâches d’appariement serviront de socle à de nouvelles améliorations de l’outil auxquelles vous prendrez part.

Formations et compétences recherchées

Master/Ingénieur (Bac+5)

Formation recommandée : M2 recherche/diplôme d’ingénieur ou équivalent en science des données.

Compétences recherchées

  • Connaissances sur les technologies NLP (méthodes classiques type Transformers, LLMs plus récents) ;
  • Connaissances en développement ;
  • Connaissances en apprentissage non supervisé ;
  • Structurer et rédiger un document d’étude ;
  • Structurer et rédiger un document technique ;
  • Veiller au respect des dispositions qualité et des normes de programmation ;
  • Transmettre un certain nombre de savoir-faire en adaptant ses explications au public concerné ;
  • Veiller au respect des règles de sécurité et de confidentialité liées à la manipulation des données sensibles.

Autres compétences

  • Notions en conteneurisation (docker) ;
  • Notions en gestion des données ;
  • Notions en prompting de LLMs.

Environnement

  • Systèmes d'exploitation : Windows, Linux ;
  • Langages informatiques : Python ;
  • Environnement technique : Docker, base de données vectorielle (ChromaDB), serveurs LLM (vLLM, Ollama), BERT, Mistral ;
  • Environnement de travail : GIT (GitLab).

Aptitudes recherchées : Travail en équipe, esprit d’initiative.

Modalités pour postuler

J'envoie mon CV et ma lettre de motivation

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr

Référence de l'offre

  • Contrat : Stage
  • Durée : 3 à 6 mois
  • Début du contrat : 15/05/2026
  • Rémunération : Gratification ( 4.50 € nets / heure )
  • N° de l'offre : OT-28803
  • Date limite : 15/04/2026

Contact

Venir en France

Notre guide des accueils internationaux