Doctorat en Informatique - Modélisation, intégration et exploitation sémantique des variables scientifiques pour des domaines multidisciplinaires à l'aide d'un graphe de connaissances RDF

34000 Montpellier

Retour à la liste des résultats

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

L’institut est engagé dans la science ouverte et la mise en œuvre des principes FAIR. Il participe activement à de nombreux projets européens, notamment dans le cadre de l’European Open Science Cloud. En tant qu’acteur clé de la gestion des données agroalimentaires, l’INRAE contribue également activement au développement de l’Espace européen des données agricoles (CEADS) et au Partenariat "Agriculture of Data".

Environnement de travail, missions et activités

Le ou la doctorant.e rejoindra l’unité de recherche MISTEA (MathNum, INRAE Montpellier), spécialisée dans la modélisation, la science des données et les systèmes d’information pour l’agriculture et l’environnement. Le sujet de la thèse porte sur la création et l’exploitation d’un graphe de connaissances RDF dédié aux variables scientifiques utilisées dans les domaines de l’agroécologie, du phénotypage végétal et des sciences de l’environnement. Il s’inscrit dans la continuité des travaux menés sur les plateformes AgroPortal, EarthPortal et OpenSILEX/PHIS.

Contexte

Contexte : Les sciences environnementales et agricoles (comme l'agro-écologie, le phénotypage des plantes, etc.) génèrent des volumes importants de données expérimentales. Ces données sont souvent exprimées à travers des mesures de variables scientifiques (ou propriétés observables) provenant de sources et de domaines variés, mesurant un trait ou une caractéristique à différentes échelles, avec une méthode et une unité spécifique. Ces variables scientifiques, lorsqu’elles sont structurées, sont représentées selon des schémas et formalismes divers tels que OBOE, I-ADOPT, SSN/SOSA, ou le modèle de la Crop Ontology.

Problématique

Les divergences dans les formalismes et les ontologies utilisées pour représenter ces variables limitent l'interopérabilité, la réutilisation des données et leur intégration dans des systèmes d'analyse sémantique. Comment concevoir un graphe de connaissances RDF qui permette d'unifier les représentations et exploiter ces variables tout en

respectant les spécificités de chaque domaine et ontologie ? 

Contributions attendues

(i) Un cadre théorique et pratique pour l'intégration des variables scientifiques via des

formalismes de représentation différents.

(ii) Construire un graphe RDF basé sur ces ontologies pour intégrer et lier les variables scientifiques provenant de différentes sources et disciplines, en particulier le phénotypage des plantes. 

(iii) Des algorithmes ou des outils –entre autres basés sur les méthodes d’apprentissage automatique appliquées au graphes RDF– pour l'interrogation et l'exploitation des données sémantiquement unifiées dans ce graphe de connaissances.

Missions principales

  • Définir une modélisation unifiée des variables scientifiques (ou "propriétés observables") issues de différentes ontologies (OBOE, I-ADOPT, SSN/SOSA, Crop Ontology...).
  • Construire un graphe de connaissances RDF intégrant ces variables en s’appuyant sur les technologies du Web sémantique (OWL, RDF, SPARQL…).
  • Exploiter les ressources sémantiques des portails d’ontologies tels que AgroPortal et EarthPortal pour structurer et enrichir le graphe.
  • Appliquer des méthodes d’apprentissage automatique sur graphes (graph embeddings, PyKEEN, DGL-KE...) pour l’analyse, la réconciliation et l’enrichissement des variables.
  • Mettre en place un système de dialogue interactif, basé sur un grand modèle de langue (LLM) comme GPT ou Mistral, afin d’assister la création ou la correction de variables.
  • Travailler avec des jeux de données de variables scientifiques existants en phénotypage des plantes ou sciences environnementales.
  • Participer à la diffusion scientifique (publications, présentations, ateliers), ainsi qu’à des actions de validation en lien avec des experts thématiques (agronomie, phénotypage, modélisation…).
     

Formations et compétences recherchées

Master/Ingénieur (Bac+5)

Nous recherchons un.e doctorant.e motivé.e, curieux.se et orienté.e vers la science ouverte (FAIR), avec une expertise en technologies sémantiques, ingénierie des connaissances et science des données. Le ou la candidat.e rejoindra une équipe de 4 à 5 personnes à l’INRAE dans un contexte national et européen stimulant.

Compétences requises

  • Diplôme de Master en informatique, science des données, intelligence artificielle, ou ingénierie des connaissances.
  • Connaissance des technologies du Web sémantique : ontologies, OWL, RDF, SPARQL.
  • Sensibilité aux principes FAIR et à la gestion des données de recherche.
  • Capacité à travailler dans des projets collaboratifs, y compris à l’échelle européenne.
  • Bonnes aptitudes rédactionnelles, d’organisation et de communication (anglais requis, francais fortement recommandé).
  • Autonomie, rigueur, sens de l’initiative.
  • Acceptation de déplacements en France et à l’international.

Atouts supplémentaires

  • Expérience avec des données agricoles ou des ontologies environnementales.
  • Connaissance d’outils comme AgroPortal, Protégé, OpenSILEX, ou des plateformes de gestion d’ontologies.
  • Compétences en développement d’application Web.
  • Connaissance des approches de science ouverte.

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

-  jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
- d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
- d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
- de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
- d'activités sportives et culturelles ;
- d'une restauration collective.

Modalités pour postuler

Comment postuler

Les candidat(e)s intéressé(e)s sont invité(e)s à envoyer leur candidature à l’adresse suivante : clement.jonquet@inrae.fr

Des entretiens à distance ou en présentiel seront organisés.

Les documents requis (au format PDF) sont :

  • un curriculum vitae décrivant votre formation et votre expérience ;
  • une lettre de motivation expliquant votre intérêt pour le sujet et votre adéquation avec le profil attendu ;
  • des copies de vos diplômes les plus élevés et/ou autres certificats pertinents et/ou relevés de notes ;
  • les noms et coordonnées de personnes référentes (enseignants, encadrants, responsables de stage, etc.).

Pour toute information complémentaire sur ce sujet de thèse, vous pouvez contacter Clément Jonquet à l’adresse clement.jonquet@inrae.fr. Plus de détails disponibles après contact.

Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr

Référence de l'offre

  • Contrat : Thèse
  • Durée : 36 mois
  • Début du contrat : 01/10/2025
  • Rémunération : 2200€
  • N° de l'offre : OT-26047
  • Date limite : 30/09/2025

Le centre

Occitanie-Montpellier

MISTEA

34000 Montpellier

Site web

Venir en France

Notre guide des accueils internationaux