Mission temporaire OT-14977

Ingénieur-e en modélisation sémantique des données et interopérabilité

84000 AVIGNON

Retour à la liste des résultats

Présentation INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 268 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

INRAE recrute deux ingénieur-e-s pour l’implémentation de pipelines sémantiques dédiés à l’annotation et la publication de données/métadonnées en écologie.

Contexte général
Afin de partager outils et résultats, les communautés scientifiques ont créé des Infrastructures de Recherche (IR) nationales et internationales. Ainsi l'IR AnaEE (Analysis and Experimentation on Ecosystems) offre des services d'étude des écosystèmes continentaux et participe au cluster ENVRI des infrastructures européennes en environnement. AnaEE développe un Système d'Information (SI) distribué basé sur l’interopérabilité sémantique. Une chaîne de traitements prototypée par AnaEE-France et ENVRI permet d’automatiser la génération et la publication des jeux de données (NetCDF) et des enregistrements de métadonnées (geoDCAT et ISO19115/19139, http://ceur-ws.org/Vol-2969/paper11-s4biodiv.pdf). Le travail proposé porte sur la mise en oeuvre de cette chaîne de traitements sur l'ensemble des plateformes expérimentales d’AnaEE. Il sera coordonné par INRAE et s'effectuera en collaboration avec le CNRS (France) et le CREA (Italie).

Description du travail
Vous serez responsable de la mise en oeuvre de la chaîne de traitements sémantiques des données. Ces données sont initialement gérées dans les systèmes d’information locaux des plateformes expérimentales. La première étape consiste à modéliser les données des expériences en utilisant un référentiel ontologique (Extensible Observation Ontology [OBOE]) extendu pour l’experimentation. La seconde étape consiste à traiter ces informations à l’aide d’un pipeline associant scripts shell et codes Java. Les données initiales sont ainsi converties en données portées par des graphes, exploités pour définir les contours des jeux de données et de métadonnées à générer et publier. Le traitement associe différents logiciels tels que yEd pour l’édition des graphes, des développements Java ad hoc pour générer les triplets RDF, Blazegraph pour leur gestion et exposition, Dataverse en tant qu’entrepôt de données et pour la génération des identifiants (DOI). Les éléments sont en conteneurs Docker.

Vous assisterez les plateformes dans la modélisation sémantique de leurs expérimentations et la mise en oeuvre de la chaîne de traitements des données. Vous contribuerez également à l'évolution des fonctionnalités offertes par le système.

Vous ferez partie de l’équipe ‘AnaEE sémantique’ et serez basée- à INRAE-PACA, Avignon. Vous interagirez avec les membres de l’équipe ainsi qu’avec les scientifiques et personnels techniques des plateformes expérimentales. Un des deux postes s’adresse aux plateformes françaises, l’autre aux plateformes européennes. L’activité donnera lieu à quelques visites de ces plateformes.

Formations et compétences recherchées

Master/Ingénieur (Bac+5)

• Connaissance des technologies sémantiques (RDF, OWL, SPARQL) et du web sémantique
• Expérience en matière de modélisation basée sur des ontologies
• Connnaissance en SQL, environnements mysql ou postgresql
• Bonne connaissance de l’environnment Linux et du langage Shell
• Expérience en matière de pipelines de traitements de données

Connaissances appréciées en :
• Blazegraph et (web)protege
• développement (Java)
• formats et standards de données et métadonnées
• sciences biologiques, écologie

• Bonne capacité de communication
• Aptitude à travailler en équipe et à interagir avec des scientifiques et techniciens
• Anglais technique courant pour un des deux postes

Formation et expérience :
• Master ou doctorat en informatique OU formation initiale en écologie et complémentaire en informatique / sémantique
• Expérience professionnelle souhaitée (2 ans)

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :

-  jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
- d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
- d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
- de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
- d'activités sportives et culturelles ;
- d'une restauration collective.

Modalités pour postuler

J'envoie mon CV et ma lettre de motivation
Offre emploi_AnaEE_semantiques_2022_fr.pdfpdf - 89.18 KB

Référence de l'offre

  • Contrat : Mission temporaire
  • Durée : 12 mois à 16 mois
  • Début du contrat : Dès que possible
  • Rémunération : 2338 à 2867€ brut/mois
  • N° de l'offre : OT-14977
  • Date limite : 15/08/2022

Contact

Venir en France Notre guide des accueils internationaux

Consulter