CONCOURS CR-2021-MATHNUM-1

Chargé-e de recherche apprentissage statistique

75000 PARIS

Retour à la liste des postes de la campagne

Présentation d'INRAE

L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche placé sous la double tutelle du ministère en charge de l’agriculture et du ministère en charge de la recherche. 

C'est un acteur majeur de la recherche et de l’innovation créé le 1er janvier 2020. Institut de recherche finalisé issu de la fusion entre l’Inra et Irstea, INRAE rassemble une communauté de 12 000 personnes, avec 268 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. 

L’institut se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal, et se classe 11ème mondial en écologie-environnement. Face à l’augmentation de la population, au changement climatique, à la raréfaction des ressources et au déclin de la biodiversité, INRAE construit des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.

Environnement de travail, missions et activités

L'Unité Mixte de Recherche (UMR) MIA-Paris regroupe des statisticiens et des informaticiens spécialisés dans la modélisation et l’apprentissage statistique et informatique pour la biologie, l’écologie, l’environnement, l’agronomie et l’agro-alimentaire. Leurs compétences portent sur les méthodes d’inférences statistiques et algorithmiques. Parmi les 3 équipes qui structurent l'unité, l'équipe "Statistique et Génome" (S&G) développe et diffuse des méthodes statistiques de modélisation et d’apprentissage pour l’analyse de données issues de de la biologie moléculaire. Pour maintenir son expertise et s’adapter à l’évolution des technologies (notamment l'utilisation massive des données de séquençage et d'abondance), l'équipe doit renouveler en permanence les méthodes d'analyse statistique (réduction de dimension, modélisation temporelle ou spatiale, clustering, analyse fonctionnelle), du fait de la perte de l’hypothèse gaussienne et l'utilisation massive des données de comptage multivariées.
Ainsi, S&G souhaite renforcer et diversifier ses compétences en recrutant un-e candidat-e ayant des compétences sur des modèles à l'interface des statistique et du transport, de l'apprentissage automatique, de l'apprentissage profond ou des processus discret.
Vous contribuerez au développement de méthodes pour la représentation, la modélisation ou l'intégration de données en apportant des compétences nouvelles à l'équipe telles que i) les processus à valeurs discrètes (processus de comptage, InAR, GLARMA) pour la modélisation des données temporelles univariées ou multivariées, ii) les approches génératives en apprentissage (Variational auto-encoders, Generative Adversarial Network) et leurs liens avec la modélisation statistique conventionnelle pour l’analyse non supervisée de vastes ensembles de données, ou iii) les approches récentes en apprentissage (noyaux, métrique de transport) pour le traitement de données hétérogènes. Vous appliquerez vos méthodes à des questions telles que l’inférence de réseaux de gènes en biologie moléculaire, l’inférence d’interaction entre espèces en écologie microbienne, la modélisation de cinétiques de données transcriptomiques; la réduction de dimension ou la classification non supervisée de données de cellule unique. Vous collaborerez avec les membres de l'équipe "Statistique et Génome", qui possèdent une expertise reconnue pour l’analyse statistique des données issues du génome. Vous serez amené-e à tisser des liens avec les autres équipes de l'UMR pour vous appuyer sur leur expertise complémentaire à "Statistique et Génome" (EKINOCS: optimisation, apprentissage ; MORSE: processus, trajectoire). Vous intégrerez les projets financés en cours liés à votre domaine de compétence et en menerez de nouveaux pour asseoir les thèmes méthodologiques que vous amenerez dans l'unité. Vous serez intégré(e) aux réseaux méthodologiques nationaux du département MathNum animés par les membres de l’équipe (NetBio, StateOftheR, StatOmique), ainsi qu'au tissu régional d'INRAE en Île-de-France (MaIAGE, Plateforme MIGALE, LaMME côté MathNum; GQE, IJPB, plateforme transcriptomique IPS2 côté départements partenaires et pour les applications dans le domaine moléculaire). Vous profiterez du tissu extrêmement riche du plateau de Saclay, l’unité émarge notamment à l’école doctorale Jacques Hadamard et au séminaire Palaisien en Stat/Math/Info.

Déménagement sur le campus de Palaiseau en 2022

Formations et compétences recherchées

Doctorat ou équivalent

Concours ouvert aux candidats titulaires d'un doctorat ou équivalent.
Un doctorat en statistiques ou machine learning est souhaité, ainsi qu'un solide bagage en statistiques multivariées et de très bonnes compétences dans l’implémentation des techniques inférentielles de votre spécialité à l’aide de langages tels que R et/ou Python.
Des développements méthodologiques sur des modèles à l'interface des statistique utilisant des notions transport optimal, d'apprentissage automatique, d'apprentissage profond ou de processus discret seraient vivement appréciés.
Un intérêt pour les problématiques de biologie, voire une expérience de recherche interdisciplinaire en science du vivant, ainsi que des capacités à interagir en collaboration avec des biologistes sont souhaités.
Enfin, la maîtrise de l'anglais est souhaitée ainsi qu'une expérience internationale de longue durée : les lauréats qui n'en auraient pas encore eu devront réaliser un séjour à l'étranger à l’issue de l’année de stage.

Votre qualité de vie à INRAE

En rejoignant INRAE, vous bénéficiez :

- de 30 jours de congés + 15 RTT par an (pour un temps plein)
d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formationconseil en orientation professionnelle ;
d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
d'activités sportives et culturelles ;
- d'une restauration collective.

Modalités pour postuler

  1. Je télécharge le guide Guide des candidats pdf - 3.38 MB
  2. Je note le numéro du profil CR-2021-MATHNUM-1
  3. Je m'inscris GO

Référence de l'offre

  • N° profil : CR-2021-MATHNUM-1
  • Corps : CRCN
  • Catégorie : A
  • Numéro du concours : 20

En savoir plus