MOBILITÉ CAMOB25-IE-BAP-4
Biologiste en traitement des données génomiques (F/H)
34000 MONTPELLIER
Retour à la liste des postes de la campagne
Présentation d'INRAE
INRAE, Institut national de recherche pour l’agriculture, l’alimentation et l’environnement, est un organisme public de recherche qui réunit 12 000 collaborateurs au sein de 272 unités réparties sur 18 centres en France. Premier organisme mondial spécialisé sur l’ensemble agriculture – alimentation – environnement, INRAE joue un rôle clé pour accompagner les transitions nécessaires face aux grands défis planétaires.
Face à l’augmentation de la population, aux enjeux de sécurité alimentaire, au changement climatique, à la raréfaction des ressources et au déclin de la biodiversité, INRAE s’engage à développer des solutions scientifiques et à accompagner l’évolution des pratiques agricoles, alimentaires et environnementales.
Environnement de travail, missions et activités
Vous exercerez votre activité au sein d’AGAP Institut (Institut Amélioration Génétique et Adaptation des Plantes méditerranéennes et Tropicales) qui regroupe plus de 400 personnes développant une recherche d'excellence en biologie des plantes et génétique. Au sein de l’unité, nous utilisons des données génomiques et phénotypiques pour documenter la variabilité qui s’exprime dans des environnements changeants et des couverts diversifiés, et comprendre les mécanismes évolutifs façonnant la diversité génétique des populations ainsi que les déterminants génétiques des traits adaptatifs et d’intérêt agronomique. Nos travaux visent en particulier à mobiliser la diversité pour développer une agriculture plus durable. Vous serez basé-e dans le bâtiment ARCAD, et développerez vos activités en forte interaction entre le plateau de bio informatique de l’unité et l’équipe Génomique Évolutive et Gestion des Populations. Vous travaillerez également en étroite relation avec le plateau de génotypage INRAE-ARCAD qui rassemble des équipements de génotypage à la pointe de la technologie.Ces dernières années ont été marquées par une forte évolution de la production de données de séquence, aussi bien qualitativement que quantitativement. Les données de séquence, dites "de nouvelle génération", sont produites par différentes technologies (Illumina, PacBio, Sequel) et concernent plusieurs cibles (transcriptome, génome entier, etc). Le choix des technologies et des modalités de mise en œuvre dépendent des questions de recherche, et des caractéristiques des espèces (par ex, espèces polyploïdes), et sont donc redéfinies précisément pour chaque projet. Les données brutes générées par les séquenceurs nécessitent plusieurs traitements avant d’être livrées, sous une forme exploitable, à des biologistes travaillant dans des champs tels que la génomique des populations, la génomique comparative et la génétique quantitative. Ceci se fait via des chaînes de traitement (i.e. pipelines) combinant plusieurs outils pour lesquels les formats d’entrées et de sorties peuvent différer, ce qui implique souvent l’inclusion d’étapes de reformatage des données. Ces pipelines doivent prendre en compte les spécificités des choix méthodologiques faits en amont et impliquent des échanges soutenus avec les scientifiques dès les phases de conception pour définir et ajuster le traitement des données aux questions scientifiques. Dans ce contexte, vous contribuerez aux projets de recherche de l’unité et vous assurerez la formation des biologistes dans l’utilisation de pipelines.
Vous serez en charge de :
- Mettre au point, utiliser et faire évoluer des pipelines de traitement de jeux de données en lien étroit avec les scientifiques ;
- Assurer la veille sur les nouveaux outils, et les intégrer dans les pipelines ;
- Documenter ces pipelines et les rendre facilement utilisables par les biologistes indépendamment du cluster de calculs qu’ils utilisent. Inclure dans les pipelines des sorties de type "contrôle qualité” (statistiques descriptives) permettant la traçabilité et la reproductibilité des analyses (FAIR). Vous devrez donc maîtriser au moins un gestionnaire de workflow (e.g. nextflow) et un outil de contrôle de version (e.g. git) ;
- Écrire des scripts permettant la mise en forme des données et la conversion de formats de fichier. Vous devrez donc maîtriser au moins un langage de programmation (python, java) ;
- Utiliser un cluster de calculs. Vous devrez donc maîtriser au moins un gestionnaire de jobs (SGE ou SLURM) et maitriser linux et bash ;
- Former et accompagner les biologistes à l’utilisation des pipelines Vous interagirez avec le responsable de la plateforme de génotypage pour accélérer la mise au point de nouveaux protocoles (retours rapides sur les données produites et “contrôle qualité” lors de la livraison des données).
De par votre travail de mise en forme et de pré-traitement des données, vous ferez le lien entre la plateforme de génotypage produisant ces données et les scientifiques qui les analyseront pour répondre à leurs questions, chaînon manquant aujourd'hui dans l’équipe. Pour remplir vos missions, vous pourrez vous appuyer sur la dynamique de la communauté bio-informatique locale, notamment via le plateau bio informatique de l’unité, la plateforme South Green, les réunions bio-informatiques mensuelles ARCAD, et le réseau MBI (ingénieurs bio informatique de Montpellier). Vous produirez ainsi des outils qui pourront être partagés et utilisés plus largement, et contribuerez ainsi au développement bio informatique de l’unité.
Formations et compétences recherchées
Domaine de formation recommandée en agronomie, bio informatique.Des connaissances de base en génétique et génomique sont nécessaires pour ce poste. Si besoin, des formations complémentaires pourront être envisagées pour monter en compétences dans ces domaines.
Une première expérience professionnelle serait un plus mais n’est pas indispensable.
Aptitudes recherchées :
- curiosité ;
- forte autonomie ;
- créativité ;
- intérêt pour les thématiques de recherche ;
- goût prononcé pour le travail d’équipe ;
- aptitude à interagir avec des personnes ayant des compétences dans d’autres domaines et d’autres disciplines (expérimentation végétale, génétique, phénotypage) et des statuts différents (scientifiques, personnels techniques, étudiants, CDD).
Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr