Stage OT-27654
STAGE EN BIOINFORMATIQUE, BIO-ANALYSES ET BIO-STATISTIQUES I2B
84140 Montfavet
Retour à la liste des résultats
Présentation INRAE
L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.
Environnement de travail, missions et activités
Développement d’un outil intégré pour réaliser des analyses GWAS
Réaliser une étude d’association pangénomique vise à identifier par analyse statistique les variantes génétiques (génotype) associées à des traits spécifiques (phénotype). Cette méthodologie est fréquemment mise en œuvre dans notre unité pour les différentes espèces étudiées avec pour but d’identifier les zones du génome impliquées dans le contrôle de traits d’intérêt et leur effet sur les variations phénotypiques. Les populations étudiées, la densité et le type de marqueurs disponibles, les dispositifs expérimentaux (e.g. multi-environnement), la variabilité et la distribution des traits étudiés et les modèles mobilisés sont variables selon les espèces et les projets menés.
Jusqu’à présent nous avons réalisé ces études de façon indépendante sans construire un espace de travail collaboratif permettant de partager la méthodologie, les étapes à suivre et outils associés, les modèles et les scripts d’analyse.
L’objectif du projet est donc de capitaliser sur l’expérience et les méthodes disponibles dans l’unité pour construire un outil qui pourra être mobilisé par des non bio-informaticiens pour réaliser des analyses GWAS reproductibles et performantes.
Les étapes proposées sont :
- de construire un workflow, en s’appuyant sur un existant, représentant les étapes nécessaires à l’analyse, les données d’entrée, les outils dédiés et données produites en sortie
- de faire l’inventaire des modèles et scripts disponibles et de les caractériser de façon à réaliser l’implémentation de modèles en fonction des caractéristiques des jeux de données phénotypiques et génotypiques
- de développer un workflow en Nextflow selon des standards stricts de qualité et de reproductibilité basé sur nf-core et utilisable par des non informaticiens
- tester le workflow sur des jeux de données
- développer une interface en R Shiny (https://shiny.posit.co )
Ce pipeline sera in fine utilisé par des non bio-informaticiens.
L’étudiant.e aura accès au serveur Linux de calcul de l’unité GAFL et aux plateformes HPC d’INRAE.
Il/elle sera co-encadré.e par une directrice de recherche en génétique et un ingénieur en bio-informatique, intègrera un groupe de travail inter-CATI et interagira avec différents chercheurs et doctorants de l’unité.
Formations et compétences recherchées
Maîtrise de l'environnement Linux, du Bash, du langage R, utilisation et interprétation de logiciels d'analyse bio-informatique sont demandés.
Des notions de statistiques seront nécessaires pour interagir avec les chercheurs.
Des notions de base sur les outils de packaging et de conteneurisation (Singularity, https://sylabs.io/singularity/) et de management de workflow (Snakemake, https://snakemake.readthedocs.io ) seraient un plus.
Votre qualité de vie à INRAE
En rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :
- jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)
- d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;
- de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;
- d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;
- de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;
- d'activités sportives et culturelles ;
- d'une restauration collective.
Modalités pour postuler
J'envoie mon CV et ma lettre de motivation
Les personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l’obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l’exercice de leurs fonctions, qu’elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu’elles soient religieuses, philosophiques ou politiques. > En savoir plus : site fonction publique.gouv.fr