Bio-info : traitement de séquences et de métadonnées
Bio-info : traitement de séquences et de métadonnées
- contexte
- MetaGenoPolis (INRAE)
- Contexte et objectif
- Mission
- Profil souhaité
Postuler à l'offre
Informations générales
MetaGenoPolis est une unité de service experte en science du microbiote, humaine et animal appliquée à la nutrition et à la santé. L’unité a pour missions principales :
- d’accélérer la science du microbiote en France et l’innovation dans le domaine de la santé et de l’alimentation ;
- de proposer des technologies performantes et à haut débit pour analyser la diversité des microbiotes complexes et les interactions entre les bactéries intestinales et les cellules humaines ;
- de collaborer avec les acteurs industriels pour la transformation de leurs découvertes en produits et services liés à la santé, pour identifier et traiter pleinement les pistes vers de futures applications industrielles, pour aider à concevoir et conduire des projets scientifiques vers des applications.
Domaine de Vilvert (Bât. 325)
78350 Jouy-en-Josas
France
Traitement de séquences et de métadonnées de cohortes publiques métagénomiques en lien avec l'étude de l'impact du régime alimentaire sur le microbiote intestinal humain
L’essor de la métagénomique a permis des avancées scientifiques majeures dans le domaine de la santé humaine en étudiant le rôle du microbiote intestinal dans des maladies aussi diverses que l’obésité, le diabète, le cancer ou les maladies cardio-vasculaires.
Au sein de l’unité MetaGenoPolis, l’équipe InfoBioStat (IBS) développe une expertise pointue dans la découverte, la caractérisation et la compréhension de la composition en espèces bactériennes présentes dans le microbiote intestinal et leur association à des pathologies. L’équipe IBS est aussi impliqué dans l’étude de l’impact du régime alimentaire, en particulier de la consommation de fibres, sur la composition du microbiote intestinal en lien avec la santé.
Parmi ces projets, l’un d’entre eux vise à créer un répertoire de cohortes métagénomiques publiques associées à l’alimentation, possédant des métadonnées disponibles et informatives et d’identifier certaines espèces associées aux fibres et potentiellement bénéfiques pour la santé.
Dans ce contexte, l’objectif de ce stage est de contribuer à la constitution de ce répertoire de cohortes métagénomiques publiques en prenant en main les outils de l’équipe IBS pour réaliser le téléchargement, le nettoyage de données et le pré-processing bioinformatique des séquences. L’étudiant sera également responsable du téléchargement et de la curation des métadonnées des échantillons associés, afin d’élaborer un jeu de données métagénomique curé et consolidé (FAIR).
Le stage se déroulera sur une durée de 5 à 6 mois, début souhaité entre janvier et mars 2024.
- Réaliser un état de l’art bibliographique, notamment afin (i) d’identifier les bases de données/collection de données métagénomiques similaires à celles proposées dans ce stage, (ii) des méthodologies associées à la mise en place de ces bases de données ;
-
A partir de cet état de l’art, identifier les forces/faiblesses de chaque méthode, en comparaison à notre approche ;
-
Participer activement à l’identification des cohortes métagénomiques shotgun d’intérêt ;
-
Réaliser le téléchargement et le nettoyage de ces cohortes (trimming et retrait des reads de l’hôte) ;
-
Télécharger, curer et harmoniser les métadonnées associées aux données métagénomiques précédemment téléchargées ;
-
Le cas échéant, réaliser les étapes de mapping et comptage des espèces microbiennes avec nos pipelines bioinformatiques et biostatistiques.
-
Formation M1 ou M2 en bioinformatique ;
-
Connaissances en programmation (langage R, python 3) ;
-
Connaissances en système de gestion de base de données seraient un plus (noSQL (MongoDB)) ;
-
Des connaissances générales en biologie et sur les problématiques liées aux données métagénomiques seraient un plus ;
-
Anglais scientifique.