Programme Journées du PEPI IBIS 2019

Vous trouverez le détail des conférences en bas de page.

Programme prévisionnel

[Version PDF]

Jeudi 6 juin

9h30 - 10h : accueil & café
10h - 10h30 : présentation des journées et du PEPI IBIS

Session thématique "Nouvelles technologies et nouveaux outils"

Keynote : Apprentissage profond pour la prédiction de phénotypes à partir de données d’expression. Blaise Hanczar, Laboratoire Informatique, Biologie Intégrative et Systèmes Complexes

11h15 - 11h40 SNPer, un outil web maison de visualisation des SNPs et de leurs effets le long du génome. Frédérique Bitton

11h40 - 11h55 ViSEAGO: Easier data mining of biological functions organized into clusters using Gene Ontology and semantic similarity. Aurélien Brionne

11h55 - 12h20 Identification d'ARNs long codants avec feelNS. Fabrice Legeai

12h30 -14h00 : pause déjeuner (buffet)

Session thématique "Reproductibilité - Containerisation - Nextflow / Snakemake"

Keynote : Pourquoi et comment créer du code Facile à identifier, Accessible, Interopérable et Réutilisable ? Claire Toffano-Nioche, CNRS [vidéo]

14h45 - 15h10 Utilisation de Snakemake pour la détection de variants sur la plateforme EPITRANS/IPS2 Paris-Saclay. Joseph Tran

15h10 - 15h35 Vers un système d'informations global dédié à la sélection chez les plantes, bilan après 10 années passées à l'Inra. Yannick De Oliveira

15h35 - 16h00 Reproductibilité au sein de l’unité GAFL : mise en place et retour d'expérience. Jacques Lagnel

16h00 - 16h30 : pause

Session thématique "Analyses de données -omics"

16h30 - 16h55 Detection of transcriptional regulatory motifs specific to plant gene responses in stress conditions. Margot Correa

16h55 - 17h20 Détection de variations structurales chez le blé tendre. Hélène Rimbert

17h20 - 17h45 Etude fonctionnelle du microbiote racinaire par des approches de méta-transcriptomique. Susete Alves Carvalho

17h45 - 18h10 Transcriptomique par RNA-Seq avec ou sans référence chez les légumineuses. Jonathan Kreplak

18h30 : Apéritif

Vendredi 7 juin

8h45 - 9h : accueil

Session thématique "Biostatistiques" 

Keynote : Corrélations, explications et limites. Marie-Laure Martin-Magniette

9h45 - 10h10 On the use of interaction terms in GLMs to model complex experimental designs: the example of RNA-Seq data. Hugo Varet

10h10 - 10h35 Identification of new proteins involved in a biological process by analyzing protein-protein interaction networks extracted from quantitative mass spectrometry data. Marie-Hélène Mucchielli [présentation annulée]

10h35 - 11h : pause

Session thématique "Analyses de données -omics"

Keynote : Single-cell sequencing @ UCAGenomiX. Kevin Lebrigand, IPMC, CNRS

11h45 - 12h10 Bioinformatique et pan-génomique du maïs, retour d'expérience et défis. Johann Joëts [présentation annulée]

12h10 - 12h35 Biogéographie des microorganismes des sols à l’échelle de la France. Sébastien Terrat

12h35 - 14h : pause déjeuner (buffet)

Session thématique "Analyses de données -omics"

Keynote : Introduction à l'analyse bioinformatique de données shotgun. Florian Plaza-Onate, MetaGenoPolis, INRA

14h45 - 15h10 Comparaison d'outils pour l'inférence et la fouille de réseaux bactériens au sein du microbiote intestinal humain. Louisa Hadj Abed

15h10 - 15h50 Présentation des services proposés par les plateformes bioinformatiques (Genotoul, Migale, URGI). Claire Hoede, Valentin Loux, Hadi Quesneville

15h50 - 16h : clôture des journées


Conférences

Apprentissage profond pour la prédiction de phénotypes à partir de données d’expression - Blaise Hanczar

L’apprentissage profond (deep learning) est une méthode d’intelligence artificielle qui a récemment permis de faire d’impressionnant progrès dans de nombreux domaines scientifiques. Parmi ses applications les plus prometteuses se trouvent la médecine personnalisée et l’analyse des données « omiques.  Aujourd’hui, des efforts croissants sont déployés pour utiliser l’apprentissage profond sur des données génomiques, la transcriptomiques, protéomiques et métagénomiques afin de mieux caractériser les patients. Après avoir exposé brièvement le principe des réseaux de neurones , je présenterai nos travaux sur la prédiction de phénotype à partir de données d’expression de gènes. Dans cette tâche, les deux principaux verrous scientifiques sont la petite taille de la base d’apprentissage et l’interprétation du réseau. Nous proposons des méthodes basées sur l’apprentissage par transfert et l’apprentissage semi-supervisé afin de pallier au premier problème. Pour l’interprétation, nous proposons de décomposer le calcul de chaque prédiction dans le réseau de neurones afin d’identifier les gènes et les neurones pertinents que nous associons à la connaissance biologique.

Reproductibilité - Containerisation - Nextflow / Snakemake - Claire Toffano-Nioche

Une étude récente publiée dans Nature a montré que près de 70% des expériences en Biologie ne sont pas reproductibles. Il est donc indispensable de mettre en place des bonnes pratiques afin de garantir l’intégrité des données et la reproductibilité des résultats des analyses. Concernant les données, les principes FAIR-data sont de plus en plus utilisés. Ces mêmes principes peut être détournés au service des analyses pour garantir des résultats identiques à partir d’un même jeu de données et au cours du temps. L’objectif de cette présentation est de proposer un panel de fonctionnalités permettant de rendre reproductible une analyse complète de bioinformatique. Un exemple concret d'analyse est présenté (identification des gènes qui s'expriment différentiellement entre deux conditions expérimentales) mais les fonctionnalités mises en oeuvre ne sont pas dépendantes de cet exemple et peuvent être appliquées à n'importe quelle autre question biologique. Brièvement, nous récupérons les données depuis les bases de données publiques (ENA/SRA), nous réalisons une analyse reproductible avec un système de workflow (snakemake) dans un environnement virtuel (docker) dont l'ensemble du code, versionné (git), est disponible en open source (Github et dockerhub). La visualisation des résultats est dynamique (shiny app) et un rapport (Rmarkdown) en pdf ou html est disponible et regroupe les résultats de l’analyse comme les paramètres choisis par l'utilisateur. La mise en oeuvre de l'ensemble de ces technologies apporte alors un niveau de reproductibilité des analyses et des données générées plus important que ce qui est traditionnellement réalisé.

Single-cell sequencing @ UCAGenomiX - Kevin Lebrigand

Elected in 2013 "method of the year" by the journal Nature Methods, single cell sequencing now allows profiling of gene expression at the level of individual cells (scRNA-seq). Thanks to recent technical improvements in single cell manipulation and library preparation, scRNA-seq has become a powerful tool for high-throughput and high-resolution transcriptomic analysis. It is now possible to define the transcriptomes of thousands of single cells and to establish the molecular identity card for each cell in a cell population. In this talk, i will cover the recent scRNA-seq developments at the UCAGenomiX platform including results obtained with our 10xGenomics system.

Introduction à l'analyse bioinformatique de données de séquençage métagénomique aléatoire - Florian Plaza-Oñate

Le séquençage métagénomique aléatoire (dit « shotgun ») a révolutionné la microbiologie en permettant la caractérisation directe de communautés microbiennes sans culture préalable. Toutefois, l’analyse bioinformatique des données produites par cette technologie n’est pas triviale du fait de leur complexité et de leur volume. Typiquement, le séquençage d’un échantillon métagénomique génère des millions de lectures (ou « reads ») provenant de microorganismes phylogénétiquement diversifiés parfois non cultivables et dont les abondances relatives varient sur plusieurs ordres de grandeur. Ainsi, de nombreux outils bioinformatiques dédiés à l’analyse de données shotgun ont été développés pour déterminer la composition taxonomique d’une communauté microbienne (quels sont les microorganismes présents et quelle est leur abondance ?), inférer son potentiel métabolique (que peuvent t’ils faire ?) et même reconstruire le génome des différentes souches la composant.

Lors de cet keynote, nous ferons une revue des différentes méthodes proposées et nous présenterons leurs avantages et inconvénients. Plusieurs cas d’utilisation concrets seront abordés.