February 24, 2017
9:30
Louvain-la-Neuve
ISBA - C035
Introduction à la méta-omique : présentation des données, des problématiques et des méthodes statistiques usuelles
Abstract:
Introduction à la méta-omique : présentation des données, des problématiques et des méthodes statistiques usuelles. Un écosystème bactérien désigne l'ensemble des bactéries présentes dans un milieu donné (sol, eau de mer, intestin, etc), qui interagissent et réalisent des fonctions. La métagénomique, et par extension la métaproétomique, est l'étude de l'ensemble du matériel génétique/protéomique présent dans un échantillon du milieu, dans le but de caractériser l'écosystème, les fonctions qui y sont réalisées et leur association avec des phénotypes. En particulier, des liens entre la flore intestinale et des pathologies très diverses ont été mis en évidence ces dernières années, sans pour autant que les mécanismes ne soient systématiquement élucidés. Les technologies récentes permettent de mesurer les abondances des gènes/protéines présents dans un échantillon, y compris issus d'organismes qui ne sont pas génotypés; des algorithmes permettent ensuite le regroupement des gènes/protéines selon leur séquence ou leur abondance. Le domaine de la métagénomique est largement développé, alors que celui de la métaprotéomique est débutant. Dans cette présentation j'introduirai brièvement les méthodes de collecte et de pré-traitement des données métagénomiques et métaprotéiomiques. Je présenterai ensuite les méthodes statistiques utilisées en routine, qui consistent notamment en une adaptation de méthodes classiques d'analyse supervisée et non supervisée à la structure des données (grande/très grande dimension, forte sparsité, et pour un certain type de mesure structure d'arbre phylogénétique) J'évoquerai également une approche plus récente basée sur la NMF (Nonnegative Matrix Factorization) permettant simultanément l'analyse de traits fonctionnels majoritaires dans l'écosystème et l'étude comparative d'un ensemble d'échantillons biologiques.
Introduction à la méta-omique : présentation des données, des problématiques et des méthodes statistiques usuelles. Un écosystème bactérien désigne l'ensemble des bactéries présentes dans un milieu donné (sol, eau de mer, intestin, etc), qui interagissent et réalisent des fonctions. La métagénomique, et par extension la métaproétomique, est l'étude de l'ensemble du matériel génétique/protéomique présent dans un échantillon du milieu, dans le but de caractériser l'écosystème, les fonctions qui y sont réalisées et leur association avec des phénotypes. En particulier, des liens entre la flore intestinale et des pathologies très diverses ont été mis en évidence ces dernières années, sans pour autant que les mécanismes ne soient systématiquement élucidés. Les technologies récentes permettent de mesurer les abondances des gènes/protéines présents dans un échantillon, y compris issus d'organismes qui ne sont pas génotypés; des algorithmes permettent ensuite le regroupement des gènes/protéines selon leur séquence ou leur abondance. Le domaine de la métagénomique est largement développé, alors que celui de la métaprotéomique est débutant. Dans cette présentation j'introduirai brièvement les méthodes de collecte et de pré-traitement des données métagénomiques et métaprotéiomiques. Je présenterai ensuite les méthodes statistiques utilisées en routine, qui consistent notamment en une adaptation de méthodes classiques d'analyse supervisée et non supervisée à la structure des données (grande/très grande dimension, forte sparsité, et pour un certain type de mesure structure d'arbre phylogénétique) J'évoquerai également une approche plus récente basée sur la NMF (Nonnegative Matrix Factorization) permettant simultanément l'analyse de traits fonctionnels majoritaires dans l'écosystème et l'étude comparative d'un ensemble d'échantillons biologiques.
Categories Events: