Soutenance de thèse d'Elen GOUJON : Approches statistiques pour l’intégration de données multiblocs en présence de variations confondantes : étude multi-omique en écotoxicologie

Période de l'événement à afficher
lundi 26 janvier 2026 à 10h00
Adresse
à l’Auditorium de l’ASNR, 31 Avenue de la Division Leclerc, 92260 Fontenay-aux-Roses

Elen GOUJON soutient sa thèse le lundi 26 janvier 2026, à l’Auditorium de l’ASNR, 31 Avenue de la Division Leclerc, 92260 Fontenay-aux-Roses. Sa thèse est intitulée :

« Approches statistiques pour l’intégration de données multiblocs en présence de variations confondantes : étude multi-omique en écotoxicologie ».

Résumé

En étudiant une question biologique, les chercheurs ou chercheuses travaillent souvent avec plusieurs sources de données ou modalités, rassemblant ainsi des informations sur différents systèmes biologiques ou niveaux moléculaires. En particulier, les données multi-omiques peuvent constituer des ensembles de données multiblocs, où deux ou plus ensembles de variables sont observés sur les mêmes individus. L’étude conjointe de ces modalités permet d’obtenir des résultats plus interprétables et plus complets. Cependant, un défi méthodologique apparaît lorsque des effets de lots (dits effets batch) ou d’autres types de variations confondantes interfèrent avec l’analyse, pouvant conduire à des conclusions biaisées.

Nous abordons ces problématiques dans le cadre d’une application en écotoxicologie. Notre étude de cas porte sur les effets d’une exposition chronique à de faibles doses de rayonnements ionisants chez des rainettes arboricoles de l’espèce Hyla orientalis collectées dans la zone d’exclusion de Tchornobyl en 2018. Dans cette étude, les mesures transcriptomiques et protéomiques sont influencées par le site d’échantillonnage des rainettes, d’une façon qui masque en partie les effets de la radiocontamination. Les contributions de cette thèse couvrent les deux types d’approches pour gérer les effets confondants dans des analyses omiques : correction lors du prétraitement ou inclusion directe des facteurs confondants dans le modèle. 

Tout d’abord, nous comparons les stratégies de correction visant à atténuer l’effet confondant dans les données RNA-seq des rainettes, à l’aide d’algorithmes de correction des effets batch, en ciblant différentes variables candidates. Ensuite, nous proposons une nouvelle méthode qui minimise la variation indésirable capturée par les composantes dans une analyse intégrative multiblocs. Cette approche s’appuie sur le cadre statistique de l’Analyse Canonique des Corrélations Généralisée Régularisée (RGCCA). Nous illustrons le champ d’application de la méthode proposée sur des données simulées et sur notre étude des rainettes.

L’application aux données multi-omiques des rainettes arboricoles de la région de Tchornobyl met en évidence une signature commune entre transcriptomique et protéomique associée au débit de dose. Cette signature suggère une modulation des gènes et des protéines impliqués dans le métabolisme énergétique en fonction du gradient de radiocontamination.

Jury

  • Pr. Sébastien DÉJEAN (PU HDR, Université de Toulouse)
  • Dr. Rémi SERVIEN (DR HDR, INRAE Occitanie-Montpellier)
  • Dr. Davide DEGLI ESPOSTI (CR HDR, INRAE Auvergne-Rhône-Alpes)
  • Pr. Katrijn VAN DEUN (Professor, Tilburg University)

Infos pratiques

Date – Horaires :

Lundi 26 janvier 2026 à 10h00

Lieu :

Auditorium de l’ASNR, 31 Avenue de la Division Leclerc, 92260 Fontenay-aux-Roses

Inscription

Merci d'indiquer votre présence à la soutenance via le formulaire d'inscription

Si vous êtes externe à l’ASNR : nous vous inscrirons sur une liste d’accès à l’Auditorium en amont de la soutenance. Merci d’apporter une pièce d’identité valide le jour J.

Visio :

Lien Teams