Classification Ascendante Hiérarchique sous Contrainte de Contiguïté pour l’Analyse de données Hi-C - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Thèse Année : 2021

Hierarchical Agglomerative Clustering under contiguity constraint for Hi-C data analysis

Classification Ascendante Hiérarchique sous Contrainte de Contiguïté pour l’Analyse de données Hi-C

Résumé

Spatial genome organization inside cell nuclei has a major impact over gene expression regulation, with important implications in fetal development, cell differentiation or diseases development such as cancer. This fact is the starting point of this work whose aim is the study of three-dimensional structure of genome and of its variations using Hi-C data. First, we study the question of modeling the hierarchical structure of genome using Hi-C data. To do this, we considerate the extensions of a natural statistical tool when studying hierarchical structures, the Hierarchical Agglomerative Clustering (HAC), in order to justify its application to Hi-C data. This part justifies the modeling of structures by binary trees resulting from the HAC process. We then develop a method for comparing two samples of trees in order to be able to identify differences in structures between biological conditions with statistical guarantees.
L'organisation spatiale du génome à l'intérieur du noyau des cellules a un impact majeur sur la régulation de l'expression des gènes, avec notamment des implications importantes dans le développement fœtal, la différentiation cellulaire ou le développement de maladies. Ceci constitue la motivation initiale de ce travail dont l'objet est l'étude de la structure tri-dimensionnelle du matériel génétique et de ses variations à partir de données Hi-C. Tout d'abord, on se penche sur la modélisation de la structure hiérarchique du génome à partir de données Hi-C. On étudie les extensions d'un outil statistique naturel pour l'examen de structures hiérarchiques, la Classification Ascendante Hiérarchique (CAH), pour justifier son application au Hi-C. Cela permet de justifier la modélisation des structures par des arbres binaires (issues de la CAH). On développe ensuite une méthode de comparaison de deux échantillons d'arbres pour être capable d'identifier des différences significatives.
Fichier principal
Vignette du fichier
2021TOU30108a.pdf (11.61 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03424118 , version 1 (10-11-2021)
tel-03424118 , version 2 (24-02-2022)

Identifiants

  • HAL Id : tel-03424118 , version 2

Citer

Nathanaël Randriamihamison. Classification Ascendante Hiérarchique sous Contrainte de Contiguïté pour l’Analyse de données Hi-C. Génétique. Université Paul Sabatier - Toulouse III, 2021. Français. ⟨NNT : 2021TOU30108⟩. ⟨tel-03424118v2⟩
243 Consultations
352 Téléchargements

Partager

Gmail Facebook X LinkedIn More