Modeling individual disease trajectory: application to the prediction of treatment effect - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Thèse Année : 2023

Modeling individual disease trajectory: application to the prediction of treatment effect

Modélisation de trajectoires individuelles de la maladie : application à la prédiction de l'effet d'un traitement

Résumé

This thesis aims at developing statistical models to describe the progression of neurodegenerative diseases from longitudinal data, i.e. repeated measurements in time for every subject. Our work builds upon the Disease Course Mapping, a spatio-temporal disease progression model. This mixed-effect model has a hierarchical structure allowing to account for the global dynamics at a population level while also accounting for individualized disease trajectories. The variability between subjects is decomposed between two effects: a temporal reparametrization to construct a common disease timeline, and a spatial effect to describe the heterogeneity in how the disease presents itself. However it suffers from several limitations in addressing the challenges of disease modelling. First this model is embedded in a Riemannian manifold, where the family of possible trajectories is restricted by the metric. Secondly it only considers continuous manifold-valued observations, while neurodegenerative cohorts are filled with discontinuous data. Thirdly it lacks a structure to identify and characterize disease subtypes. We will address all those needs. In the first part, after introducing the Disease Course Mapping model, we propose a model that loosens the choice of possible trajectories by learning the metric of the Riemannian manifold. In the second part we tackle discrete data and extend the model to binary and ordinal markers of disease progression. This allows us to predict symptoms and model cognitive scales. We apply it to Parkinson's disease and derive clinical interpretation from the results. The third part is dedicated to heterogeneity. We extend the progression model to account for disease subtypes by adding a mixture layer on top of the statistical model. The mixture model is able to jointly uncover latent classes while learning the typical progression pattern of each class. We showcase the model's ability to extract distinct trajectories of disease evolution in the Alzheimer's disease case. The fourth part focuses on the application of disease progression to treatment effect models. We define a framework to learn a therapeutic effect using only treated patients by leveraging a disease model's predictions, which act as a synthetic control arm. Application to the dopaminergic treatment in Parkinson's disease shows great promise. We then design a new model to account for disease-modifying treatment effects, i.e. long-term modifications of the disease progression trajectory. Overall this thesis provides several tools to extend the Disease Course Mapping potential applications, easing its transfer towards having meaningful clinical impact. The methods developed here are aimed at improving our understanding of neurodegenerative diseases, by identifying subtypes, including markers of various nature and taking into account the effect of treatment over these markers.
Cette thèse vise à développer des modèles statistiques pour décrire la progression des maladies neurodégénératives à partir de données longitudinales, c'est-à-dire des mesures répétées dans le temps pour chaque sujet. Notre travail s'appuie sur le modèle Disease Course Mapping, un modèle de progression de la maladie spatio-temporel. Ce modèle à effets mixtes a une structure hiérarchique permettant de rendre compte de la dynamique globale au niveau de la population tout en tenant compte des trajectoires individuelles de la maladie. La variabilité entre les sujets est décomposée en deux effets : une reparamétrisation temporelle pour construire une chronologie commune de la maladie, et un effet spatial pour décrire l'hétérogénéité de la manifestation de la maladie. Cependant, il présente plusieurs limitations pour relever les défis de la modélisation de telles maladies. Tout d'abord, ce modèle est défini dans une variété riemannienne, où la famille de trajectoires possibles est restreinte par la métrique. Deuxièmement, il ne considère que des observations continues à valeurs dans la variété, alors que les cohortes neurodégénératives sont remplies de données discontinues. Troisièmement, il manque une structure pour identifier et caractériser les sous-types de maladies. Nous répondrons à tous ces besoins. Dans la première partie, après avoir présenté le modèle Disease Course Mapping, nous proposons un modèle qui assouplit le choix des trajectoires possibles en apprenant la métrique de la variété riemannienne. Dans la deuxième partie, nous abordons les données discrètes et étendons le modèle aux marqueurs binaires et ordinaux de progression de la maladie. Cela nous permet de prédire les symptômes et de modéliser les échelles cognitives. Nous l'appliquons à la maladie de Parkinson et tirons une interprétation clinique des résultats. La troisième partie est consacrée à l'hétérogénéité. Nous étendons le modèle de progression pour tenir compte des sous-types de maladies en ajoutant une couche de mélange au-dessus du modèle statistique. Le modèle de mélange permet d'identifier conjointement les classes latentes tout en apprenant le schéma de progression typique de chaque classe. Nous présentons la capacité du modèle à extraire des trajectoires distinctes de l'évolution de la maladie dans le cas de la maladie d'Alzheimer. La quatrième partie se concentre sur l'application aux modèles d'effet de traitement. Nous définissons un cadre pour apprendre l'effet thérapeutique avec uniquement des patients traités en utilisant les prédictions d'un modèle de progression de la maladie, qui agissent comme un bras de contrôle synthétique. L'application au traitement dopaminergique dans la maladie de Parkinson illustre le potentiel de la méthode. Nous concevons ensuite un nouveau modèle pour tenir compte des effets de traitement modificateurs de la maladie, c'est-à-dire des modifications à long terme de la trajectoire de progression de la maladie. Dans l'ensemble, cette thèse propose plusieurs outils pour étendre les applications potentielles du Disease Course Mapping, facilitant son transfert vers un impact clinique. Les méthodes développées ici visent à améliorer notre compréhension des maladies neurodégénératives, en identifiant les sous-types, en incluant des marqueurs de nature variée et en tenant compte de l'effet du traitement sur ces marqueurs.
Fichier principal
Vignette du fichier
Thesis_manuscript-HAL.pdf (15.17 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-04345196 , version 1 (14-12-2023)

Licence

Paternité

Identifiants

  • HAL Id : tel-04345196 , version 1

Citer

Pierre-Emmanuel Poulet. Modeling individual disease trajectory: application to the prediction of treatment effect. Machine Learning [stat.ML]. EDITE de Paris, 2023. English. ⟨NNT : ⟩. ⟨tel-04345196⟩
69 Consultations
9 Téléchargements

Partager

Gmail Facebook X LinkedIn More