Doctorant : Etienne Peyrot
Titre : Méthodes d’apprentissage pour les règles de traitements individualisés
Encadrant : François Petit
Ecole doctorale : ED 393 Epidémiologie et Sciences de l’Information Biomédicale, Université Paris Cité
Sujet de thèse :
L’un des buts de la médecine personnalisée est de proposer à un patient le traitement qui lui soit le mieux adapté en se basant sur ses caractéristiques. En d’autres termes, cela revient à déterminer à l’échelle individuelle la thérapeutique optimale c’est à dire celle qui maximise le rapport bénéfice/risque. Une des approches les plus courantes consiste à ne considérer que l’efficacité du traitement et à s’appuyer sur des méthodes d’apprentissage statistique (machine learning) pour construire une règle individuelle de traitement, qui recommande pour chaque individu le traitement qui aura un effet maximal. La construction de ces règles passe en règle générale par l’apprentissage de la fonction d’effet individuel du traitement, obtenue comme différence de l’espérance du critère de jugement sous un des traitements comparés, conditionnellement à un ensemble de covariables représentant les caractéristiques des individus qui seront utilisées pour individualiser la recommandation de traitement. Ce type d’approches nécessite d’estimer un grand nombre de paramètres de nuisance, comme par exemple l’effet des covariables liées au pronostic (critère de jugement, mais pas à un effet différentiel du traitement). Des travaux récents montrent qu’il est possible, en transformant le problème initial en un problème de minimisation continue, d’apprendre directement un score de bénéfice du traitement, sans estimer ces paramètres de nuisance. L’amplitude de ce score renseigne également sur l’amplitude de l’effet individualisé du traitement et la règle de traitement optimale se déduit de celui-ci de façon immédiate. Cette approche nécessite toutefois d’être capable de construire des fonctions pertes possédant des propriétés précises.
Si l’on considère que l’objectif des règles de traitements individualisées est de maximiser le bénéfice et de minimiser le risque, pas uniquement de maximiser le bénéfice, la situation est plus complexe. Il s’agit alors d’un problème d’optimisation multiobjectif. Par ailleurs, une grande partie de la littérature concernant la construction de ces règles inclut systématiquement le risque sous la forme d’une contrainte et se limite donc à la technique d’optimisation multiobjectif dite ε-constraint method alors qu’il existe une vaste gamme de méthodes en optimisation multiobjectif. Enfin, il est souhaitable de pouvoir construire ces règles de traitements 1) aussi bien à partir de données d’essais randomisés que de données observationnelles, 2) avec des échantillons potentiellement de taille plus limitée.
Ce projet de thèse porte sur les méthodes de construction de règles de traitements individualisés prenant en compte le rapport bénéfice/risque du traitement. Il se décompose en trois phases.
- La première étape vise d’une part à adapter l’approche générale au cas de la construction de règles prenant en compte le bénéfice/risque et d’autre part à étudier et identifier les méthodes d’optimisation multiobjectif pertinente pour ce problème de construction de règles.
- Nous souhaitons être capable de produire des règles de traitements aussi bien à partir de données d’essais randomisés que d’études observationnelles éventuellement de petites tailles. Ces dernières années de nombreuses méthodes d’équilibrage (balancing) sont apparues. Quelques-unes d’entre elles semblent très prometteuses. Nous les évaluerons de manière intensive. Ceci permettra d’identifier la plus adaptée aux échantillons de taille plus limitée.
- La dernière étape consiste à adapter et à mettre en œuvre les résultats des étapes 1 et 2 sur des données observationnelles de petites tailles. On s’appuiera sur la méthode identifiée dans l’étape 2 comme la plus efficace sur de petits échantillons pour effectuer les équilibrages requis.