Doctorat

Conceptualiser et évaluer la robustesse des algorithmes en santé

METHODS

Université Paris Cité

Doctorant : Alan Balendran

Titre : Conceptualiser et évaluer la robustesse des algorithmes en santé

Encadrant : Raphaël Porcher

Ecole doctorale : ED 393 Epidémiologie et Sciences de l’Information Biomédicale, Université Paris Cité

Sujet de thèse :

L’utilisation en santé d’outils d’aide au diagnostic ou à la décision construits à partir d’algorithmes d’intelligence artificielle (IA) / machine learning (ML) requiert une attention particulière. La notion d’IA éthique, responsable, ou encore de confiance, met un accent sur le développement de solutions en considérant différents aspects intrinsèques à l’IA tels que la généralisabilité, l’interprétabilité, l’équité, la reproductibilité ou encore la robustesse. Ce dernier aspect concerne l’évaluation des performances d’un modèle sur des observations perturbées.

Des études ont montré que les modèles étaient généralement vulnérables à de petites perturbations, parfois imperceptibles pour un humain. L’un des enjeux majeurs de l’adoption de l’IA en pratique clinique est de développer des algorithmes robustes aux perturbations les plus susceptibles d’être rencontrées en santé et de définir les méthodes d’évaluations adéquates.
Afin de comprendre l’influence des perturbations sur le comportement du modèle, il est nécessaire de mettre en place des tests visant à évaluer la robustesse d’un modèle. Cependant, il existe de nombreuses façons de perturber un modèle (erreur dans l’entrée, domaines différents, attaques adversariales, etc.) et ce durant différentes étapes de la vie d’un algorithme (collecte des données, entraînement ou validation de l’algorithme, déploiement).
Ce projet de thèse sur la robustesse des algorithmes de ML pour la santé se décompose en trois étapes successives. La première étape vise à identifier les différents concepts et aspects existants qui sont regroupés sous le terme de « robustesse » d’un algorithme de ML, ainsi que les métriques et les méthodes qui ont été utilisées pour les évaluer ou les quantifier. La deuxième étape a pour objectif de regrouper et de prioriser les différents concepts sur la robustesse qui auront été identifiés, en fonction de catégories de cas d’usage (fréquence d’apparition, gravité, facilité à rectifier). Enfin, la dernière étape consiste à construire une pipeline pour évaluer la robustesse d’algorithmes de ML en santé.