De manière générale, mes travaux de recherche visent à l’établissement de modèles mathématiques pour l’analyse de données médicales. Pour cela, mes efforts se découpent en plusieurs axes comme décrits ci-dessous.
Mots-clés :
In general, my research work aims at establishing mathematical models for the analysis of medical data. For this purpose, my efforts are divided into several axes, as described below.
Keywords:
L’algorithme d’espérance-maximisation ou algorithme EM permet de maximiser la vraisemblance de modèles à données manquantes dans des cadres très généraux. Lorsque l'étape d'espérance ne peut être réalisée, on peut recourir à une approximation stochastique de l'algorithme EM (SAEM). La convergence du SAEM vers les points critiques de la vraisemblance observée a été prouvée et son efficacité numérique a été démontrée. Cependant, l’algorithme SAEM est très sensible à ses conditions initiales et, malgré la stochasticité de la procédure induite par l’approximation stochastique, peut rester piégé dans des maxima locaux. De plus, il suppose que l’on est à même de simuler la loi conditionnelle des variables latentes sachant les observations (avec la terminologie des modèles à variables latentes), éventuellement par une méthode de type MCMC, ce qui n’est pas toujours le cas.
The Expectation-Maximization (EM) algorithm allows for maximizing the likelihood of latent data models in very general frameworks. When the expectation step cannot be performed in closed form, a stochastic approximation of EM (SAEM) can be used. The convergence of the SAEM toward critical points of the observed likelihood has been proved and its numerical efficiency has been demonstrated. However, the SAEM algorithm is very sensitive to its initial condition, and, even with the additional stochasticity associated with its approximation feature, it can be trapped in local maxima. Moreover, the SAEM assumes that we are able to draw from the conditional distribution of latent variables given the observations (with the latent variable models terminology), possibly with MCMC-type method, which is not always the case.
Avec Stéphanie Allassonnière, nous avons proposé une nouvelle classe d’algorithmes SAEM : les algorithmes SAEM approchés, ou approximated-SAEM en anglais, dont nous avons démontré la convergence vers des maxima locaux sous des hypothèses standards. Cette classe repose sur la simulation par une loi approchée, en un sens à définir, de la vraie loi conditionnelle dans l’étape de simulation. En particulier, on englobe des algorithmes pré-existants tel que l’ABC-SAEM, dont l’efficacité numérique avait été établie mais dont la convergence théorique n’avait pas été démontrée, et le MCMC-SAEM.
With Stéphanie Allassonnière, we have proposed a new class of SAEM algorithms: the approximated-SAEM algorithms, for which we have proved the convergence toward local maxima under standard assumptions. This class relies on sampling from an approximation, in a sense to be specified, of the real conditional law in the simulation step. In particular, we encompass pre-existent algorithms like the ABC-SAEM, whose numerical efficiency was empirically established but whose theoretical convergence was not proved, and the MCMC-SAEM.
En se basant sur des techniques de recuit simulé, nous avons également proposé une version tempérée de l’algorithme SAEM, le tempering-SAEM, afin de favoriser sa convergence vers des maxima globaux. Dans cette version, on approche la loi conditionnelle en la tempérant suivant un schéma de températures sinusoïdal amorti.
Building on simulated annealing techniques, we also proposed a tempered version of the SAEM algorithm, the tempering-SAEM, to favor convergence toward global minima. In this version, we approximate the conditional law by tempering it following a damped oscillatory temperature scheme.
Pour plus de détails, voir CSDA 2021.
For more details, see CSDA 2021.
Les données massives et hétérogènes sont légions dans les applications médicales : compte-rendus textuels, données ohmiques, données d'imageries, etc. Un suivis médical efficace repose donc sur la capacité à traiter conjointement toutes ces données. Ceci suppose d'être, d'une part, à même d'encoder efficacement de telles données et, d'autre part, de pouvoir proposer des algorithmies adaptées à leur taille.
Massive and heterogeneous data are legion in medical applications: textual reports, ohmic data, imaging data, etc. Therefore, efficient medical monitoring depends on the ability to process all these data together. This implies, on the one hand, being able to encode such data efficiently and, on the other hand, being able to propose algorithms adapted to their size.
Sur la base de l'encodage cible ou target encoding, j'ai travaillé à développer une nouvelle technique d'encodage particulièrement adaptée aux données massives et hétérogènes. En partant d'un modèle hierarchique, l'idée est de proposer un encodage à même de capturer toute la complexité des données que l'on veut étudier.
Based on target encoding, I worked on developing a new encoding technique particularly adapted to massive and heterogeneous data. Starting from a hierarchical model, the idea is to propose an encoding capable of capturing all the complexity of the data we want to study.
Avec Pierre-Alexandre Mattei, Frédéric Precioso et Michel Riveill, j'ai travillé à l'élaboration de modèles génératifs profonds pour l'analyse de données massives, longitudinales et hétérogènes. Plus précisément, nous voulions déterminer une représentation adaptée des données recueillies dans le cadre du programme de médicalisation des systèmes d’information en soins de suite ou de réadaptation (PMSI-SSR). Une idée naturelle est de recourir à des auto-encodeurs variationnels.
Ces travaux n'on cependant pas donné lieu à publication.
With Pierre-Alexandre Mattei, Frédéric Precioso et Michel Riveill, I worked on the development of deep generative models for the analysis of massive, longitudinal and heterogeneous data. More precisely, we wanted to determine a suitable representation of the data collected in the framework of the “programme de medicalisation des systèmes d'information en soins de suite ou de réadaptation (PMSI-SSR)”. A natural idée is to use variational autoencoders.
However, this work has not been published.
Une part substantielle de mes recherches a consisté à développer de nouvelles méthodes pour l'analyse statistique de données longitudinales, et plus particulièrement pour l'analyse de données médicales.
A substantial part of my research has focused on developing new methods for the statistical analysis of longitudinal data, and more specifically, for analyzing medical data.
En effet, par delà les études transversales, étudier l’évolution temporelle de phénomènes connait un intérêt croissant. Ceci s'explique simplement : pour comprendre un phénomène, il semble effectivement plus adapté de comparer l’évolution des marqueurs de celui-ci au cours du temps plutôt que ceux-ci à un stade donné. Le suivi de maladies neuro-dégénératives s’effectue par exemple par le suivi de scores cognitifs au cours du temps. C’est également le cas pour le suivi de chimiothérapie qui repose de plus en plus sur la compréhension de la progression globale de la maladie que sur que l’état de santé ponctuel des patients.
Indeed, beyond transversal studies, temporal evolution of phenomena is a field of growing interest. This can be easily explained: to understand a phenomenon, it appears more suitable to compare the evolution of its markers over time than to do so at a given stage. For example, neurodegenerative diseases are monitored by tracking cognitive scores over time. The same applies to chemotherapy monitoring, which is increasingly based on understanding the overall progression of the disease rather than on the individual health status of patients.
Avec Stéphanie Allassonnière, nous avons travaillé à l'élaboration d'un modèle non-linéaire à effets mixtes cohérent (consistant) pour l'analyse statistique de données longitudinales à valeurs sur des variétés riemanniennes. Ce modèle repose sur la discrimination de déformations dites temporelles et liées à l’acquisition des données et au rythme de progression du phénomène observé, de déformations dites spatiales, liées à la géométrie intrinsèque des formes observées. Cela nous a conduit à considérer des déformations spatio-temporelles.
With Stéphanie Allassonnière, we have developed of a consistent nonlinear mixed effects model for the statistical analysis of longitudinal Riemannian manifold valued data. This model is based on the discrimination of so-called temporal deformations, linked with acquisition constraints and the rate of progression of the observed phenomenon, from so-called spatial deformations, linked to the intrinsic geometry of observed shapes. This led us to consider spatio-temporal deformations.
Ce modèle a été conçu en collaboration avec Laure Fournier, radiologue à l'Hôpital européen Georges Pompidou, avec pour visée le suivis du cancer du rein métastatique.
This model was designed in collaboration with Laure Fournier, radiologist at the Georges Pompidou European Hospital, with the aim of monitoring metastatic kidney cancer.
Pour plus de détails, voir NeurIPS 2017 & SIIMS 2021.
For more details, see NeurIPS 2017 & SIIMS 2021.
La géométrie riemannienne se révèle un outil particulièrement adapté à la modélisation mathématique des formes. En effet, plutôt que d’analyser les formes en elle-mêmes de manière individuelle, il semble plus efficient de considérer des ensembles ou populations de formes et d’essayer de les appréhender comme des espaces au sens mathématique du terme. De par leur construction, ces espaces vont hériter naturellement d’une structure de variété riemannienne. Ainsi, pour étudier rigoureusement les formes anatomiques, il convient de développer des modèles valides dans des espaces riemanniens.
Riemannian geometry is a particularly suitable tool for the mathematical modeling of shapes. Indeed, rather than analyzing shapes individually, it seems more efficient to consider sets or populations of shapes and to try to understand them as spaces in the mathematical sense. By construction, these spaces will naturally inherit a Riemannian manifold structure. Thus, to rigorously study anatomical shapes, it is necessary to develop valid models in Riemannian spaces.
Avec Joan Alexis Glaunès, nous avons travaillé à l'élaboration d'un modèle dit de pseudo-métamorphoses pour le recalage difféomorphique de courbes et de surfaces, via des mesures discrètes pondérées.
With Joan Alexis Glaunès, we have developed a pseudo-metamorphosis model for the diffeomorphic mapping of curves and surfaces, via weighted discrete measurements.
Avec Stéphanie Allassonnière, nous avons proposé un modèle pour le suivis de formes anatomiques exploitant fortement le caractère riemannien des espaces de forme. Les images ci-dessous sont un exemple du type de trajectoires que l'on peut obtenir dans de tels espaces.
With Stéphanie Allassonnière, we have proposed a model for tracking anatomical shapes that strongly exploits the Riemannian character of shape spaces. The images below are an example of the type of trajectories that can be obtained in such spaces.
Liste de mes publications disponibles sur HAL. Lien vers mon profil Google Scholar.
List of all my publications available on HAL. Link to my Google Scholar profil.
Minimax density estimation in the adversarial framework under local differential privacy.
AvecWith Mélisande Albert, Béatrice Laurent-Bonneau etand Ousmane Sacko.
A coherent framework for learning spatiotemporal piecewise-geodesic trajectories from longitudinal manifold-valued data.
AvecWith Stéphanie Allassonnière etand Vianney Debavelaere. SIAM Journal on Imaging Sciences 14(1), 2021.
A new class of stochastic EM algorithms. Escaping local maxima and handling intractable sampling.
AvecWith Stéphanie Allassonnière. Computational Statistics & Data Analysis 159, 2021
Pandemic Intensity Estimation from Stochastic Approximation-based Algorithms
CAMSAP: IEEE International Workshop on Computational Advances in Multi-Sensor Adaptive Processing, Los Sueños, Costa Rica, DécembreDecember 2023.
Codes développés parCodes developed by Gersende Fort. AvecWith Patrice Abry, Gersende Fort etand Barbara Pascal.
Analyse statistique de données anatomiques longitudinales de patients traités. Application au suivi de chimiothérapie.
JDS: 52èmes Journées de Statistiques de la Société Française de Statistique, Université Côte d'Azur, Nice, Mai 2020. JDS: 52th Journées de Statistiques of the the French Society of Statistics, Côte d'Azur University, Nice, France, May 2020.
AvecWith Stéphanie Allassonnière.
Learning spatiotemporal piecewise-geodesic trajectories from longitudinal manifold-valued data.
NeurIPS: Advances in Neural Information Processing Systems 30, Long Beach, CA, USA, DécembreDecember 2017.
AvecWith Stéphanie Allassonnière etand Stéphane Oudard.
Thèse effectuée au Centre de Mathématiques Appliquées (CMAP, École polytechnique, Palaiseau) sous la direction de Stéphanie Allassonnière.
Doctorate carried out at the Centre de Mathématiques Appliquées (CMAP, École polytechnique, Palaiseau, France) under the supervision of Stéphanie Allassonnière.
Modèles statistiques et algorithmes stochastiques pour l’analyse de données longitudinales à dynamiques multiples et à valeurs sur des variétés riemanniennes.
Statistical models and stochastic algorithms for the analysis of longitudinal Riemannian manifold valued data with multiple dynamic.
J'ai soutenu ma thèse le 26 septembre 2019 devant le jury composé de :
I defended my thesis on September 26, 2019 in front of the jury composed of:
Mon manuscrit est disponible ici et les slides de ma présentation là.
My PhD dissertation is available here and the slides of my presentation there.
Travaux d'initiations à la recherche réalisés lors de ma scolarité à Orsay, tous compilés dans mon mémoire de magistère.
Bachelor's and master's degree dissertations carried out during my academic studies in Orsay (France), all compiled into one french pdf.
Je suis membre des groupes de recherche suivant :
I am a member of the following research groups:
Financé par l'Agence Nationale de la Recherche française, AAPG 2023. Débuté en octobre 2023, pour une durée de 42 mois.
Funded by the French National Research Agency. AAPG 2023. Started in October 2023, for a duration of 42 months.
Groupe de travail autour de la chaire ANITI « Trust and Responsibility in Artificial Intelligence »
Working group around the ANITI chair “Trust and Responsibility in Artificial Intelligence”
Financé par le programme NEEDS · Nucléaire : Energie, Environnement, Déchets, Société · porté par le CNRS.
Funded by the French National Research Agency. AAPG 2024.
Financé par l'Agence Nationale de la Recherche française, AAPG 2024.
Funded by the French National Research Agency. AAPG 2024.
Les documents ci-dessous sont relatifs à mon enseignement courant à l'INSA de Toulouse. Les documents fournis en archives ne sont plus maintenus.
The materials below are related to my current teaching at INSA Toulouse. The documents provided in the archives are no longer maintained.
Mentor au sein du réseau Mentor’IA porté par la commission mixité d’ANITI (Artificial and Natural Intelligence Toulouse Institute). Programme à déstination d'étudiantes de la licence au master leur proposant un accompagnement personnalisé afin de faciliter leur insertion dans les parcours et métiers de l’IA, .
Mentor within the Mentor’IA network, supported by the ANITI (Artificial and Natural Intelligence Toulouse Institute) diversity committee. This program offers a personalized accompaniment to female students from bachelor to master level in order to facilitate their integration in the AI field.
Participation à l'édition régionale, Université Paris-Saclay, du concours MT-180.
Entry into the regional edition, Paris-Saclay University, of the MT-180 competition.
Participation au lancement de l'opération « Votre région fait des maths » portée par la Fondation Mathématiques Jacques Hadamard et visant à promouvoir les initiatives de diffusions des mathématiques en région île de France sud auprès du grand public et des scolaires.
Participation in the launching of the operation “Your region does maths” carried by the Jacques Hadamard Mathematics Foundation and aiming to promote the diffusion of mathematics in the region of south Ile de France to the general public and to school children.
Trésorière de l'association PiDay et co-organisatrice de La tournée de π 2017, un spéctacle musical mathématique. La tournée 2017 est passée par les villes de Paris, Lyon et Marseille.
Treasurer of the PiDay association and co-organizer of The tour of π 2017, a mathematical musical show. The 2017 tour passed through the cities of Paris, Lyon, and Marseille (France).
L’association a reçu en 2016 le Prix d’Alembert de la Société de Mathématiques de France, récompensant les initiatives de diffusion mathématique auprès du grand public.
The association received in 2016 the D'Alembert prize from the French Mathematical Society, rewarding initiatives to spread mathematics to the general public.
« Speed-meetings » mathématiques entre des doctorant·e·s et le grand public organisés par la Fondation Sciences Mathématiques de Paris à l'Institut Henri Poincaré, dans le cadre de la Fête de la science 2017.
Mathematical “speed-meetings” between PhD students and the general public, organized by the Foundation Science Mathematics of Paris, in the context of the french “Fête de la science” (Science Day) 2017.
Mon CV détaillé en pdf : version française et anglaise.
My detailed résumé in a French and an English pdf-version.
Équipe Statistique et Optimisation, Institut de Mathématiques de Toulouse.
Département Génie Mathématiques et Modélisation, INSA Toulouse.
Statistics and Optimization team, Toulouse Institute of Mathematics, France.
Mathematics and Modeling Department, INSA Toulouse, France.
Département Génie Mathématiques et Modélisation · Bâtiment GMM, Bureau 122
Mathematics and Modeling Department · Building GMM, Office 122
Institut de Mathématiques de Toulouse · Bâtiment 1R1, Bureau 103
Toulouse Institute of Mathematics · Building 1R1, Office 103
INSA Toulouse · 135 avenue de Rangueil · 31077 Toulouse Cedex 04
Avec Pierre-Alexandre Mattei, Frédéric Precioso et Michel Riveill.
With Pierre-Alexandre Mattei, Frédéric Precioso and Michel Riveill
Équipe Maasai « Models and Algorithms for Artificial Intelligence », Inria Sophia Antipolis.
Laboratoire J.A. Dieudonné, Université Côte d'Azur, Nice.
Maasai team “Models and Algorithms for Artificial Intelligence”, Inria Sophia Antipolis, France.
J.A. Dieudonné Laboratory, Université Côte d'Azur, Nice, France.
Sous la direction de Stéphanie Allassonnière, École polytechnique, Palaiseau.
Under the supervision of Stéphanie Allassonnière, École polytechnique, Palaiseau, France.
Centre de Mathématiques Appliquées, École polytechnique, Palaiseau.
Center for Applied Mathematics, École polytechnique, Palaiseau, France.
Section 26 · Mathématiques appliquées
Section 26 · Applied Mathematics
Sous la direction de Stéphanie Allassonnière, École polytechnique, Palaiseau.
Under the supervision of Stéphanie Allassonnière, École polytechnique, Palaiseau, France.
Sujet : Modèles statistiques et algorithmes stochastiques pour l’analyse de données longitudinales à dynamiques multiples et à valeurs sur des variétés riemanniennes.
Mots-clés : Géométrie riemannienne, Données longitudinales, Optimisation stochastique, Modèles non-linéaires à effets-mixtes, Algorithmes de type EM, Analyse spatio-temporelle, Estimation bayésienne.
Subjet: Statistical models and stochastic algorithms for the analysis of longitudinal Riemannian manifold valued data with multiple dynamic.
Keywords: Riemannian geometry, Longitudinal data, Stochastic optimization, Non-linear mixed-effect models, EM-like algorithms, Spatio-temporal analysis, Bayesian estimation.
J'ai soutenu ma thèse le 26 septembre 2019 devant le jury composé de :
I defended my thesis on September 26, 2019 in front of the jury composed of:
Mon manuscrit de thèse est disponible ici et les slides de ma présentation là.
My PhD dissertation is available here and the slides of my presentation there.
Licence Mathématiques Fondamentales et Appliquées, Université Paris-Sud, Orsay ;
Master Mathématiques pour les Sciences du Vivant, Mention Très bien, Université Paris-Saclay, Orsay.
Bachelor's degree in Fundamental and Applied Mathematics, Paris-Sud University, Orsay, France ;
Master's degree in Mathematics for Life Sciences, with distinction, Paris-Saclay University, Orsay, France.
Mon mémoire de magistère est disponible ici.
My magistère's thesis is available here.
Option Calcul Scientifique ; Master Formation des Professeurs Agrégés de Mathématiques.
Option scientific calculation; Master's degree in mathematics teacher training.
iGEM :
Compétition internationale ingénierie génétique organisée par le MIT ;
Obtention de la médaille d’or pour l’équipe Paris-Saclay.
iGEM:
Worldwide synthetic biology competition that is supported by the MIT;
Getting the gold medal for the Paris-Saclay team.
Lycée Pierre Corneille, Rouen. Filière MP, Option informatique.
Pierre Corneille High School, Rouen. MP, Computer science curriculum.
Spéciatlité Mathématiques Appliquées du cycle ingénieur, 4ème année, INSA Toulouse.
Applied Mathematics major of the engineering cycle, 4th year, INSA Toulouse.
Spéciatlité Mathématiques Appliquées du cycle ingénieur, 4ème année, INSA Toulouse.
Applied Mathematics major of the engineering cycle, 4th year, INSA Toulouse.
Spéciatlité Mathématiques Appliquées du cycle ingénieur, 5ème année, INSA Toulouse.
Applied Mathematics major of the engineering cycle, 5th year, INSA Toulouse.
Formation par apprentissage ModIA « Modélisation et Intelligence Artificielle », 5ème année, ENSEEIHT & INSA Toulouse.
Apprenticeship program ModIA “Modeling and Artificial Intelligence”, 5th year, ENSEEIHT & INSA Toulouse.
Master Science des données et Intelligence artificielle, Université Côte d'Azur.
MSc Data Science and Artificial Intelligence, Côte d’Azur University.
Master Mathématiques Vision Apprentissage, École Normale Supérieure Paris-Saclay.
Master Mathématiques Vision Apprentissage, École Normale Supérieure Paris-Saclay.
MSc Data Science for Business, HEC Paris et École polytechnique.
MSc Data Science for Business, HEC Paris et École polytechnique.
Ingénieurs polytechniciens, 1ère année, Tronc commun, École polytechnique.
Polytechniciens engineers, 1st year, core curriculum, École polytechnique.
Lycée Turgot, Paris 3ème.
Turgot High School, Paris 3rd, France.
Lycée Lakanal, Bourg-la-Reine.
Lakanal High School, Bourg-la-Reine, France.
La place des femmes dans les sciences mathématiques est un sujet qui m’intéresse (et m'impacte) tout particulièrement. Je suis moi-même investie dans la promotion des STEM (science, technologie, ingénierie et mathématiques) auprès des jeunes-filles. Ci-dessous, quelques ressources en lien :
The place of women in the mathematical sciences is a subject that interests (and impacts) me in particular. I am involved in promoting STEM (science, technology, engineering, and mathematics) to young girls. Below are some linked (mostly in French) resources:
INSA Toulouse
Bureau GMM-122
Office GMM-122
135, Avenue de Rangueil
31077 Toulouse Cedex 4
juliette.chevallier (@) insa-toulouse.fr
Mon CV en version française et anglaise.