Soutenance de thèse : Chiheb Daaloul
Début
Le 06 décembre 2024 à 13h30Fin
Le 06 décembre 2024 à 15h30Lieu
AMU Fruman - Salle de séminaires, bâtiment 7Monsieur Chiheb Daaloul est autorisé à présenter ses travaux en vue de l'obtention du diplôme national de Doctorat délivré par Centrale Méditerranée.
Titre : Descente de gradient dans l'espace de wasserstein pour l'échantillonnage: théorie et algorithmes
École doctorale : ED 184 - Mathématiques et Informatique de Marseille
Spécialité : Mathématiques
Lieu : Salle de séminaires de la Frumam, Université Aix-Marseille Frumam, bâtiment 7, 3 Pl. Victor Hugo13003 Marseille
Rapporteurs
- Monsieur Nicolas Courty, Université Bretagne Sud
- Monsieur Alain Durmus, CMAP, École polytechnique
Membres du jury
- Monsieur Thibaut Le Gouic, Centrale Méditerranée (Directeur de thèse)
- Madame Magali Tournus, Centrale Méditerranée (Co-encadrante de thèse)
- Monsieur Adil Ahidar-Coutrix, École Centrale Casablanca (Co-directeur de thèse)
- Monsieur Pierre Pudlo, Aix-Marseille Université (Président)
- Monsieur Arnaud Guillin, Université Clermont-Auvergne
- Monsieur Romain Hug, Aix-Marseille Université
Résumé
L’échantillonnage est un outil très utilisé en statistiques (méthodes bayésiennes, apprentissage statistiques) qui permet de représenter faiblement une mesure de probabilité via une intégration contre une classe de fonctions régulières. L’algorithme de Langevin est une méthode populaire qui fournit un échantillon approximativement distribué selon une mesure de probabilité définie sur R^d . Dans la première partie de cette thèse, nous obtenons des résultats concernant la convergence d’une généralisation de l’algorithme de Langevin aux mesures définies sur un sous-ensemble convexe possiblement borné de R^d , et dans le cas où la mesure n’est pas nécessairement (relativement) log-concave. Nous justifions rigoureusement la convergence de cet algorithme sous des hypothèses raisonnables.
L’analyse présentée dans cette partie s’inscrit dans l’interprétation de l’échantillonnage comme un problème d’optimisation dans l’espace de Wasserstein. Calculer une moyenne est une opération basique permettant de réduire un ensemble complexe de données à un élément représentatif interprétable. Dans l’espace de Wasserstein, M. Agueh et G. Carlier ont défini le barycentre comme la moyenne de Fréchet, qui a reçu une attention grandissante de la part de communautés au sein et en-dehors des mathématiques. Ceci tient en partie à ce que le barycentre de Wasserstein fournit un représentant plus interprétable que d’autres notions de moyennes dans certaines situation (par exemple,en traitement d’images).
Dans la deuxième partie de cette thèse, nous proposons une méthode basée sur une descente de gradient dans l’espace des couplages de Wasserstein pour échantillonner le barycentre de mesures à densité définies sur R^d . Notre méthode consiste en une relaxation de la formulation multimarginale du barycentre, où la contrainte de couplage est remplacée par une pénalité.
Mots-clés : Barycentre de Wasserstein, Transport optimal, Échantillonnage, Flot de gradient, Optimisation,Algorithmes.
Sampling is a widely used tool in statistics (Bayesian methods, statistical learning) that allows for a weak representation of a probability measure through integration against a class of regular functions. The Langevin algorithm is a popular method that provides a sample approximately distributed according to aprobability measure defined on R^d .
In the first part of this thesis, we obtain results regarding the convergence of a generalization of the Langevin algorithm to measures defined on a possibly bounded convex subset of R^d , where the measure is not necessarily (relatively) log-concave. We rigorously justify the convergence of this algorithm under reasonable assumptions. The analysis presented in this section is framed within the interpretation of sampling as an optimization problem in the Wasserstein space.
Keywords: Wasserstein barycenter, Optimal transport, Sampling, Gradient flow, Optimization, Algorithms.