Catégorie
Le Séminaire Palaisien
Date de tri

SÉMINAIRE | Le Palaisien

Bandeau image
Séminaire Le Palaisien

SÉMINAIRE | Le Palaisien

  • 12h-12h40 - Valentin DE BORTOLI - Une introduction à la modélisation générative basée sur le score et aux ponts de Schrodinger
  • 12h40-13h20 - Yann ISSARTEL - Sériation et localisation 1D dans les modèles d'espace latent

Partager

twlkfbml
Lieu de l'événement
ENSAE - Salle 1004
Date de l'événement (intitulé)
5 juillet 2022 - A partir de 12h
Chapo
Le séminaire Palaisien réunit, chaque premier mardi du mois, la vaste communauté de recherche de Saclay autour de la statistique et de l'apprentissage machine.
Contenu
Corps de texte

Rendez-vous le 5 juillet 2022 à 12h à ENSAE, salle 1004, pour le Séminaire Palaisien !

Animé par Valentin DE BORTOLI, qui présentera un exposé sur le thème "Une introduction à la modélisation générative basée sur le score et aux ponts de Schrodinger" et Yann ISSARTEL, sur le thème "Sération et localisation 1D dans les modèles d'espace latent".

Inscriptions gratuites mais obligatoires, dans la limite des places disponibles. Un panier sandwich est offert.

En savoir plus

Ancre
12h-12h40 - Valentin DE BORTOLI - Une introduction à la modélisation générative basée sur le score et aux ponts de Schrodinger
Corps de texte

La modélisation générative basée sur le score (SGM) est une approche récente de la modélisation générative probabiliste qui présente des performances de pointe dans plusieurs tâches de synthèse audio et image. Les SGMs existants se composent généralement de deux parties. Tout d'abord, du bruit est ajouté de manière incrémentielle aux données afin d'obtenir une distribution de données perturbée se rapprochant d'une distribution antérieure facile à échantillonner, par exemple gaussienne. Deuxièmement, un réseau neuronal est utilisé pour apprendre la dynamique de débruitage en temps inverse, qui, lorsqu'elle est initialisée à cette distribution préalable, définit un modèle génératif. Song et al. (2021) ont montré que l'on pouvait considérer le processus de débruitage comme une équation différentielle stochastique (EDS) qui perturbe progressivement la distribution initiale des données pour la transformer en une distribution approximativement gaussienne. Dans cet exposé, nous introduirons les bases de l'EDS et présenterons certains liens avec le contrôle stochastique par le biais du concept des ponts de Schrodinger.

En savoir plus
Ancre
12h40-13h20 - Yann ISSARTEL - Sériation et localisation 1D dans les modèles d'espace latent
Corps de texte

Motivés par des applications en archéologie pour la datation relative d'objets, ou en tomographie 2D pour la synchronisation angulaire, nous considérons le problème de la sériation statistique où l'on cherche à réordonner une matrice désordonnée et bruyante d'affinités par paires. Ce problème peut être reformulé dans la puissante terminologie des espaces latents, où l'affinité entre une paire d'éléments est modélisée comme une observation bruyante d'une fonction f(x_i,x_j) des positions latentes x_i, x_j des deux éléments sur un espace unidimensionnel. Cette reformulation conduit naturellement au problème de l'estimation des positions dans l'espace latent. Sous des hypothèses non-paramétriques sur la fonction d'affinité f, nous introduisons une procédure qui localise de manière prouvée toutes les positions latentes avec une erreur maximale de l'ordre de la racine carrée de log(n)/n. On prouve que ce taux est optimal minimax. Des procédures efficaces en termes de calcul sont également analysées, sous certaines hypothèses plus restrictives. Nos résultats généraux peuvent être instanciés au problème original de la sériation statistique, ce qui conduit à de nouvelles limites pour l'erreur maximale dans l'ordonnancement.

En savoir plus