Data Challenges
Partie intégrante de l'Institut DATAIA, les projets de data challenges sont multidisciplinaires ; ils nécessitent des recherches sur les méthodologies analytiques (statistiques, processus d'apprentissage automatique, extraction de connaissances, visualisation de données), ainsi que sur la conception de logiciels. En d'autres termes, ces projets consistent à développer des méthodes et des outils pour pouvoir analyser de grandes quantités de données et en extraire des informations utiles pour la physique, la biologie, la médecine, la chimie, les sciences de l'environnement et les sciences humaines, à destination des étudiant(e)s et chercheur(se)s de l'Université Paris-Saclay.
■ Rapid Analytics and Model Prototyping (RAMP)
RAMP est un logiciel de prototypage de modèle polyvalent permettant de connecter, à l'Université Paris-Saclay, la science des données aux sciences du domaine, ce qui est la mission principale du CDS au sein de l'Institut DATAIA. Au début de tout data challenge, le fournisseur de données arrive avec un problème de prédiction et un ensemble de données correspondant. Un data scientist expérimenté nettoie et sélectionne les données, formalise le problème et déploie le challenge à l'aide du logiciel RAMP. Lorsque le problème de science des données nécessite la maîtrise d'un outil spécifique, l'événement RAMP peut être précédé d'un Training Sprint. Une partie du Training Sprint peut également être consacrée à l'introduction du problème de science du domaine, sinon cette introduction a lieu au début du RAMP.
La particularité de RAMP est que les participants au challenge ne soumettent pas uniquement un vecteur de prédiction, mais le code de leur modèle, qui est entraîné et évalué sur notre infrastructure et sur des données privées. Les solutions sont alors classées selon la métrique choisie pour chaque problème. Les scientifiques peuvent, au terme du défi, récupérer les codes proposés.
Consultez l'article sur nos précédents challenges organisés !
Nous sommes toujours à la recherche de chercheur(se)s avec lesquels travailler sur de nouveaux défis liés aux données.
Si vous êtes intéressé(e) par une collaboration sur un problème de traitement de données dans le cadre de votre recherche ou si vous avez
des questions ou des commentaires, veuillez nous contacter notre ingénieur à l'adresse : francois.caud@inria.fr.